GPT-4完成正确率仅6%！北大等提出首个「多轮、多模态」PPT任务完成基准PPTC

AIGC动态3年前 (2023)发布新智元

AIGC动态欢迎阅读

原标题：GPT-4完成正确率仅6%！北大等提出首个「多轮、多模态」PPT任务完成基准PPTC

文章来源：新智元

内容字数：9968字

内容摘要：新智元报道编辑：LRS【新智元导读】为了填补LLM在复杂多模态环境中利用复杂工具完成多轮、多模态指令的评估空白，研究人员引入了PowerPoint任务完成（PPTC）基准测试，以评估LLM创建和编辑PPT文档的能力。最近对大型语言模型（例如ChatGPT和GPT-4）进行的评估工作主要侧重于在基本自然语言任务上的能力，以及模型生成用于解决单句用户指令的API的工具使用能力，却忽略了在理解复杂多模态…

原文链接：点此阅读原文：GPT-4完成正确率仅6%！北大等提出首个「多轮、多模态」PPT任务完成基准PPTC