今日arXiv最热NLP大模型论文：GPT-4理解武林外传中的含蓄表述，达人类水平

AIGC动态2年前 (2024)发布夕小瑶科技说

AIGC动态欢迎阅读

原标题：今日arXiv最热NLP大模型论文：GPT-4理解武林外传中的含蓄表述，达人类水平
关键字：模型,解读,准则,中文,任务
文章来源：夕小瑶科技说
内容字数：7624字

内容摘要：

夕小瑶科技说原创作者 | 谢年年在人际交谈中，特别是在使用中文这样博大精深的语言时，人们往往不会直接回答问题，而是采用含蓄、隐晦或间接的表达方式。
人类根据以往的经验或是对说话者的了解可以对一些言外之意做出准确的判断，比如我们小时候经历过无数次的对话情景：
“妈妈，我的书放哪啦？”
“在我手上，来拿嘛！”
又或是：
“妈妈，今天我想吃红烧肉可以吗？”
“你看我像不像红烧肉。”
面对妈妈给出的看似回答了又什么都没有说的回应，我们能迅速get到妈妈不想搭理我们的心情。那LLMs在面对类似的会话隐喻（conversational implicature）时能理解到说话人真正的含义吗？
上交最近从经典情景喜剧《武林外传》中提取出首个针对会话隐喻的中文多轮对话数据集，挑选出200个精心设计的符合会话隐喻的问题，并对八个LLMs进行了多项选择题任务和隐喻解释两项任务的测试。结果显示会话隐喻这一任务对LLMs来说仍然充满挑战。
论文标题：Do Large Language Models Understand Conversational Implicature –
A case study wit

原文链接：今日arXiv最热NLP大模型论文：GPT-4理解武林外传中的含蓄表述，达人类水平

联系作者

文章来源：夕小瑶科技说
作者微信：xixiaoyaoQAQ
作者简介：专业、有趣、深度价值导向的科技媒体。聚集30万AI工程师、研究员，覆盖500多家海内外机构投资人，互联网大厂中高管和AI公司创始人。一线作者来自清北、国内外顶级AI实验室和大厂，兼备敏锐的行业嗅觉和洞察深度。商务合作：zym5189

阅读原文