标签:幻觉

北大发现了一种特殊类型的注意力头!

夕小瑶科技说 原创作者 | 任同学检索头的发现或许将有力地帮助大模型领域在提高长上下文推理能力、减少幻觉和压缩KV缓存方面的研究。 从 Claude100K 到 Gemin...
阅读原文

中科大发布Agent-FLAN,微调提升Agent能力

夕小瑶科技说 原创作者 | 松果 引言:探索大型语言模型作为智能代理的挑战与机遇随着大语言模型(LLMs)在各种自然语言处理任务中取得巨大成功,将这些模型作...
阅读原文

《大模型决策制定中的幻觉检测》综述

来源:专知 自主系统很快将无处不在,从制造业自主性到农业领域的机器人,再从医疗保健助手到娱乐产业。这些系统的大多数都是用于决策、规划和控制的模块化子...
阅读原文

今日arXiv最热NLP大模型论文:华东师大发布对话级大模型幻觉评价基准DiaHalu

夕小瑶科技说 原创作者 | Tscom随着人工智能领域的快速发展,大语言模型(LLMs)在自然语言处理(NLP)的多个领域取得了显著的成功。这些模型通过自然语言生...
阅读原文

老黄再曝惊人语录:LLM幻觉有解,AGI五年内必来!

新智元报道编辑:编辑部 【新智元导读】AGI竞赛,正在大科技公司之间紧锣密鼓地展开,作为万亿显卡帝国掌舵人的老黄自然也不会缺席。在最近举办的GTC 2024上...
阅读原文

“幻觉”问题根本无解!为什么我们的大模型会“说胡话”?

来源:CSDN 整理:王启隆 “幻觉”(Hallucination),现在已经是大语言模型领域无人不知、无人不晓的热词。我们在和 ChatGPT 等聊天机器人对话的时候,有时会...
阅读原文

逼迫大模型消除幻觉,就像杨永信电击治疗网瘾少年

夕小瑶科技说 原创作者 | 智商掉了一地在科技高速发展的领域,进步往往伴随着争议。数字化时代,我们被海量信息所环绕,利用大模型来提取信息和生成答案,有...
阅读原文

今日Arxiv最热NLP大模型论文:浙江大学发布统一的幻觉检测框架UNIHD

夕小瑶科技说 原创作者 | 芒果、Python引言:多模态大语言模型的幻觉问题及其重要性在人工智能领域,多模态大语言模型(MLLMs)已经取得了显著的进步,它们在...
阅读原文

大语言模型为什么始终会产生幻觉?

夕小瑶科技说 原创编辑 | 谢年年随着LLMs的广泛应用,幻觉问题引起了越来越多的安全和道德关注,各种各样的幻觉缓解方法也层出不穷,比如各类知识增强方法、...
阅读原文

今日arXiv最热NLP大模型论文:大语言模型为什么始终会产生幻觉

夕小瑶科技说 原创作者 | 谢年年、python随着LLMs的广泛应用,幻觉问题引起了越来越多的安全和道德关注,各种各样的幻觉缓解方法也层出不穷,比如各类知识增...
阅读原文

准确率不足20%,GPT-4V/Gemini竟看不懂漫画!首个图像序列基准测试开源

新智元报道编辑:LRS 【新智元导读】马里兰大学联合北卡教堂山发布首个专为多模态大语言模型(MLLM)设计的图像序列的基准测试Mementos,涵盖了真实世界图像...
阅读原文

今日ArXiv最骚NLP论文:欺骗大模型却能大幅提升效果的骚操作

夕小瑶科技说 原创作者 |谢年年、python在大模型的提示工程中,少样本提示,思维链提示(CoT)都是行之有效的方法,通过为大模型提供几个样例,为模型提供更...
阅读原文

大语言模型的32种消除幻觉的技术,你都了解吗?

夕小瑶科技说 原创作者 | 谢年年、python大模型幻觉问题是计算机语言学中一个重要的研究方向。为减轻幻觉,研究人员提出了多种策略,比如反馈机制、外部信息...
阅读原文

维基百科+大模型打败幻觉!斯坦福WikiChat性能碾压GPT-4,准确率高达97.3%

新智元报道编辑:alan 桃子 【新智元导读】大模型固有的幻觉问题严重影响了LLM的表现。斯坦福最新研究利用维基百科数据训练大模型,得到的WikiChat成为首个几...
阅读原文

大模型幻觉问题无解?理论证明校准的LM必然会出现幻觉

机器之心报道 编辑:Panda W理论证明!校准的语言模型必然出现幻觉。大型语言模型(LLM)虽然在诸多下游任务上展现出卓越的能力,但其实际应用还存在一些问题...
阅读原文