标签:事实性

OpenAI华人女科学家万字详解大模型「外在幻觉」

夕小瑶科技说 分享来源 | 量子位 大模型幻觉还分内在、外在了—— OpenAI华人科学家翁荔最新Blog,提出LLM外在幻觉(extrinsic hallucination)。 有别于代指模...
阅读原文

OpenAI Lilian Weng万字长文解读LLM幻觉:从理解到克服

机器之心报道 编辑:Panda WLilian Weng 出品,必是精品。人会有幻觉,大型语言模型也会有幻觉。近日,OpenAI 安全系统团队负责人 Lilian Weng 更新了博客,...
阅读原文

比人类便宜20倍!谷歌DeepMind推出「超人」AI系统

新智元报道编辑:alan 【新智元导读】大模型的幻觉问题怎么解?谷歌DeepMind:用AI来做同行评审!事实核验正确率超过人类,而且便宜20倍。AI的同行评审来了!...
阅读原文

DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源

机器之心报道 编辑:杜伟DeepMind 这篇论文一出,人类标注者的饭碗也要被砸了吗? 大模型的幻觉终于要终结了? 今日,社媒平台 reddit 上的一则帖子引起网友...
阅读原文

今日arXiv最热NLP大模型论文:华东师大发布对话级大模型幻觉评价基准DiaHalu

夕小瑶科技说 原创作者 | Tscom随着人工智能领域的快速发展,大语言模型(LLMs)在自然语言处理(NLP)的多个领域取得了显著的成功。这些模型通过自然语言生...
阅读原文

仅需格式转换提升9%数学推理能力,上交开源新对齐方法ReAlign

Pengfei 投稿量子位 | 公众号 QbitAI大模型对齐新方法,让数学推理能力直接提升9%。 上海交通大学生成式人工智能实验室(GAIR Lab)新成果ReAlign,现已开源...
阅读原文

维基百科+大模型打败幻觉!斯坦福WikiChat性能碾压GPT-4,准确率高达97.3%

新智元报道编辑:alan 桃子 【新智元导读】大模型固有的幻觉问题严重影响了LLM的表现。斯坦福最新研究利用维基百科数据训练大模型,得到的WikiChat成为首个几...
阅读原文

上海新基建行动方案发布;传OpenAI寻求860亿美元估值;杨立昆反对过早监管AI丨AIGC大事日报

10/19全球AIGC产业要闻1、传OpenAI洽谈以860亿美元估值出售员工股份2、OpenAI CEO:没兴趣参与智能手机竞争3、OpenAI正研AI图像检测工具 准确率达99%4、Meta...
阅读原文

大模型总弄错「事实」怎么办?这有一份汇聚了300多篇文献的综述

机器之心发布机器之心编辑部这篇文章对大模型的事实性进行了详细的梳理和总结。大模型在掌握事实性知识上展现出巨大的能力和潜力,但是其仍然存在一些问题,...
阅读原文

最新AI热点论文(10/9-10/15)

图|匡萃彪文|匡萃彪最新人工智能论文(10/9-10/15):- 环形注意力- 通用模拟器- LLMs中事实性的概述- LLMs 能学规则- LLM的元思维链提示- 医疗保健LLM调查...
阅读原文