标签:问题

大模型没有自我改进能力?苏黎世理工联合Meta AI提出小模型架构,显著提升大模型表现

夕小瑶科技说 原创作者 | 谢年年、python前段时间,多位大佬发文指出大模型没有自我改进的能力,甚至自我改进之后,回答质量还会明显下降。自我改进之所以不...
阅读原文

从 CoT 到 Agent,最全综述来了!上交出品

夕小瑶科技说 原创作者 | 小戏、Python就在前两天,我们刚刚和大家聊了聊最近相当火爆的 AI Agents 这一概念:。水平所限,我们也只是浅浅为大家梳理了一下 A...
阅读原文

Hinton和LeCun再交锋,激辩LLM能否引发智能奇点!LeCun:人类理解能力碾压GPT-4

新智元报道编辑:桃子 润【新智元导读】大模型能否理解自己所说,Hinton和LeCun再次吵起来了。LeCun新论文证明,GPT-4回答问题准确率仅为15%,自回归模型不及...
阅读原文

全网大讨论:引爆OpenAI全员乱斗的Q*到底是什么?

机器之心报道编辑:泽南、小舟强大到能威胁人类,所以不得不把自家 CEO 开了?本周三,OpenAI 的「宫斗」随着山姆・奥特曼回归 CEO 大位而告于段落,不过此次...
阅读原文

人类考92分的题,GPT-4只能考15分:测试一升级,大模型全都现原形了

机器之心报道编辑:张倩、泽南AutoGPT 的得分也凉凉。GPT-4 自诞生以来一直是位「优等生」,在各种考试(基准)中都能得高分。但现在,它在一份新的测试中只...
阅读原文

新王加冕,GPT-4V 屠榜视觉问答

夕小瑶科技说 原创作者 | 智商掉了一地、Python当前,多模态大型模型(Multi-modal Large Language Model, MLLM)在视觉问答(VQA)领域展现了卓越的能力。然...
阅读原文

是全部重做还是融合改造?揭秘京东云言犀升级全过程

作者 | Tina 采访嘉宾 | 京东云言犀团队 ChatGPT 到来后,NLP(自然语言处理)这一行就有了一个梗儿:“一夜醒来,专业没了。”NLP 是人工智能的一个子领域,指...
阅读原文

大模型多跳推理有解啦,北大化繁为简,用30B模型击败百亿模型

夕小瑶科技说 原创作者 | 谢年年、python我们日常生活中的许多问题都是复杂的多跳问题。比如“《坚如磐石》中饰演黎志田的演员在《三体》中饰演什么角色?”要...
阅读原文

谷歌为什么输给了OpenAI?科技公司创始人兼谷歌前员工带你一探究竟

新智元报道编辑:alan【新智元导读】在AI革命的浪潮中,谷歌为什么失去了领先地位?最近,NVIDIA科学家Jim Fan转发了Socratic公司创始人的一篇博客,为我们提...
阅读原文

企业要做大模型落地?建议进来看看这个榜单

夕小瑶科技说 原创作者 | 卖萌酱机器幻觉问题,可能是未来相当长一段时间内悬浮在大模型领域上方的两片乌云之一。遥记半年前,LeCun 就曾断言:“单纯根据概率...
阅读原文

恕我直言,大模型对齐可能无法解决安全问题,我们都被表象误导了

夕小瑶科技说 原创作者 | 智商掉了一地、Python是否听说过“伪对齐”这一概念?在大型语言模型(LLM)的评估中,研究者发现了一个引人注目的现象:当面对多项选...
阅读原文

普林斯顿开源34B数学大模型:性能媲美谷歌Minerva,参数少一半!550亿token专业数据训练

新智元报道编辑:青荻 润【新智元导读】在数学领域,一个全新的时代即将到来。LLEMMA,一个强大的数学专用语言模型,正在带来革命性的性能、数据集和解决方案...
阅读原文

Bard 首发失利、Gemini AI 推迟发布,谷歌的大模型之路为何如此坎坷?

11 月 16 日,来自 The Information 的独家消息,谷歌决定推迟发布 Gemini AI——这是旨在与 OpenAI 竞争的大模型产品。自 3 月份 Bard 发布以来,谷歌的 LLM ...
阅读原文

比ChatGPT早发两周,被喷下线的Galactica成了LeCun最大的意难平

机器之心报道编辑:小舟、大盘鸡今天我们提到大型语言模型(LLM),第一个想到的就是 OpenAI 的 ChatGPT。一年来,ChatGPT 因其强大的性能,广泛的应用前景而...
阅读原文

被谷歌收购后,我终于知道为什么大模型竞争落后于OpenAI了

转载自机器之能编辑:sia俨然一部豪门生存指南。2018 年 3 月,一家科技教育初创 Socratic 被谷歌收购。当时这家仅 10 人的小公司打造了一款家庭作业助手(也...
阅读原文
1272829303136