标签:问题
大模型多跳推理有解啦,北大化繁为简,用30B模型击败百亿模型
夕小瑶科技说 原创作者 | 谢年年、python我们日常生活中的许多问题都是复杂的多跳问题。比如“《坚如磐石》中饰演黎志田的演员在《三体》中饰演什么角色?”要...
谷歌为什么输给了OpenAI?科技公司创始人兼谷歌前员工带你一探究竟
新智元报道编辑:alan【新智元导读】在AI革命的浪潮中,谷歌为什么失去了领先地位?最近,NVIDIA科学家Jim Fan转发了Socratic公司创始人的一篇博客,为我们提...
恕我直言,大模型对齐可能无法解决安全问题,我们都被表象误导了
夕小瑶科技说 原创作者 | 智商掉了一地、Python是否听说过“伪对齐”这一概念?在大型语言模型(LLM)的评估中,研究者发现了一个引人注目的现象:当面对多项选...
企业要做大模型落地?建议进来看看这个榜单
夕小瑶科技说 原创作者 | 卖萌酱机器幻觉问题,可能是未来相当长一段时间内悬浮在大模型领域上方的两片乌云之一。遥记半年前,LeCun 就曾断言:“单纯根据概率...
普林斯顿开源34B数学大模型:性能媲美谷歌Minerva,参数少一半!550亿token专业数据训练
新智元报道编辑:青荻 润【新智元导读】在数学领域,一个全新的时代即将到来。LLEMMA,一个强大的数学专用语言模型,正在带来革命性的性能、数据集和解决方案...
Bard 首发失利、Gemini AI 推迟发布,谷歌的大模型之路为何如此坎坷?
11 月 16 日,来自 The Information 的独家消息,谷歌决定推迟发布 Gemini AI——这是旨在与 OpenAI 竞争的大模型产品。自 3 月份 Bard 发布以来,谷歌的 LLM ...
比ChatGPT早发两周,被喷下线的Galactica成了LeCun最大的意难平
机器之心报道编辑:小舟、大盘鸡今天我们提到大型语言模型(LLM),第一个想到的就是 OpenAI 的 ChatGPT。一年来,ChatGPT 因其强大的性能,广泛的应用前景而...
被谷歌收购后,我终于知道为什么大模型竞争落后于OpenAI了
转载自机器之能编辑:sia俨然一部豪门生存指南。2018 年 3 月,一家科技教育初创 Socratic 被谷歌收购。当时这家仅 10 人的小公司打造了一款家庭作业助手(也...
GPT-4作弊被抓!吉娃娃or松饼打乱顺序就出错,LeCun:警惕在训练集上测试
梦晨 发自 凹非寺量子位 | 公众号 QbitAIGPT-4解决网络名梗“吉娃娃or蓝莓松饼”,一度惊艳无数人。然鹅,现在它被指出“作弊”了!全用原题中出现的图,只是打乱...
GPT-4V数学推理如何?微软发布MathVista基准,评测报告长达112页
机器之心专栏机器之心编辑部大型多模态模型会做数学题吗?在微软最新发布的 MathVista 基准上,即使是当前最强的GPT-4V 也会有「挫败感」。微软最近发布了名...
马斯克怒了,发帖挑衅ChatGPT,竟是奥特曼创建Grok同名的GPT?
夕小瑶科技说 原创作者 | 王二狗大家好,我是二狗。今天起猛了,早上刷推特,你们猜我看到了什么?诶你🐎,真是亮瞎了我的24k钛合金狗眼!马斯克你是真狗啊!...
GPT-4比你更会问问题:让大模型自主复述,打破与人类对话的壁垒
机器之心专栏机器之心编辑部在最新的人工智能领域动态中,人工生成的提示(prompt)质量对大语言模型(LLM)的响应精度有着决定性影响。OpenAI 提出的建议指...
爆火大模型解谜游戏作者自述:公开不到一天用户破万,用游戏探索模型的秘密
过去一周,一款大模型解谜小游戏在大模型从业者圈子里广泛传播。《完蛋!我被 LLM 包围了》游戏公开不到 24 小时,用户指数级增长突破一万,作者随即关停了游...
“我不懂的、总有人懂”,软件开发行业已经开始扭曲变形
作者|unixsheikh译者|核子可乐策划|冬梅如今,一批所谓的专家只知道无脑上马那些炒作工具,但对其更深层次的运作方式却一无所知。这是个大问题,甚至正在...
清华大学刘知远:大模型LLM领域,有哪些可以作为学术研究方向?
来源:图灵人工智能作者:刘知远,清华大学计算机系自然语言处理实验室副教授2022年初我做过一个报告题目是《大模型十问》,分享我们认为大模型值得探索的十...