标签:问题

LLM准确率飙升27%!谷歌DeepMind提出全新「后退一步」提示技术

新智元报道编辑:拉燕【新智元导读】谷歌DeepMind全新提示技术「Step-Back Prompting」,让LLM性能拉满!前段时间,谷歌DeepMind提出了一种全新的「Step-Back...
阅读原文

对话360集团梁志辉:360是如何做大模型的?|甲子光年

1个千亿的大模型+N个百亿小模型的部署方式或许是最优路线。作者|苏霍伊‍‍‍编辑|赵健‍‍‍明天,是 ChatGPT 问世一周年的日子。过去的一年时间已证明,AI 大模...
阅读原文

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

西风 发自 凹非寺量子位 | 公众号 QbitAIGPT-4再次遭网友“群攻”,原因是“懒”得离谱!有网友想在Android系统开发一个能够与OpenAI API实时交互的应用。于是把...
阅读原文

Keras 3.0正式发布:可用于TensorFlow、JAX和PyTorch

机器之心报道编辑:陈萍经过 5 个月的更新迭代,Keras 3.0 终于来了。「大新闻:我们刚刚发布了 Keras 3.0 版本!」Keras 之父 François Chollet 在 X 上激动...
阅读原文

国际数学家大会丨鄂维南院士作一小时大会报告:从数学角度,理解机器学习的“黑魔法”,并应用于更广泛的科学问题

来源:大数据分析与应用国家工程实验室北京时间2022年7月8日晚上22:30,鄂维南院士在2022年的国际数学家大会上作一小时大会报告(plenary talk)。今天我们带来...
阅读原文

埃隆·马斯克 (Elon Musk) 的大脑植入公司 Neuralink融资3亿美元

点击上方蓝字关注我们“ Neuralink最近成功筹资4300万美元,但面临道德争议和SEC审查,公司估值50亿美元,同时被指责存在虐待动物和内部文化问题。Neuralink再...
阅读原文

田渊栋给OpenAI神秘Q*项目泼冷水:合成数据不是AGI救星,能力仅限简单数学题

新智元报道编辑:编辑部【新智元导读】大佬们关于Q猜想的讨论仍在继续,今天,AI大牛田渊栋公开表示,Q*只能解决入门级数学题,AGI也大概率无法通过合成数据...
阅读原文

大模型没有自我改进能力?苏黎世理工联合Meta AI提出小模型架构,显著提升大模型表现

夕小瑶科技说 原创作者 | 谢年年、python前段时间,多位大佬发文指出大模型没有自我改进的能力,甚至自我改进之后,回答质量还会明显下降。自我改进之所以不...
阅读原文

从 CoT 到 Agent,最全综述来了!上交出品

夕小瑶科技说 原创作者 | 小戏、Python就在前两天,我们刚刚和大家聊了聊最近相当火爆的 AI Agents 这一概念:。水平所限,我们也只是浅浅为大家梳理了一下 A...
阅读原文

Hinton和LeCun再交锋,激辩LLM能否引发智能奇点!LeCun:人类理解能力碾压GPT-4

新智元报道编辑:桃子 润【新智元导读】大模型能否理解自己所说,Hinton和LeCun再次吵起来了。LeCun新论文证明,GPT-4回答问题准确率仅为15%,自回归模型不及...
阅读原文

全网大讨论:引爆OpenAI全员乱斗的Q*到底是什么?

机器之心报道编辑:泽南、小舟强大到能威胁人类,所以不得不把自家 CEO 开了?本周三,OpenAI 的「宫斗」随着山姆・奥特曼回归 CEO 大位而告于段落,不过此次...
阅读原文

人类考92分的题,GPT-4只能考15分:测试一升级,大模型全都现原形了

机器之心报道编辑:张倩、泽南AutoGPT 的得分也凉凉。GPT-4 自诞生以来一直是位「优等生」,在各种考试(基准)中都能得高分。但现在,它在一份新的测试中只...
阅读原文

新王加冕,GPT-4V 屠榜视觉问答

夕小瑶科技说 原创作者 | 智商掉了一地、Python当前,多模态大型模型(Multi-modal Large Language Model, MLLM)在视觉问答(VQA)领域展现了卓越的能力。然...
阅读原文

是全部重做还是融合改造?揭秘京东云言犀升级全过程

作者 | Tina 采访嘉宾 | 京东云言犀团队 ChatGPT 到来后,NLP(自然语言处理)这一行就有了一个梗儿:“一夜醒来,专业没了。”NLP 是人工智能的一个子领域,指...
阅读原文

大模型多跳推理有解啦,北大化繁为简,用30B模型击败百亿模型

夕小瑶科技说 原创作者 | 谢年年、python我们日常生活中的许多问题都是复杂的多跳问题。比如“《坚如磐石》中饰演黎志田的演员在《三体》中饰演什么角色?”要...
阅读原文
1262728293035