标签:模型

速度暴涨1000倍!扩散模型预测材料“炼金”过程,体系越复杂加速度越大丨MIT&康奈尔

萧箫 发自 凹非寺量子位 | 公众号 QbitAI用扩散模型预测化学反应,速度直接暴涨1000倍!原本需要用计算机硬算几小时甚至一天,现在单个GPU用6秒钟就能搞定。...
阅读原文

GPT-4V都搞不明白的未来推理有解法了!来自华科大&上科大

于恩 投稿量子位 | 公众号 QbitAI多模态大语言模型展现了强大的图像理解和推理能力。但要让它们基于当前观测来对未来事件进行预测推理仍然非常困难。即便是当...
阅读原文

论文遭首届ICLR拒稿、代码被过度优化,word2vec作者Tomas Mikolov分享背后的故事

机器之心报道编辑:杜伟、大盘鸡除了表达自己获得 NeurIPS 2023 时间检验奖的感想之外,Tomas Mikolo 还对 NLP 和 ChatGPT 的现状给出了自己的一些思考。几天...
阅读原文

走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理

机器之心报道编辑:Panda W最近,有人在社交媒体上发布了一张有关 GPT4.5 更新的截图。图中内容显示,和 GPT 系列之前推出的模型相比,GPT4.5 最大的惊喜可能...
阅读原文

源代码is all you need!7B代码小模型同尺寸无敌,性能媲美ChatGPT和谷歌Gemini

机器之心报道编辑:Rome Rome软件开发人员对代码生成 AI 已经不陌生,它们已经成为提高生产力的利器。本文中,伊利诺伊大学香槟分校(UIUC)张令明老师团队带...
阅读原文

Mistral携微软引爆「小语言模型」潮!Mistral中杯代码能力完胜GPT-4,成本暴降2/3

新智元报道编辑:Aeneas【新智元导读】小模型的风潮,最近愈来愈盛,Mistral和微软分别有所动作。而网友实测发现,Mistral-medium的代码能力竟然完胜了GPT-4...
阅读原文

UC伯克利发现GPT-4惊人缺陷:儿童从经验中学习因果,LLM却不行

新智元报道编辑:拉燕【新智元导读】最近,UC伯克利的一项研究揭示了LLM和小孩子们在认知上的一项重要差别——创造新的因果结构的能力。大家有没有想过一个问题...
阅读原文

王小川创业 8 个月:大模型还没到谈 PMF 的时候

这是王小川创业做大模型的第 8 个月。很多过去行业的常识、惯性的做法,都不再适用当下的大模型时代,王小川认为,当前很多大模型的应用,并没有真正扣应用户...
阅读原文

Ilya带头OpenAI超级对齐首篇论文《弱到强的泛化:在弱监督下获得强能力》,AI对齐AI取得实证结果

来源:转载机器之心报道编辑:陈萍、蛋酱人类无法监督超级人工智能,但人工智能可以。过去一年,以「预测下一个 Token」为本质的大模型已经横扫人类世界的多...
阅读原文

字节GPT账户突遭冻结,OpenAI:正在调查不当行为

金磊 发自 凹非寺量子位 | 公众号 QbitAI字节跳动,陷入大模型舆论风波。据The Verge报道:字节跳动一直在秘密使用OpenAI的技术,来开发自家大语言模型(LLM...
阅读原文

综述|大模型时代,对话系统的演进和机会,港中大华为联合发布

夕小瑶科技说 原创作者 |Hongru Wang本篇延续我们上篇文章《大模型对话系统的内功与外功》(链接见文末),以一个回顾和展望的视角出发,试图回答大模型对话...
阅读原文

DeepMind提出代码链,通过“代码思考”改进推理性能

夕小瑶科技说 原创作者 | 智商掉了一地在未来,如果想要精确地操控机器人,除了让它理解简单易操作的指令,可能还需要一种更智能、可以理解复杂推理的方法来...
阅读原文

PaLM 2数学性能暴涨6%!DeepMind新作力证「合成数据」是通往AGI关键

新智元报道编辑:桃子【新智元导读】AI可以从自己生成的「合成数据」中学习,最重要的是,能够大幅提升数据问题解决和代码生成的能力。合成数据,或许就是大...
阅读原文

阿里文生视频挑战Gen-2、Pika,1280×720分辨率无压力,3500万文本-视频对显奇效

机器之心报道编辑:张倩、陈萍文生视频领域又卷起来了!文生视频可以精细到什么程度?最近,阿里巴巴的一项研究给出了答案:1280×720 分辨率没有压力,而且生...
阅读原文

大模型的下一站,AI 视频生成的技术突破与未来

站在年末的时间点上,我们明显可以感知到,2023 年是当之无愧的大模型元年,从文本大模型 ChatGPT,到图片生成模型 Stable Diffusion 和 Midjourney,技术的...
阅读原文