标签:研究者

图灵奖得主Yoshua Bengio新作:Were RNNs All We Needed?

机器之心报道 编辑:佳琪、蛋酱自从 Transformer 模型问世以来,试图挑战其在自然语言处理地位的挑战者层出不穷。 这次登场的选手,不仅要挑战 Transformer ...
阅读原文

诺奖得主本庶佑: 真正一流的工作往往没有在顶级刊物上发表

来源:思庐哲学研究方法应该是多元的,每位学人都可能有适合自己的方法,本庶佑的方法是其中很有特色的一元。本文摘选本庶佑关于求学、研究及创新等方面的观...
阅读原文

斯坦福新作:无指令调优的指令遵循

机器之心报道 编辑:杜伟、陈陈指令调优(Instruction tuning)是一种优化技术,通过对模型的输入进行微调,以使其更好地适应特定任务。先前的研究表明,指令...
阅读原文

OpenAI o1智商120,还是被陶哲轩称为「平庸的研究生」,但实力究竟如何?

机器之心报道 编辑:蛋酱、杨文o1消息满天飞。自从 OpenAI 发布了新模型 o1 后,它就承包了 AI 领域近几天的热搜: 有人用门萨智商测试题「拷问」它,竟测得 ...
阅读原文

检索总结能力超博士后,首个大模型科研智能体PaperQA2开源了

机器之心报道 编辑:泽南、杜伟这是 AI 智能体在大部分科学研究中超越人类的第一个案例,或许会彻底改变人类与科学文献互动的方式。最近一段时间,有关 AI 科...
阅读原文

用Test Time换Training Time能让LLM更强吗?

机器之心PRO · 会员通讯 Week 36---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. 用 Test Time 换 Training Time 能让 LLM 更强吗? Self...
阅读原文

GPT-4o不会数r,被外国小哥原地逼疯! 谷歌论文揭秘Transformer「数不到n」

新智元报道编辑:Aeneas 好困 【新智元导读】提示工程师Riley Goodside小哥,依然在用「Strawberry里有几个r」折磨大模型们,GPT-4o在无限次PUA后,已经被原...
阅读原文

用「AI人」模拟社会学实验,居然成功了?斯坦福、NYU用GPT-4模仿人类,准确度惊人!

新智元报道编辑:Aeneas 【新智元导读】斯坦福和NYU的研究者发现,GPT-4这样的「AI人」,可以被用来复制社会科学实验了。调查了1万个AI,结果比真人还真?最...
阅读原文

语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场

来源:新智元编辑:Aeneas 好困 【导读】就在刚刚,Meta最新发布的Transfusion,能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后,...
阅读原文

ECCV 2024 | 引入DiT的原生3D通用框架,适用任意神经场、秒级生成

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

揭秘 Transformer 内部原理:八问八答全解析!

近期,Sakana AI 发表了一篇题为《Transformer Layers as Painters》的论文,探究了预训练 transformer 中的信息流,并针对仅解码器和仅编码器冻结 transform...
阅读原文

明确了:文本数据中加点代码,训练出的大模型更强、更通用

机器之心报道 机器之心编辑部代码知识原来这么重要。如今说起大语言模型(LLM),写代码能力恐怕是「君子六艺」必不可少的一项。 在预训练数据集中包含代码,...
阅读原文

支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频

机器之心报道 编辑:杜伟、陈陈现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型...
阅读原文

DeepSeek开源数学大模型,高中、大学定理证明新SOTA

机器之心报道 机器之心编辑部DeepSeek-Prover-V1.5 通过结合强化学习和蒙特卡洛树搜索,显著提升了证明生成的效率和准确性。AI 技术与数学发现的进展,正前所...
阅读原文

OpenAI爆料者竟然是智能体?斯坦福系创企推出新一代智能体AgentQ

最近,OpenAI 的秘密项目「Q*」一直受到了圈内人士的广泛关注。上个月,以它为前身、代号为「草莓(Strawberry)」的项目又被曝光了。据推测,该项目能够提供...
阅读原文
123413