标签：研究者

图灵奖得主Yoshua Bengio新作：Were RNNs All We Needed?

机器之心报道编辑：佳琪、蛋酱自从 Transformer 模型问世以来，试图挑战其在自然语言处理地位的挑战者层出不穷。这次登场的选手，不仅要挑战 Transformer ...

阅读原文

AIGC动态

2年前 (2024)

诺奖得主本庶佑: 真正一流的工作往往没有在顶级刊物上发表

来源：思庐哲学研究方法应该是多元的，每位学人都可能有适合自己的方法，本庶佑的方法是其中很有特色的一元。本文摘选本庶佑关于求学、研究及创新等方面的观...

阅读原文

AIGC动态

2年前 (2024)

斯坦福新作：无指令调优的指令遵循

机器之心报道编辑：杜伟、陈陈指令调优（Instruction tuning）是一种优化技术，通过对模型的输入进行微调，以使其更好地适应特定任务。先前的研究表明，指令...

阅读原文

AIGC动态

2年前 (2024)

OpenAI o1智商120，还是被陶哲轩称为「平庸的研究生」，但实力究竟如何？

机器之心报道编辑：蛋酱、杨文o1消息满天飞。自从 OpenAI 发布了新模型 o1 后，它就承包了 AI 领域近几天的热搜：有人用门萨智商测试题「拷问」它，竟测得 ...

阅读原文

AIGC动态

2年前 (2024)

检索总结能力超博士后，首个大模型科研智能体PaperQA2开源了

机器之心报道编辑：泽南、杜伟这是 AI 智能体在大部分科学研究中超越人类的第一个案例，或许会彻底改变人类与科学文献互动的方式。最近一段时间，有关 AI 科...

阅读原文

AIGC动态

2年前 (2024)

用Test Time换Training Time能让LLM更强吗？

机器之心PRO · 会员通讯 Week 36---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. 用 Test Time 换 Training Time 能让 LLM 更强吗？ Self...

阅读原文

AIGC动态

2年前 (2024)

GPT-4o不会数r，被外国小哥原地逼疯！谷歌论文揭秘Transformer「数不到n」

新智元报道编辑：Aeneas 好困【新智元导读】提示工程师Riley Goodside小哥，依然在用「Strawberry里有几个r」折磨大模型们，GPT-4o在无限次PUA后，已经被原...

阅读原文

AIGC动态

2年前 (2024)

用「AI人」模拟社会学实验，居然成功了？斯坦福、NYU用GPT-4模仿人类，准确度惊人！

新智元报道编辑：Aeneas 【新智元导读】斯坦福和NYU的研究者发现，GPT-4这样的「AI人」，可以被用来复制社会科学实验了。调查了1万个AI，结果比真人还真？最...

阅读原文

AIGC动态

2年前 (2024)

语言图像模型大一统！Meta将Transformer和Diffusion融合，多模态AI王者登场

来源：新智元编辑：Aeneas 好困【导读】就在刚刚，Meta最新发布的Transfusion，能够训练生成文本和图像的统一模型了！完美融合Transformer和扩散领域之后，...

阅读原文

AIGC动态

2年前 (2024)

ECCV 2024 | 引入DiT的原生3D通用框架，适用任意神经场、秒级生成

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

揭秘 Transformer 内部原理：八问八答全解析！

近期，Sakana AI 发表了一篇题为《Transformer Layers as Painters》的论文，探究了预训练 transformer 中的信息流，并针对仅解码器和仅编码器冻结 transform...

阅读原文

AIGC动态

2年前 (2024)

明确了：文本数据中加点代码，训练出的大模型更强、更通用

机器之心报道机器之心编辑部代码知识原来这么重要。如今说起大语言模型（LLM），写代码能力恐怕是「君子六艺」必不可少的一项。在预训练数据集中包含代码，...

阅读原文

AIGC动态

2年前 (2024)

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

机器之心报道编辑：杜伟、陈陈现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。现阶段，将模型...

阅读原文

AIGC动态

2年前 (2024)

DeepSeek开源数学大模型，高中、大学定理证明新SOTA

机器之心报道机器之心编辑部DeepSeek-Prover-V1.5 通过结合强化学习和蒙特卡洛树搜索，显著提升了证明生成的效率和准确性。AI 技术与数学发现的进展，正前所...

阅读原文

AIGC动态

2年前 (2024)

OpenAI爆料者竟然是智能体？斯坦福系创企推出新一代智能体AgentQ

最近，OpenAI 的秘密项目「Q*」一直受到了圈内人士的广泛关注。上个月，以它为前身、代号为「草莓（Strawberry）」的项目又被曝光了。据推测，该项目能够提供...

阅读原文

AIGC动态

2年前 (2024)

123 4…13