标签:研究者

ACL 2024 Oral|我们离真正的多模态思维链推理还有多远?

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

八问八答搞懂Transformer内部运作原理

机器之心报道 机器之心编辑部七年前,论文《Attention is all you need》提出了 transformer 架构,颠覆了整个深度学习领域。 如今,各家大模型都以 transfor...
阅读原文

阿里「轨迹可控版Sora」,告别「抽卡」,让视频生成更符合物理规律

机器之心报道 编辑:陈陈、杜伟你规定路线,Tora 来生成相应轨迹的视频。目前,扩散模型能够生成多样化且高质量的图像或视频。此前,视频扩散模型采用 U-Net ...
阅读原文

小技巧大功效,「仅阅读两次提示」让循环语言模型超越Transformer++

机器之心报道 编辑:杜伟在当前 AI 领域,大语言模型采用的主流架构是 Transformer。不过,随着 RWKV、Mamba 等架构的陆续问世,出现了一个很明显的趋势:在...
阅读原文

CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

「越狱」事件频发,如何教会大模型「迷途知返」而不是「将错就错」?

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

牛津剑桥「投毒」AI失败9次登Nature封面,引爆学术圈激辩!AI训AI能否打破崩溃魔咒?

新智元报道编辑:Aeneas 好困 【新智元导读】牛津剑桥的9次投毒导致模型崩溃的论文,已经遭到了诸多吐槽:这也能上Nature?学术圈则对此进行了进一步讨论,大...
阅读原文

在机器人顶会 RSS 2024 上,中国的人形机器人研究斩获最佳论文奖

机器之心报道 机器之心编辑部近日,机器人领域著名会议 RSS(Robotics: Science and Systems) 2024 在荷兰代尔夫特理工大学圆满落幕。 尽管会议规模与 NeurI...
阅读原文

仅微调0.02%参数,性能接近全量微调!上交大推出高效微调统一新范式

ChouJay 投稿量子位 | 公众号 QbitAIScaling Laws当道,但随着大模型应用的发展,基础模型不断扩大的参数也成了令开发者们头疼的问题。 为了减轻训练负担,Ad...
阅读原文

清华大学联合斯坦福大学提出混合注意力机制MoA,大模型解码速率提高6倍

夕小瑶科技说 原创作者 | Richard 随着大语言模型的规模不断扩大,如何在保持模型性能的同时提高其效率,成为了当前研究的热点问题。最近,清华大学联合斯坦...
阅读原文

清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉

机器之心报道 编辑:小舟、陈陈清华成绩亮眼。第 47 届国际计算机协会信息检索大会(ACM SIGIR) 于 2024 年 7 月 14 日至 18 日在美国华盛顿特区举行。该会...
阅读原文

登顶开源AI软件工程师榜首,UIUC无Agent方案轻松解决SWE-bench真实编程问题

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

Meta开发System 2蒸馏技术,Llama 2对话模型任务准确率接近100%

机器之心报道 编辑:杜伟研究者表示,如果 Sytem 2 蒸馏可以成为未来持续学习 AI 系统的重要特征,则可以进一步提升 System 2 表现不那么好的推理任务的性能...
阅读原文

单一作者论文,谷歌提出百万专家Mixture,超越密集前馈、稀疏MoE

机器之心报道 编辑:泽南、杜伟释放进一步扩展 Transformer 的潜力,同时还可以保持计算效率。标准 Transformer 架构中的前馈(FFW)层会随着隐藏层宽度的增...
阅读原文

人人可做提示工程师!Claude上新:一键生成、测试和评估prompt

机器之心报道 编辑:陈陈、小舟不会写 prompt 的看过来。在构建 AI 应用时,prompt 质量对结果有着重大影响。但制作高质量的 prompt 具有挑战性,需要研究者...
阅读原文
123412