标签:研究者

一直爆料OpenAI「草莓」的账号,竟然是个智能体?斯坦福系创企「炒作」AgentQ

机器之心报道 编辑:杜伟、佳琪当炒作出了「泼天的流量」,已经没人关心产品厉不厉害了。最近,OpenAI 的秘密项目「Q*」一直受到了圈内人士的广泛关注。上个...
阅读原文

没有等来OpenAI开源GPT-4o,等来了开源版VITA

机器之心报道 机器之心编辑部开源领域又传来好消息。大语言模型 (LLM) 经历了重大的演变,最近,我们也目睹了多模态大语言模型 (MLLM) 的蓬勃发展,它们表现...
阅读原文

黑匣子被打开了!能玩的Transformer可视化解释工具,本地运行GPT-2、还可实时推理

机器之心报道 编辑:杜伟、大盘鸡都 2024 年,还有人不了解 Transformer 工作原理吗?快来试一试这个交互式工具吧。2017 年,谷歌在论文《Attention is all y...
阅读原文

ACL 2024 Oral|我们离真正的多模态思维链推理还有多远?

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

八问八答搞懂Transformer内部运作原理

机器之心报道 机器之心编辑部七年前,论文《Attention is all you need》提出了 transformer 架构,颠覆了整个深度学习领域。 如今,各家大模型都以 transfor...
阅读原文

阿里「轨迹可控版Sora」,告别「抽卡」,让视频生成更符合物理规律

机器之心报道 编辑:陈陈、杜伟你规定路线,Tora 来生成相应轨迹的视频。目前,扩散模型能够生成多样化且高质量的图像或视频。此前,视频扩散模型采用 U-Net ...
阅读原文

小技巧大功效,「仅阅读两次提示」让循环语言模型超越Transformer++

机器之心报道 编辑:杜伟在当前 AI 领域,大语言模型采用的主流架构是 Transformer。不过,随着 RWKV、Mamba 等架构的陆续问世,出现了一个很明显的趋势:在...
阅读原文

CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

「越狱」频发,如何教会大模型「迷途知返」而不是「将错就错」?

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

牛津剑桥「投毒」AI失败9次登Nature封面,引爆学术圈激辩!AI训AI能否打破崩溃魔咒?

新智元报道编辑:Aeneas 好困 【新智元导读】牛津剑桥的9次投毒导致模型崩溃的论文,已经遭到了诸多吐槽:这也能上Nature?学术圈则对此进行了进一步讨论,大...
阅读原文

在机器人顶会 RSS 2024 上,中国的人形机器人研究斩获最佳论文奖

机器之心报道 机器之心编辑部近日,机器人领域著名会议 RSS(Robotics: Science and Systems) 2024 在荷兰代尔夫特理工大学圆满落幕。 尽管会议规模与 NeurI...
阅读原文

仅微调0.02%参数,性能接近全量微调!上交大推出高效微调统一新范式

ChouJay 投稿量子位 | 公众号 QbitAIScaling Laws当道,但随着大模型应用的发展,基础模型不断扩大的参数也成了令开发者们头疼的问题。 为了减轻训练负担,Ad...
阅读原文

清华大合斯坦福大学提出混合注意力机制MoA,大模型解码速率提高6倍

夕小瑶科技说 原创作者 | Richard 随着大语言模型的规模不断扩大,如何在保持模型性能的同时提高其效率,成为了当前研究的热点问题。最近,清华大学联合斯坦...
阅读原文

清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉

机器之心报道 编辑:小舟、陈陈清华成绩亮眼。第 47 届国际计算机协会信息检索大会(ACM SIGIR) 于 2024 年 7 月 14 日至 18 日在美国华盛顿特区举行。该会...
阅读原文

登顶开源AI软件工程师榜首,UIUC无Agent方案轻松解决SWE-bench真实编程问题

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文
1234513