标签:研究者
阿里「轨迹可控版Sora」,告别「抽卡」,让视频生成更符合物理规律
机器之心报道 编辑:陈陈、杜伟你规定路线,Tora 来生成相应轨迹的视频。目前,扩散模型能够生成多样化且高质量的图像或视频。此前,视频扩散模型采用 U-Net ...
小技巧大功效,「仅阅读两次提示」让循环语言模型超越Transformer++
机器之心报道 编辑:杜伟在当前 AI 领域,大语言模型采用的主流架构是 Transformer。不过,随着 RWKV、Mamba 等架构的陆续问世,出现了一个很明显的趋势:在...
CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
「越狱」事件频发,如何教会大模型「迷途知返」而不是「将错就错」?
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
牛津剑桥「投毒」AI失败9次登Nature封面,引爆学术圈激辩!AI训AI能否打破崩溃魔咒?
新智元报道编辑:Aeneas 好困 【新智元导读】牛津剑桥的9次投毒导致模型崩溃的论文,已经遭到了诸多吐槽:这也能上Nature?学术圈则对此进行了进一步讨论,大...
在机器人顶会 RSS 2024 上,中国的人形机器人研究斩获最佳论文奖
机器之心报道 机器之心编辑部近日,机器人领域著名会议 RSS(Robotics: Science and Systems) 2024 在荷兰代尔夫特理工大学圆满落幕。 尽管会议规模与 NeurI...
仅微调0.02%参数,性能接近全量微调!上交大推出高效微调统一新范式
ChouJay 投稿量子位 | 公众号 QbitAIScaling Laws当道,但随着大模型应用的发展,基础模型不断扩大的参数也成了令开发者们头疼的问题。 为了减轻训练负担,Ad...
清华大学联合斯坦福大学提出混合注意力机制MoA,大模型解码速率提高6倍
夕小瑶科技说 原创作者 | Richard 随着大语言模型的规模不断扩大,如何在保持模型性能的同时提高其效率,成为了当前研究的热点问题。最近,清华大学联合斯坦...
清华包揽最佳论文+时间检验奖,山大获荣誉提名,SIGIR 2024奖项出炉
机器之心报道 编辑:小舟、陈陈清华成绩亮眼。第 47 届国际计算机协会信息检索大会(ACM SIGIR) 于 2024 年 7 月 14 日至 18 日在美国华盛顿特区举行。该会...
登顶开源AI软件工程师榜首,UIUC无Agent方案轻松解决SWE-bench真实编程问题
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
Meta开发System 2蒸馏技术,Llama 2对话模型任务准确率接近100%
机器之心报道 编辑:杜伟研究者表示,如果 Sytem 2 蒸馏可以成为未来持续学习 AI 系统的重要特征,则可以进一步提升 System 2 表现不那么好的推理任务的性能...
单一作者论文,谷歌提出百万专家Mixture,超越密集前馈、稀疏MoE
机器之心报道 编辑:泽南、杜伟释放进一步扩展 Transformer 的潜力,同时还可以保持计算效率。标准 Transformer 架构中的前馈(FFW)层会随着隐藏层宽度的增...
人人可做提示工程师!Claude上新:一键生成、测试和评估prompt
机器之心报道 编辑:陈陈、小舟不会写 prompt 的看过来。在构建 AI 应用时,prompt 质量对结果有着重大影响。但制作高质量的 prompt 具有挑战性,需要研究者...
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
机器之心报道 编辑:陈陈2.4B 的 Memory3比更大的 LLM 和 RAG 模型获得了更好的性能。近年来,大型语言模型 (LLM) 因其非凡的性能而获得了前所未有的关注。然...
百万级高质量视频数据集发布,登顶抱抱脸数据集排行榜,中科大&上海AI Lab等出品
ShareGPT4V团队 投稿量子位 | 公众号 QbitAI中科大、上海AI实验室等组成的ShareGPT4V团队,推出了新的视频数据集,登顶HuggingFace排行榜! 数据集涵盖了3000...