标签:研究者

鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆

机器之心报道 编辑:陈陈2.4B 的 Memory3比更大的 LLM 和 RAG 模型获得了更好的性能。近年来,大型语言模型 (LLM) 因其非凡的性能而获得了前所未有的关注。然...
阅读原文

百万级高质量视频数据集发布,登顶抱抱脸数据集排行榜,中科大&上海AI Lab等出品

ShareGPT4V团队 投稿量子位 | 公众号 QbitAI中科大、上海AI实验室等组成的ShareGPT4V团队,推出了新的视频数据集,登顶HuggingFace排行榜! 数据集涵盖了3000...
阅读原文

ShareGPT4V作者团队又一力作!百万高质量视频-字幕数据助力社区提升多模态大模型视频理解及生成能力

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

从 CLM 启航:中国大模型的探索与未来

CLM大会不仅是大模型“上半场”的归纳总结,更是拉开了“下半场”中国大模型道路的探索的序幕。作者丨陈鹭伊 编辑丨岑峰 在人工智能的广阔舞台上,大模型技术的崛...
阅读原文

新一轮「硬件彩票」:MatMul-free 会改变大模型的游戏规则吗?

机器之心PRO · 会员通讯 Week 24---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. 新一轮「硬件彩票」:MatMul-free 会改变大模型的游戏规...
阅读原文

ACL 2024论文盖棺定论:大语言模型≠世界模拟器,Yann LeCun:太对了

机器之心报道 机器之心编辑部如果 GPT-4 在模拟基于常识任务的状态变化时准确率都只有约 60%,那么我们还要考虑将大语言模型作为世界模拟器来使用吗?最近两...
阅读原文

FineWeb技术报告出炉!揭秘HuggingFace规模最大、质量最高预训练数据集

新智元报道编辑:Mindy 【新智元导读】从大规模网络爬取、精细过滤到去重技术,通过FineWeb的技术报告探索如何打造高质量数据集,为大型语言模型(LLM)预训...
阅读原文

速度秒掉GPT-4o、22B击败Llama 3 70B,Mistral AI开放首个代码模型

机器之心报道 编辑:杜伟、陈萍开放但禁止商用用途。对标 OpenAI 的法国 AI 独角兽 Mistral AI 有了新动作:首个代码大模型 Codestral 诞生了。作为一个专为...
阅读原文

生命大科学:从微观到介观的组学研究

本文刊载于《中国科学院院刊》2024年第5期“专刊:建设世界科技强国——努力抢占科技制高点”吴家睿1 中国科学院分子细胞科学卓越创新中心 2 上海交通大学 主动健...
阅读原文

不影响输出质量还能追踪溯源,「大模型无偏水印」入选ICLR 2024 Spotlight

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

芝大论文证明GPT-4选股准确率高达60%,人类股票分析师要下岗?AI大牛质疑数据污染

新智元报道编辑:编辑部 【新智元导读】GPT-4在为人类选股时,表现竟然超越了大部分人类分析师,和针对金融训练的专业模型?在没有任何上下文的情况下,它们...
阅读原文

GPT-4被证实具有「人类心智」登Nature!AI比人类更好察觉讽刺和暗示

新智元报道编辑:庸庸 【新智元导读】关于AI是否具有「心智理论」一直存在很多争议。Nature最新研究显示,GPT-4的行为可与人类媲美,甚至能够比人类更好地察...
阅读原文

AI黑盒研究的突破性进展:Anthropic详解大模型的「思维」特征

一直以来 AI 都是一个黑盒子(black box),其内部运作机制是不可见的。人们输入数据并得到结果,但无法检查输出结果的逻辑或者系统的代码。 而就在刚刚,Ant...
阅读原文

用基础模型指导特征传播,首个泛化型图像匹配器OmniGlue搞定未见过域

机器之心报道 编辑:杜伟第一个以「泛化」能力为核心设计原则的可学习图像匹配器来了!对于想要获取两张图像之间的细粒度视觉对应关系而言,局部图像特征匹配...
阅读原文

从80个模型中构建Scaling Law:华人博士生新作,思维链提出者力荐

机器之心报道 编辑:小舟、陈萍在 AI 领域,扩展定律(Scaling laws)是理解 LM 扩展趋势的强大工具,其为广大研究者提供了一个准则,该定律在理解语言模型的...
阅读原文
1234512