标签:研究者
Meta开发System 2蒸馏技术,Llama 2对话模型任务准确率接近100%
机器之心报道 编辑:杜伟研究者表示,如果 Sytem 2 蒸馏可以成为未来持续学习 AI 系统的重要特征,则可以进一步提升 System 2 表现不那么好的推理任务的性能...
单一作者论文,谷歌提出百万专家Mixture,超越密集前馈、稀疏MoE
机器之心报道 编辑:泽南、杜伟释放进一步扩展 Transformer 的潜力,同时还可以保持计算效率。标准 Transformer 架构中的前馈(FFW)层会随着隐藏层宽度的增...
人人可做提示工程师!Claude上新:一键生成、测试和评估prompt
机器之心报道 编辑:陈陈、小舟不会写 prompt 的看过来。在构建 AI 应用时,prompt 质量对结果有着重大影响。但制作高质量的 prompt 具有挑战性,需要研究者...
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
机器之心报道 编辑:陈陈2.4B 的 Memory3比更大的 LLM 和 RAG 模型获得了更好的性能。近年来,大型语言模型 (LLM) 因其非凡的性能而获得了前所未有的关注。然...
百万级高质量视频数据集发布,登顶抱抱脸数据集排行榜,中科大&上海AI Lab等出品
ShareGPT4V团队 投稿量子位 | 公众号 QbitAI中科大、上海AI实验室等组成的ShareGPT4V团队,推出了新的视频数据集,登顶HuggingFace排行榜! 数据集涵盖了3000...
ShareGPT4V作者团队又一力作!百万高质量视频-字幕数据助力社区提升多模态大模型视频理解及生成能力
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
从 CLM 启航:中国大模型的探索与未来
CLM大会不仅是大模型“上半场”的归纳总结,更是拉开了“下半场”中国大模型道路的探索的序幕。作者丨陈鹭伊 编辑丨岑峰 在人工智能的广阔舞台上,大模型技术的崛...
ACL 2024论文盖棺定论:大语言模型≠世界模拟器,Yann LeCun:太对了
机器之心报道 机器之心编辑部如果 GPT-4 在模拟基于常识任务的状态变化时准确率都只有约 60%,那么我们还要考虑将大语言模型作为世界模拟器来使用吗?最近两...
新一轮「硬件彩票」:MatMul-free 会改变大模型的游戏规则吗?
机器之心PRO · 会员通讯 Week 24---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. 新一轮「硬件彩票」:MatMul-free 会改变大模型的游戏规...
FineWeb技术报告出炉!揭秘HuggingFace规模最大、质量最高预训练数据集
新智元报道编辑:Mindy 【新智元导读】从大规模网络爬取、精细过滤到去重技术,通过FineWeb的技术报告探索如何打造高质量数据集,为大型语言模型(LLM)预训...
速度秒掉GPT-4o、22B击败Llama 3 70B,Mistral AI开放首个代码模型
机器之心报道 编辑:杜伟、陈萍开放但禁止商用用途。对标 OpenAI 的法国 AI 独角兽 Mistral AI 有了新动作:首个代码大模型 Codestral 诞生了。作为一个专为...
生命大科学:从微观到介观的组学研究
本文刊载于《中国科学院院刊》2024年第5期“专刊:建设世界科技强国——努力抢占科技制高点”吴家睿1 中国科学院分子细胞科学卓越创新中心 2 上海交通大学 主动健...
不影响输出质量还能追踪溯源,「大模型无偏水印」入选ICLR 2024 Spotlight
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
芝大论文证明GPT-4选股准确率高达60%,人类股票分析师要下岗?AI大牛质疑数据污染
新智元报道编辑:编辑部 【新智元导读】GPT-4在为人类选股时,表现竟然超越了大部分人类分析师,和针对金融训练的专业模型?在没有任何上下文的情况下,它们...
GPT-4被证实具有「人类心智」登Nature!AI比人类更好察觉讽刺和暗示
新智元报道编辑:庸庸 【新智元导读】关于AI是否具有「心智理论」一直存在很多争议。Nature最新研究显示,GPT-4的行为可与人类媲美,甚至能够比人类更好地察...