标签:模型

爆火免费书《深入理解深度学习》终于出中文版了

机器之心报道 编辑:泽南、小舟这可能是当今最全面、最新的深度学习概述之一。 爆火的深度学习领域,最近又有了热门学习资料。 近日,麻省理工出版社的新书《...
阅读原文

中科大联合华为诺亚提出Entropy Law,揭秘大模型性能、数据压缩率以及训练损失关系

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

中国五连冠终结,美国重登IMO宝座!AI智商被第一题打回原形

新智元报道编辑:桃子 好困 【新智元导读】IMO 2024最终结果终于出炉了!破天荒的是,四年后美国队再次斩获第一,领先中国队两分。对于LLM来说,IMO最简单的...
阅读原文

大模型时代结束?大佬齐预测:AI模型或需先缩小规模,才能再次扩大规模

新智元报道编辑:耳朵 【新智元导读】小模型强势来袭,「大模型时代」或将落幕?「小模型周」过去了 ,小模型的最新战场才刚刚开辟。 上周GPT-4o mini和Mistr...
阅读原文

挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2

新智元报道编辑:乔杨 【新智元导读】Scaling Law还没走到尽头,「小模型」逐渐成为科技巨头们的追赶趋势。Meta最近发布的MobileLLM系列,规模甚至降低到了1B...
阅读原文

入选ACL 2024!引入零样本学习,华中科大发布针对甲骨文破译优化的条件扩散模型

作者:田小幺 编辑:李宝珠,十九 华中科技大学白翔、刘禹良研究团队联合阿德莱德大学、安阳师范学院、华南理工大学,训练出了一种针对甲骨文破译优化的条件...
阅读原文

夏天太热怎么办?AI 为“降温”材料发现提速数千倍,你的手机、电脑或许再也不发烫了

大数据文摘受权转载自学术头条 炎炎夏日,智能手机、平板电脑等电子设备常因“过热”而产生性能、安全问题。如何设计出散热更好的电子产品,材料是关键。 而其...
阅读原文

Ilya Sutskever 离职后首次采访:个人经历,Scaling Laws,AI幻觉

来源:AI寒武纪 Ilya Sutskever自从 OpenAI 赶走 Sam Altman 后首次接受播客采访,他提到了 AI 和深度学习的过去、现在和未来。他回顾了他从 17 岁起与 Jeff ...
阅读原文

胳膊肘往外拐?AMD的AI GPU助推器增加对英伟达的支持

夕小瑶科技说 原创作者 | 谷雨龙泽 众所周知,在硬件设施这片江湖,有两个大门派: 一个叫英伟达,一个叫AMD。 一直以来,两家之间大大小小较劲不断,今天你...
阅读原文

没投简历却被陌生HR随机辱骂,HR道歉称压力大;OPPO 回应“大量裁撤华为系员工”;传百度新任公关一号位或为蒋昕捷|AI 周报

整理 | 傅宇琪、褚杏娟 热门资讯微软蓝屏上热搜:影响全球850万台设备,木头姐抄底涉事公司 7 月 19 日消息,微软蓝屏登上热搜。据悉,全球多地的 Windows 系...
阅读原文

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

新智元报道编辑:桃子 乔杨 【新智元导读】小模型时代来了?OpenAI带着GPT-4o mini首次入局小模型战场,Mistral AI、HuggingFace本周接连发布了小模型。如今...
阅读原文

前谷歌科学家Yi Tay「LLM演义」系列博客第一弹:BERT为何匿迹江湖?

新智元报道编辑:庸庸 乔杨 【新智元导读】前谷歌科学家Yi Tay重磅推出「LLM时代的模型架构」系列博客,首篇博文的话题关于:基于encoder-only架构的BERT是如...
阅读原文

高于临床测试3倍准确率!剑桥大学开发AI模型,提前6年预测阿尔茨海默症

新智元报道编辑:耳朵 乔杨 【新智元导读】剑桥大学研究利用人工智能建立机器学习模型精准预测阿尔茨海默症发展,准确率远超临床测试结果,为阿尔兹海默症早...
阅读原文

打破生态孤岛,国产异构原生AI算力工具问世,来自中科加禾

机器之心报道 作者:泽南「通过系统优化软件的帮助,开发的门槛会被降低,各种不同硬件会得到统一,让技术生态得到发展。这对于当前智能生态的进步有重要的意...
阅读原文

「后训练 + STaR」是 OpenAI 绝密项目「草莓」背后的秘密吗?

机器之心PRO · 会员通讯 Week 29---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. 「后训练 + STaR」是 OpenAI 绝密项目「草莓」背后的秘...
阅读原文