标签:缩放

ᯅ国行 Vision Pro 软件体验,王者荣耀还能这样看

拿到国行 Vision Proᯅ后,爱范儿立马体验了刚刚上架的腾讯视频。作为一名常年观看电竞赛事的云玩家,我只能说这样看比赛:真的很爽。 和在手机上看王者荣耀 K...
阅读原文

发完最后一篇论文,Stable Diffusion核心团队全要离职了

机器之心报道 机器之心编辑部内部核心员工出走频繁,外部投资者不断丧失信心,成立于 2019 年的 AI 初创公司 Stability AI 还能推出伟大的产品吗? 离 Stable...
阅读原文

47年前经典影片另类重制,从宇宙到原子皆是生成

机器之心报道 作者:大盘鸡从广角视图到微距拍摄,每一步由你来决定。 以躺在草坪上的男人为中心,将镜头画面按照 10 倍的比例不断扩展,你将看到一亿光年外...
阅读原文

DeepSeek 发布全新开源大模型,数学推理能力超越 LLaMA-2

夕小瑶科技说 原创作者 | 智商掉了一地、Python自从 LLaMA 被提出以来,开源大型语言模型(LLM)的快速发展就引起了广泛研究关注,随后的一些研究就主要集中...
阅读原文

孩子喜欢飞机,于是我给她做了一个雷达

大数据文摘出品作者:Caleb今年夏天,我计划带着我的孩子出国。她很兴奋。在此之前,我和妻子决定大肆宣传一下这次的飞行之旅,主要是为了确保女儿能安稳地度...
阅读原文

解决LLaMA、BERT等部署难题:首个4-bit浮点量化LLM来了

机器之心专栏机器之心编辑部这篇文章给出了大模型 FP 量化的解决方案。大语言模型 (LLM) 压缩一直备受关注,后训练量化(Post-training Quantization) 是其中...
阅读原文

前沿进展:群论方法解析大脑信息表征的对称性

导语对称性支配着我们所在的世界,而我们的大脑会建立外部世界的模型,这自然引发一个问题:对称性是否也是大脑信息处理的基本原理?本文介绍了研究者近期发...
阅读原文

用FP8训练大模型有多香?微软:比BF16快64%,省42%内存

机器之心报道编辑:Panda低精度训练是大模型训练中扩展模型大小,节约训练成本的最关键技术之一。相比于当前的 16 位和 32 位浮点混合精度训练,使用 FP8 8 ...
阅读原文