标签:性能
英伟达Blackwell称霸MLPerf!推理性能暴涨30倍,新一代「AI怪兽」诞生
新智元报道编辑:乔杨 好困 【新智元导读】MLPerf Inference发布了最新测试结果,英伟达最新的Blackwell架构芯片上场与谷歌、AMD同场竞技,展现出明显的性能...
上交大新型SRAM存内计算架构「COMPASS」,开启类脑计算新时代
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
明确了:文本数据中加点代码,训练出的大模型更强、更通用
机器之心报道 机器之心编辑部代码知识原来这么重要。如今说起大语言模型(LLM),写代码能力恐怕是「君子六艺」必不可少的一项。 在预训练数据集中包含代码,...
小模型站起来了,浏览器里跑出SOTA,抱抱脸:快逃,合成数据不是未来
梦晨 发自 凹非寺量子位 | 公众号 QbitAI浏览器里直接能跑的SOTA小模型来了,分别在2亿、5亿和20亿级别获胜,抱抱脸出品。 秘诀只有两个: 狠狠地过滤数据 在...
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
新智元报道编辑:alan 【新智元导读】近日,来自加州大学尔湾分校等机构的研究人员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美...
新PyTorch API:几行代码实现不同注意力变体,兼具FlashAttention性能和PyTorch灵活性
机器之心报道 编辑:陈陈用 FlexAttention 尝试一种新的注意力模式。理论上,注意力机制就是你所需要的一切。然而在实际操作中,我们还需要优化像 FlashAtten...
手机跑大模型提速4-5倍!微软亚研院开源新技术,有CPU就行
微软亚洲研究院 投稿量子位 | 公众号 QbitAI有CPU就能跑大模型,性能甚至超过NPU/GPU! 没错,为了优化模型端侧部署,微软亚洲研究院提出了一种新技术——T-MAC...
Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效
机器之心发布 机器之心编辑部伴随大模型迭代速度越来越快,训练集群规模越来越大,高频率的软硬件故障已经成为阻碍训练效率进一步提高的痛点,检查点(Checkp...
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
新智元报道编辑:乔杨 耳朵 【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o...
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo,苹果15Pro运行飞快
机器之心报道 机器之心编辑部谷歌也来卷「小」模型了,一出手就是王炸,胜过了比自己参数多得多的GPT-3.5、Mixtral竞品模型。今年 6 月底,谷歌开源了 9B、27...
北京大学:利用好不确定性,8B小模型也能超越GPT-4
夕小瑶科技说 原创作者 | 谢年年大模型有一个显著的特点,那就是不确定性——对于特定输入,相同的LLM在不同解码配置下可能生成显著不同的输出。 比如问一问cha...
小模型狂飙!6家巨头争相发布小模型,Andrej Karpathy:大语言模型的尺寸竞争正在倒退…
夕小瑶科技说 原创作者 | 21#过去一周,可谓是小模型战场最疯狂的一周,商业巨头改变赛道,向大模型say byebye~。 OpenAI、Apple、Mistral等“百花齐放”,纷纷...
老黄再出奇招!首推「特供版」GB20服务器,或将明年上市
新智元报道编辑:编辑部 【新智元导读】外媒爆料,英伟达将于明年推出一款专为中国市场定制的AI芯片,甚至还专研了一款与之搭配的服务器,这在英伟达历史上还...
Mistral AI新旗舰模型挑战Llama 3.1!1230亿参数性能直逼GPT-4o
Mistral AI新旗舰模型重磅发布:“幻觉”控制出色。 编译|孟强 编辑|云鹏 智东西7月25日消息,继Meta昨日推出开源Llama3.1模型之后,法国初创AI公司Mistral AI...
Mistral发布Large 2 挑战 Llama 3.1
点击上方蓝字关注我们“法国人工智能初创公司Mistral推出新一代开源模型Mistral Large 2,以1230亿参数挑战行业巨头,尽管其参数数量少于Meta的Llama 3.1,但...