标签：性能

英伟达Blackwell称霸MLPerf！推理性能暴涨30倍，新一代「AI怪兽」诞生

新智元报道编辑：乔杨好困【新智元导读】MLPerf Inference发布了最新测试结果，英伟达最新的Blackwell架构芯片上场与谷歌、AMD同场竞技，展现出明显的性能...

阅读原文

AIGC动态

2年前 (2024)

上交大新型SRAM存内计算架构「COMPASS」，开启类脑计算新时代

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

明确了：文本数据中加点代码，训练出的大模型更强、更通用

机器之心报道机器之心编辑部代码知识原来这么重要。如今说起大语言模型（LLM），写代码能力恐怕是「君子六艺」必不可少的一项。在预训练数据集中包含代码，...

阅读原文

AIGC动态

2年前 (2024)

小模型站起来了，浏览器里跑出SOTA，抱抱脸：快逃，合成数据不是未来

梦晨发自凹非寺量子位 | 公众号 QbitAI浏览器里直接能跑的SOTA小模型来了，分别在2亿、5亿和20亿级别获胜，抱抱脸出品。秘诀只有两个：狠狠地过滤数据在...

阅读原文

AIGC动态

2年前 (2024)

比Stable Diffusion便宜118倍！1890美元训出11.6亿参数高质量文生图模型

新智元报道编辑：alan 【新智元导读】近日，来自加州大学尔湾分校等机构的研究人员，利用延迟掩蔽、MoE、分层扩展等策略，将扩散模型的训练成本降到了1890美...

阅读原文

AIGC动态

2年前 (2024)

新PyTorch API：几行代码实现不同注意力变体，兼具FlashAttention性能和PyTorch灵活性

机器之心报道编辑：陈陈用 FlexAttention 尝试一种新的注意力模式。理论上，注意力机制就是你所需要的一切。然而在实际操作中，我们还需要优化像 FlashAtten...

阅读原文

AIGC动态

2年前 (2024)

手机跑大模型提速4-5倍！微软亚研院开源新技术，有CPU就行

微软亚洲研究院投稿量子位 | 公众号 QbitAI有CPU就能跑大模型，性能甚至超过NPU/GPU！没错，为了优化模型端侧部署，微软亚洲研究院提出了一种新技术——T-MAC...

阅读原文

AIGC动态

2年前 (2024)

Llama3训练每3小时崩一次？豆包大模型、港大团队为脆皮万卡训练提效

机器之心发布机器之心编辑部伴随大模型迭代速度越来越快，训练集群规模越来越大，高频率的软硬件故障已经成为阻碍训练效率进一步提高的痛点，检查点（Checkp...

阅读原文

AIGC动态

2年前 (2024)

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发布自动评估模型FLAMe

新智元报道编辑：乔杨耳朵【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列，FLAMe-RM-24B模型在RewardBench上表现卓越，以87.8%准确率领先GPT-4o...

阅读原文

AIGC动态

2年前 (2024)

谷歌开源最强端侧小模型：2B参数越级跑赢GPT-3.5-Turbo，苹果15Pro运行飞快

机器之心报道机器之心编辑部谷歌也来卷「小」模型了，一出手就是王炸，胜过了比自己参数多得多的GPT-3.5、Mixtral竞品模型。今年 6 月底，谷歌开源了 9B、27...

阅读原文

AIGC动态

2年前 (2024)

北京大学：利用好不确定性，8B小模型也能超越GPT-4

夕小瑶科技说原创作者 | 谢年年大模型有一个显著的特点，那就是不确定性——对于特定输入，相同的LLM在不同解码配置下可能生成显著不同的输出。比如问一问cha...

阅读原文

AIGC动态

2年前 (2024)

小模型狂飙！6家巨头争相发布小模型，Andrej Karpathy：大语言模型的尺寸竞争正在倒退…

夕小瑶科技说原创作者 | 21#过去一周，可谓是小模型战场最疯狂的一周，商业巨头改变赛道，向大模型say byebye~。 OpenAI、Apple、Mistral等“百花齐放”，纷纷...

阅读原文

AIGC动态

2年前 (2024)

老黄再出奇招！首推「版」GB20服务器，或将明年上市

新智元报道编辑：编辑部【新智元导读】外媒爆料，英伟达将于明年推出一款专为中国市场定制的AI芯片，甚至还专研了一款与之搭配的服务器，这在英伟达历史上还...

阅读原文

AIGC动态

2年前 (2024)

Mistral AI新旗舰模型挑战Llama 3.1！1230亿参数性能直逼GPT-4o

Mistral AI新旗舰模型重磅发布：“幻觉”控制出色。编译|孟强编辑|云鹏智东西7月25日消息，继Meta昨日推出开源Llama3.1模型之后，法国初创AI公司Mistral AI...

阅读原文

AIGC动态

2年前 (2024)

Mistral发布Large 2 挑战 Llama 3.1

点击上方蓝字关注我们“法国人工智能初创公司Mistral推出新一代开源模型Mistral Large 2，以1230亿参数挑战行业巨头，尽管其参数数量少于Meta的Llama 3.1，但...

阅读原文

AIGC动态

2年前 (2024)

1…4 567 8…26