标签:权重

大模型量化技术原理:FP8

‍生成式AI时代最火AI芯片峰会下月来袭!9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京盛大举行。峰会设有开幕式、数据中心AI芯片专场、边缘/端侧AI...
阅读原文

外网玩疯了,NSFW、毫无底线,FLUX 成为图片生成新王者

昨天马斯克的 Grok-2 发布,加入了 FLUX 模型提供的文生图能力。一夜之间,FLUX 毫无底线的图片血洗 X(推特)。 自从 Google 把美国开国总统和印第安人都画...
阅读原文

CPU反超NPU,llama.cpp生成速度翻5倍!LLM端侧部署新范式T-MAC开源

新智元报道编辑:LRST 好困 【新智元导读】T-MAC是一种创新的基于查找表(LUT)的方法,专为在CPU上高效执行低比特大型语言模型(LLMs)推理而设计,无需权重...
阅读原文

70倍极致压缩!大模型的检查点再多也不怕

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩

新智元报道编辑:编辑部 【新智元导读】面对LLM逐渐膨胀的参数规模,没有H100的开发者和研究人员们想出了很多弥补方法,「量化」技术就是其中的一种。这篇可...
阅读原文

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

新智元报道编辑:桃子 乔杨 【新智元导读】小模型时代来了?OpenAI带着GPT-4o mini首次入局小模型战场,Mistral AI、HuggingFace本周接连发布了小模型。如今...
阅读原文

仅微调0.02%参数,性能接近全量微调!上交大推出高效微调统一新范式

ChouJay 投稿量子位 | 公众号 QbitAIScaling Laws当道,但随着大模型应用的发展,基础模型不断扩大的参数也成了令开发者们头疼的问题。 为了减轻训练负担,Ad...
阅读原文

假开源真噱头?Meta再陷「开源」争议,LeCun被炮轰Meta只是开放模型

新智元报道编辑:耳朵 【新智元导读】大模型开源的热潮下,隐藏着诸多问题,从定义的模糊到实际开放内容的局限性,Lecun再陷Meta大模型是否真开源的质疑风波...
阅读原文

基于华为昇腾推理引擎MindIE部署Qwen-72B实战

在华为昇腾LLM落地可选解决方案中,我们曾介绍过MindIE,并且前段时间MindIE 1.0.RC1已经发布,本文主要将对其进行实战演练。 01MindIE 简介MindIE(Mind Inf...
阅读原文

Mistral AI两连发:7B数学推理专用、Mamba2架构代码大模型

机器之心报道 机器之心编辑部网友很好奇,Mathstral能不能搞定「9.11和9.9谁大」这一问题。昨天,AI圈竟然被「9.11和9.9谁大」这样简单的问题攻陷了,包括Ope...
阅读原文

CVPR'24:文生图提示词自动优化,还发现三个小窍门,人大度小满等机构出品

PAE团队 投稿至 凹非寺量子位 | 公众号 QbitAI文生图也有自己的prompt优化工具了。 我们都知道,大模型输出的质量,很大程度上依赖于输入的prompt。尤其在文...
阅读原文

ACM最新论文戳破大公司「开源」谎言,GenAI时代到底如何定义「开源模型」

新智元报道编辑:乔杨 【新智元导读】如何判断一个AI模型是否属于开源阵营?开源or闭源,到底哪种系统才更安全?最近,两位荷兰学者发表的一篇ACM FAccT论文...
阅读原文

单镜头16秒720p高清视频一键生成,开源版Sora又有新惊喜了

机器之心发布 机器之心编辑部潞晨 Open-Sora 团队在 720p 高清文生视频质量和生成时长上实现了突破性进展,支持无缝产出任意风格的高质量短片,令人惊喜的是...
阅读原文

大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度

机器之心发布 作者:李师尧(无问芯穹TechView)基于 Transformer架构的大型语言模型在各种基准测试中展现出优异性能,但数百亿、千亿乃至万亿量级的参数规模...
阅读原文

全球首个开源类Sora猛升级,16秒720p画质电影感拉满!代码权重全开源

新智元报道编辑:编辑部 【新智元导读】抢先OpenAI一步的「国产Sora」,再给开源社区带来亿点点震撼:权重代码全开源!16秒720p高清画质一键生成,人物渲染逼...
阅读原文
12347