标签:权重
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
大模型承重墙,去掉了就开始摆烂!苹果给出了「超级权重」
机器之心报道 编辑:蛋酱、佳琪去掉一个「超权重」的影响,比去掉其他 7000 个离群值权重加起来还要严重。大模型的参数量越来越大,越来越聪明,但它们也越来...
Scaling Law或将终结?哈佛MIT预警:低精度量化已无路可走,重磅研究掀翻AI圈
新智元报道编辑:桃子 LRS 【新智元导读】哈佛斯坦福MIT等机构首次提出「精度感知」scaling law,揭示了精度、参数规模、数据量之间的统一关系。数据量增加,...
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了,SU哈佛亚马逊最新研究引热议
西风 发自 凹非寺量子位 | 公众号 QbitAI4-bit量化,能让现有反学习/机器遗忘技术失灵! 也就是大模型在人类要求下“假装”忘记了特定知识(版权、私人内容等)...
LLM 推理量化评估:FP8、INT8 与 INT4 的全面对比
大会预告12月5日-6日,2024中国生成式AI大会(上海站)将举办。上海科大助理教授、博导顾家远,腾讯优图实验室天衍研究中心负责人吴贤,银河通用机器人合伙人...
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文
机器之心报道 作者:泽南、小舟研究表明,你训练的 token 越多,你需要的精度就越高。最近几天,AI 社区都在讨论同一篇论文。 UCSD 助理教授 Dan Fu 说它指明...
50s完成7B模型量化,4bit达到新SOTA,大模型低比特量化有新招了 | NeurIPS 2024 Oral
DuQuant团队 投稿量子位 | 公众号 QbitAI消除激活值(outliers),大语言模型低比特量化有新招了—— 自动化所、清华、港城大团队最近有一篇论文入选了NeurIPS 20...
深入浅出Batch Size,对模型训练的影响分析
开讲预告11月7日晚7点,上海 AI Lab OpenGVLab 博士后研究员罗根,将以《Mono-InternVL: 突破原生多模态大模型性能瓶颈》为主题进行直播讲解,欢迎扫码报名~...
Meta开源首个量化模型Llama 3.2:减少40%内存,效率提升2倍以上
文章转载自公众号:AIGC开放社区,本文只做学术/技术分享,如有侵权,联系删文。 全球社交巨头Meta开源了首个轻量级量化版模型Llama 3.2,一共有10亿和30亿两...
杰弗里·辛顿:从小语言到大语言,人工智能究竟如何理解人类?
来源:返朴 演讲:杰弗里·辛顿 翻译:陈国华(北京外国语大学外国语言研究所教授)2024 年 4 月 8 日辛顿获得尤利西斯奖章,以表彰他对计算机科学人工智能领...
至高 1.8 倍无损加速!互补量化方案的投机加速
夕小瑶科技说 原创作者 | Juntao Zhao等本文作者来自香港大学和哈尔滨工业大学。其中共同第一作者分别为来自香港大学Netexplo实验室的博士生Juntao Zhao、She...
微软开源爆火1.58bit大模型推理框架!千亿参数模型量化后单CPU可跑,速度每秒5-7个token
西风 发自 凹非寺量子位 | 公众号 QbitAI微软开源1bit大模型推理框架! 现在1000亿参数大模型量化后单CPU可跑,速度可达每秒5-7个token。 比如在苹果M2新品上...
清华开源混合精度推理系统MixQ,实现大模型近无损量化并提升推理吞吐
PACMAN实验室投稿量子位 | 公众号 QbitAI一键部署LLM混合精度推理,端到端吞吐比AWQ最大提升6倍! 清华大学计算机系PACMAN实验室发布开源混合精度推理系统——M...
不敢对比阿里Qwen2.5,Mistral“最强小模型”陷争议,欧洲的OpenAI也不Open了
梦晨 发自 凹非寺量子位 | 公众号 QbitAI欧洲的OpenAI,也不Open了。 Mistral AI发布自称“世界上最好的边缘模型”,却陷入质疑和争议。 不仅因为这一次没有磁...
AI教父Hinton万字访谈: 人类可能只是AI演化过程中的一个过渡阶段
2023 年 5月份,Hinton 宣布离开谷歌,对于 AI 的一系列发言也引起了轩然大波。随后,在 5 月 3 日 MIT 的一场分享上,Hinton 比较完整地讲述了他对于 AI 的...
Sebastian Raschka最新博客:从头开始,用Llama 2构建Llama 3.2
机器之心报道 编辑:蛋酱十天前的 Meta Connect 2024 大会上,开源领域迎来了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。两个版本都是纯文...