标签：权重

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

10个月前

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

1年前 (2024)

大模型承重墙，去掉了就开始摆烂！苹果给出了「超级权重」

机器之心报道编辑：蛋酱、佳琪去掉一个「超权重」的影响，比去掉其他 7000 个离群值权重加起来还要严重。大模型的参数量越来越大，越来越聪明，但它们也越来...

阅读原文

AIGC动态

1年前 (2024)

Scaling Law或将终结？哈佛MIT预警：低精度量化已无路可走，重磅研究掀翻AI圈

新智元报道编辑：桃子 LRS 【新智元导读】哈佛斯坦福MIT等机构首次提出「精度感知」scaling law，揭示了精度、参数规模、数据量之间的统一关系。数据量增加，...

阅读原文

AIGC动态

1年前 (2024)

量化能让大模型“恢复记忆”，删掉的隐私版权内容全回来了，SU哈佛亚马逊最新研究引热议

西风发自凹非寺量子位 | 公众号 QbitAI4-bit量化，能让现有反学习/机器遗忘技术失灵！也就是大模型在人类要求下“假装”忘记了特定知识（版权、私人内容等）...

阅读原文

AIGC动态

1年前 (2024)

LLM 推理量化评估：FP8、INT8 与 INT4 的全面对比

大会预告12月5日-6日，2024中国生成式AI大会（上海站）将举办。上海科大助理教授、博导顾家远，腾讯优图实验室天衍研究中心负责人吴贤，银河通用机器人合伙人...

阅读原文

AIGC动态

1年前 (2024)

Scaling Laws终结，量化无用，AI大佬都在审视这篇论文

机器之心报道作者：泽南、小舟研究表明，你训练的 token 越多，你需要的精度就越高。最近几天，AI 社区都在讨论同一篇论文。 UCSD 助理教授 Dan Fu 说它指明...

阅读原文

AIGC动态

1年前 (2024)

50s完成7B模型量化，4bit达到新SOTA，大模型低比特量化有新招了 | NeurIPS 2024 Oral

DuQuant团队投稿量子位 | 公众号 QbitAI消除激活值(outliers)，大语言模型低比特量化有新招了—— 自动化所、清华、港城大团队最近有一篇论文入选了NeurIPS 20...

阅读原文

AIGC动态

1年前 (2024)

深入浅出Batch Size，对模型训练的影响分析

开讲预告11月7日晚7点，上海 AI Lab OpenGVLab 博士后研究员罗根，将以《Mono-InternVL: 突破原生多模态大模型性能瓶颈》为主题进行直播讲解，欢迎扫码报名~...

阅读原文

AIGC动态

1年前 (2024)

Meta开源首个量化模型Llama 3.2：减少40%内存，效率提升2倍以上

文章转载自公众号：AIGC开放社区，本文只做学术/技术分享，如有侵权，联系删文。全球社交巨头Meta开源了首个轻量级量化版模型Llama 3.2，一共有10亿和30亿两...

阅读原文

AIGC动态

1年前 (2024)

杰弗里·辛顿：从小语言到大语言，人工智能究竟如何理解人类？

来源：返朴演讲：杰弗里·辛顿翻译：陈国华（北京外国语大学外国语言研究所教授）2024 年 4 月 8 日辛顿获得尤利西斯奖章，以表彰他对计算机科学人工智能领...

阅读原文

AIGC动态

1年前 (2024)

至高 1.8 倍无损加速！互补量化方案的投机加速

夕小瑶科技说原创作者 | Juntao Zhao等本文作者来自香港大学和哈尔滨工业大学。其中共同第一作者分别为来自香港大学Netexplo实验室的博士生Juntao Zhao、She...

阅读原文

AIGC动态

1年前 (2024)

微软开源爆火1.58bit大模型推理框架！千亿参数模型量化后单CPU可跑，速度每秒5-7个token

西风发自凹非寺量子位 | 公众号 QbitAI微软开源1bit大模型推理框架！现在1000亿参数大模型量化后单CPU可跑，速度可达每秒5-7个token。比如在苹果M2新品上...

阅读原文

AIGC动态

1年前 (2024)

清华开源混合精度推理系统MixQ，实现大模型近无损量化并提升推理吞吐

PACMAN实验室投稿量子位 | 公众号 QbitAI一键部署LLM混合精度推理，端到端吞吐比AWQ最大提升6倍！清华大学计算机系PACMAN实验室发布开源混合精度推理系统——M...

阅读原文

AIGC动态

1年前 (2024)

不敢对比阿里Qwen2.5，Mistral“最强小模型”陷争议，欧洲的OpenAI也不Open了

梦晨发自凹非寺量子位 | 公众号 QbitAI欧洲的OpenAI，也不Open了。 Mistral AI发布自称“世界上最好的边缘模型”，却陷入质疑和争议。不仅因为这一次没有磁...

阅读原文

AIGC动态

1年前 (2024)

AI教父Hinton万字访谈: 人类可能只是AI演化过程中的一个过渡阶段

2023 年 5月份，Hinton 宣布离开谷歌，对于 AI 的一系列发言也引起了轩然大波。随后，在 5 月 3 日 MIT 的一场分享上，Hinton 比较完整地讲述了他对于 AI 的...

阅读原文

AIGC动态

1年前 (2024)

Sebastian Raschka最新博客：从头开始，用Llama 2构建Llama 3.2

机器之心报道编辑：蛋酱十天前的 Meta Connect 2024 大会上，开源领域迎来了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。两个版本都是纯文...

阅读原文

AIGC动态

1年前 (2024)

12 3…8