模型压缩 - OpenI

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

1年前 (2025)

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

2年前 (2024)

Pocket Flow

Pocket Flow 是极简的 LLM（大型语言模型）框架，仅用 100 行代码实现，具有轻量级、无依赖、无厂商锁定的特点。Pocket Flow支持多Agents、工作流、检索增强...

阅读原文

AI工具

1年前 (2025)

360AI推出DiT架构下"省钱版"ControlNet, 参数量骤减85%性能达到SOTA！

性能超过OminiControl

阅读原文

AIGC动态

1年前 (2025)

无需训练让扩散模型提速2倍，上交大提出Token级缓存方案｜ICLR‘25

OpenSora/PixArt都能提速

阅读原文

AIGC动态

1年前 (2025)

何恺明ResNet级神作，分形生成模型计算效率狂飙4000倍！清华校友一作

原标题：何恺明ResNet级神作，分形生成模型计算效率狂飙4000倍！清华校友一作文章来源：新智元内容字数：10734字何恺明团队提出分形生成模型：AI图像生成新...

阅读原文

AIGC动态

1年前 (2025)

稀疏注意力再添一员，华为诺亚推出高效选择注意力架构ESA

为大模型在长序列任务中的应用带来了新的可能性。

阅读原文

AIGC动态

1年前 (2025)

开源赛道太挤了！月之暗面开源新版Muon优化器

又「撞车」了。

阅读原文

AIGC动态

1年前 (2025)

1/30训练步骤复刻DeepSeek-R1-Zero，沈向洋姜大昕张祥雨等开源推理模型RL训练方法

复杂奖励函数不是必要的

阅读原文

AIGC动态

1年前 (2025)

比知识蒸馏好用，田渊栋等提出连续概念混合，再度革新Transformer预训练框架

让训练token骤减！

阅读原文

AIGC动态

1年前 (2025)

Sebastian Raschka：关于DeepSeek R1和推理模型，我有几点看法

构建和优化推理模型的方法和策略。

阅读原文

AIGC动态

1年前 (2025)

4000字！深度解析 DeepSeek 的蒸馏技术

深入剖析DeepSeek蒸馏技术的核心原理、创新策略以及未来发展方向

阅读原文

AIGC动态

1年前 (2025)

吴恩达力挺DeepSeek：开源降本30倍，AI格局生变

原标题：吴恩达力挺DeepSeek：开源降本30倍，AI格局生变文章来源：AI范儿内容字数：4063字DeepSeek引发的AI领域震荡：吴恩达解读及行业影响近日，中国AI...

阅读原文

AIGC动态

1年前 (2025)

2025年大模型与Transformer架构：技术前沿与未来趋势报告

原标题：2025年大模型与Transformer架构：技术前沿与未来趋势报告文章来源：人工智能学家内容字数：24793字欧米伽未来研究所：Transformer架构的崛起与未来...

阅读原文

AIGC动态

2年前 (2025)

仅8个月就把GPT-4o带到了端侧，面壁智能拿到了什么秘籍？｜甲子光年

端侧GPT-4o水平模型，成色如何？

阅读原文

AIGC动态

2年前 (2025)

从infra的视角聊聊DeepSeek-V3

从infra的视角分享一些个人看法

阅读原文

AIGC动态

2年前 (2025)

「知识蒸馏+持续学习」最新综述！哈工大、中科院出品：全新分类体系，十大数据集全面实验

原标题：「知识蒸馏+持续学习」最新综述！哈工大、中科院出品：全新分类体系，十大数据集全面实验文章来源：新智元内容字数：14584字知识蒸馏在持续学习中...

阅读原文

AIGC动态

2年前 (2025)

标签：模型压缩