高效推理 - OpenI

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

10个月前

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

1年前 (2024)

MiniCPM 4.0

MiniCPM 4.0 是面壁智能推出的端侧大模型。模型分为 8B 和 0.5B 两种参数规模。8B 闪电稀疏版采用创新稀疏架构，能高效处理长文本任务；0.5B 版本以低计算资...

阅读原文

AI工具

6个月前

RF-DETR

RF-DETR是Roboflow推出的实时目标检测模型。RF-DETR是首个在COCO数据集上达到60+平均精度均值（mAP）的实时模型，性能优于现有的目标检测模型。RF-DETR结合LW...

阅读原文

AI工具

9个月前

无需训练让扩散模型提速2倍，上交大提出Token级缓存方案｜ICLR‘25

OpenSora/PixArt都能提速

阅读原文

AIGC动态

10个月前

超越DeepSeek推理，效率更高！斯坦福马腾宇新作：有限数据，无限迭代

原标题：超越DeepSeek推理，效率更高！斯坦福马腾宇新作：有限数据，无限迭代文章来源：新智元内容字数：5932字斯坦福大学提出自博弈定理证明器STP：解决大...

阅读原文

AIGC动态

10个月前

2025年大模型与Transformer架构：技术前沿与未来趋势报告

原标题：2025年大模型与Transformer架构：技术前沿与未来趋势报告文章来源：人工智能学家内容字数：24793字欧米伽未来研究所：Transformer架构的崛起与未来...

阅读原文

AIGC动态

11个月前

陈丹琦团队降本又来了：数据砍掉三分之一，性能却完全不减

首次用元数据加速预训练

阅读原文

AIGC动态

11个月前

开源推理模型阿里Marco-o1技术细节全面解读

OpenAI O1模型引发业界对大规模推理模型(large reasoning models ，LRM)研究的热潮。前文评测结果显示开源的Marco-o1效果不错，甚至超越部分闭源产品。今天这...

阅读原文

AIGC动态

11个月前

我与vLLM的2024：清华大佬的vLLM开发之路

也许二十年后再回首，我们会发现，现在我们就站在下一个“互联网级奇迹”的起点上。

阅读原文

AIGC动态

12个月前

水印与高效推理的悖论：理论揭示不可调和的

语言模型的「不可行」定理。

阅读原文

AIGC动态

1年前 (2024)

什么是模型压缩（Model Compression）

模型压缩（Model Compression）是指通过各种技术减小深度学习模型的大小和复杂度，便于在资源受限的设备上高效部署和运行。模型压缩包括权重量化、剪枝、知识...

阅读原文

AI百科

1年前 (2024)

标签：高效推理