标签:模型压缩

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

开源推理模型阿里Marco-o1技术细节全面解读

OpenAI O1模型引发业界对大规模推理模型(large reasoning models ,LRM)研究的热潮。前文评测结果显示开源的Marco-o1效果不错,甚至超越部分闭源产品。今天这...
阅读原文

谈谈DeepSeek-v3提到的基础设施演进

DeepSeek-v3将算法与基础设施融合,推动硬件架构创新。
阅读原文

低精度只适用于未充分训练的LLM?腾讯提出LLM量化的scaling laws

本文介绍了一套针对于低比特量化的 scaling laws。
阅读原文

什么是模型量化(Model Quantization)

模型量化(Model Quantization)是深度学习模型优化中的一项关键技术,它通过减少模型参数的位宽来降低模型的存储和计算需求,从而提高模型在各种硬件平台上...
阅读原文

突破极限:LLM能力密度惊人翻倍的Densing法则揭秘

大模型不仅有Scaling Law,还有Densing Law
阅读原文

突破12%计算量限制:YOPO剪枝技术让模型性能大幅提升!

研究团队针对剪枝多模态大模型以实现高效计算的挑战进行了研究。
阅读原文