标签：权重

基于华为昇腾推理引擎MindIE部署Qwen-72B实战

在华为昇腾LLM落地可选解决方案中，我们曾介绍过MindIE，并且前段时间MindIE 1.0.RC1已经发布，本文主要将对其进行实战演练。 01MindIE 简介MindIE（Mind Inf...

阅读原文

AIGC动态

1年前 (2024)

Mistral AI两：7B数学推理专用、Mamba2架构代码大模型

机器之心报道机器之心编辑部网友很好奇，Mathstral能不能搞定「9.11和9.9谁大」这一问题。昨天，AI圈竟然被「9.11和9.9谁大」这样简单的问题攻陷了，包括Ope...

阅读原文

AIGC动态

1年前 (2024)

CVPR'24：文生图提示词自动优化，还发现三个小窍门，人大度小满等机构出品

PAE团队投稿至凹非寺量子位 | 公众号 QbitAI文生图也有自己的prompt优化工具了。我们都知道，大模型输出的质量，很大程度上依赖于输入的prompt。尤其在文...

阅读原文

AIGC动态

1年前 (2024)

ACM最新论文戳破大公司「开源」谎言，GenAI时代到底如何定义「开源模型」

新智元报道编辑：乔杨【新智元导读】如何判断一个AI模型是否属于开源阵营？开源or闭源，到底哪种系统才更安全？最近，两位荷兰学者发表的一篇ACM FAccT论文...

阅读原文

AIGC动态

1年前 (2024)

单镜头16秒720p高清视频一键生成，开源版Sora又有新惊喜了

机器之心发布机器之心编辑部潞晨 Open-Sora 团队在 720p 高清文生视频质量和生成时长上实现了突破性进展，支持无缝产出任意风格的高质量短片，令人惊喜的是...

阅读原文

AIGC动态

2年前 (2024)

大模型压缩量化方案怎么选？无问芯穹Qllm-Eval量化方案全面评估：多模型、多参数、多维度

机器之心发布作者：李师尧（无问芯穹TechView）基于 Transformer架构的大型语言模型在各种基准测试中展现出优异性能，但数百亿、千亿乃至万亿量级的参数规模...

阅读原文

AIGC动态

2年前 (2024)

全球首个开源类Sora猛升级，16秒720p画质电影感拉满！代码权重全开源

新智元报道编辑：编辑部【新智元导读】抢先OpenAI一步的「国产Sora」，再给开源社区带来亿点点震撼：权重代码全开源！16秒720p高清画质一键生成，人物渲染逼...

阅读原文

AIGC动态

2年前 (2024)

CVPR 2024 Highlight | 北航等发布「时间特征维护」：无需训练，极致压缩加速Diffusion

新智元报道编辑：LRST 好困【新智元导读】拯救4bit扩散模型精度，仅需时间特征维护——以超低精度量化技术重塑图像内容生成！近日，北航、莫纳什、UT Austin联...

阅读原文

AIGC动态

2年前 (2024)

新一轮「硬件彩票」：MatMul-free 会改变大模型的游戏规则吗？

机器之心PRO · 会员通讯 Week 24---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. 新一轮「硬件彩票」：MatMul-free 会改变大模型的游戏规...

阅读原文

AIGC动态

2年前 (2024)

手机流畅运行470亿大模型：上交大发布LLM手机推理框架PowerInfer-2，提速29倍

梦晨发自凹非寺量子位 | 公众号 QbitAI苹果一出手，在手机等移动设备上部署大模型不可避免地成为行业关注焦点。然而，目前在移动设备上运行的模型相对较小...

阅读原文

AIGC动态

2年前 (2024)

大模型国产化适配5-百度飞浆PaddleNLP大语言模型工具链总结

近年来，人工智能快速发展，成为全球最为前沿的科技领域；与此同时，也诞生了很多优秀的 AI 工具。比如：国外的 AI 工具 PyTorch 、TensorFlow等，国产 AI 工...

阅读原文

AIGC动态

2年前 (2024)

港大北航等1bit大模型引热议，IEEE刊物评“解决AI能源需求”！作者亲自解读在此

BiLLM团队发自凹非寺量子位 | 公众号 QbitAI极限量化，把每个参数占用空间压缩到1.1bit！ IEEE Spectrum专栏，一种名为BiLLM的训练后量化（PTQ）方法火了。...

阅读原文

AIGC动态

2年前 (2024)

从LLM中完全消除矩阵乘法，效果出奇得好，10亿参数跑在FPGA上接近大脑功耗

机器之心报道机器之心编辑部让语言模型「轻装上阵」。一直以来，矩阵乘法（MatMul）稳居神经网络操作的主导地位，其中很大原因归结为 GPU 专门针对 MatMul ...

阅读原文

AIGC动态

2年前 (2024)

面对质疑，奥特曼终于公开了OpenAI 前沿大模型安全架构

译者丨明知山策划丨褚杏娟在 OpenAI 和 Google DeepMind 员工联名发表公开信，呼吁重视人工智能技术带来严重风险的同一天，OpenAI 官博发布了一篇文章，公...

阅读原文

AIGC动态

2年前 (2024)

量化大模型退化严重？ETH北航字节推出LoRA新范式 | ICML 2024

QHT 投稿量子位 | 公众号 QbitAI大模型应用开卷，连一向保守的苹果，都已释放出发展端侧大模型的信号。问题是，大语言模型（LLM）卓越的表现取决于“力大砖飞...

阅读原文

AIGC动态

2年前 (2024)

1 234 5…8