标签：参数

挑战Scaling Law，Meta发布移动端350M小模型MobileLLM，性能比肩7B LLaMA-v2

新智元报道编辑：乔杨【新智元导读】Scaling Law还没走到尽头，「小模型」逐渐成为科技巨头们的追赶趋势。Meta最近发布的MobileLLM系列，规模甚至降低到了1B...

阅读原文

AIGC动态

2年前 (2024)

OpenAI 终于发布 GPT-4o mini，但比中国大模型晚了半年

OpenAI 的入局，更加验证了“小”模型的未来价值。作者 | 朱可轩、西西编辑 | 陈彩娴美国时间 7 月18 日，OpenAI 正式发布了多模态小模型 GPT-4o mini，在海...

阅读原文

AIGC动态

2年前 (2024)

基于华为昇腾推理引擎MindIE部署Qwen-72B实战

在华为昇腾LLM落地可选解决方案中，我们曾介绍过MindIE，并且前段时间MindIE 1.0.RC1已经发布，本文主要将对其进行实战演练。 01MindIE 简介MindIE（Mind Inf...

阅读原文

AIGC动态

2年前 (2024)

30B！每秒100tokens！这是AMD对AI PC的“幻想时间”

夕小瑶科技说原创作者 | 谷雨龙泽随着AI的高速发展，从去年开始，挂在服务器的云端AI模型已经不能满足技术发烧友的胃口了，AI PC应运而生。 AI PC就是内嵌个...

阅读原文

AIGC动态

2年前 (2024)

MoE也有Scaling Law，「百万专家」利用率近100%！DeepMind华人挑战MoE极限

新智元报道编辑：编辑部【新智元导读】MoE已然成为AI界的主流架构，不论是开源Grok，还是闭源GPT-4，皆是其拥趸。然而，这些模型的专家，最大数量仅有32个。...

阅读原文

AIGC动态

2年前 (2024)

快速迁移大模型到昇腾910B保姆级教程（Pytorch版）

7月11日19点，「智猩猩自动驾驶新青年讲座」第36讲将开讲，主讲理想汽车最新成果：基于MLLM的闭环规划智能体PlanAgent，由理想汽车实习研究员、中国科学院自...

阅读原文

AIGC动态

2年前 (2024)

Meta AI推出适用于移动设备的紧凑型语言模型

点击上方蓝字关注我们“Meta AI 推出 MobileLLM，一种为移动设备设计的高效语言模型。该模型通过优化参数，实现了与更大模型相当的性能，推动了 AI 模型小型化...

阅读原文

AIGC动态

2年前 (2024)

院士领衔推出大模型的第3种记忆：比参数存储和RAG都便宜，2.4B模型越级打13B

梦晨发自凹非寺量子位 | 公众号 QbitAI给大模型加上第三种记忆格式，把宝贵的参数从死记硬背知识中解放出来！中科院院士鄂维南领衔，上海算法创新研究院等...

阅读原文

AIGC动态

2年前 (2024)

又一家技术+产品双杀的大模型创业公司！一款测试，让其WAIC大会展位火爆

夕小瑶科技说原创作者 | 夕小瑶编辑部最近上海世界人工智能大会（WAIC）现场，一个国风展位前排起了长长的队伍，笔者忍不住好奇，究竟是什么新奇的东西吸引...

阅读原文

AIGC动态

2年前 (2024)

参数更新量仅为LoRA的5%，性能不减反升！南加大提出高效精调法LaMDA

夕小瑶科技说原创作者 | Axe_越万物负阴而抱阳，冲气以为和 ——《道德经·第四十二章》从Bert时代一路过来的朋友们应该还记得，对于仅仅只有1亿参数的Bert，...

阅读原文

AIGC动态

2年前 (2024)

Adam有了mini版：内存占用少一半，吞吐量提升50%

机器之心报道编辑：panda在训练大型语言模型（LLM）时，Adam(W) 基本上已经成为了人们默认使用的优化器。 Adam 尽管性能优异，但使用成本很高。具体来说，Ad...

阅读原文

AIGC动态

2年前 (2024)

今天，阶跃星辰正式发布万亿MoE大模型｜甲子光年

国产大模型跑出了“阶跃速度”。作者｜赵健今年的世界人工智能大会（WAIC），“大模型”含量极高，既有已发布模型的集中展示，也有大模型的首发亮相。其中，阶...

阅读原文

AIGC动态

2年前 (2024)

阶跃星辰首发「万亿」和「多模」大模型，还与《大闹天宫》跨界联动 | WAIC 2024

阶跃星辰再出王炸仅仅过去 100 天左右，站在 AGI 风口上的阶跃星辰再次亮出王炸成果。在今天揭幕的世界人工智能大会，阶跃星辰宣布对 Step 系列通用大模型...

阅读原文

AIGC动态

2年前 (2024)

如何通往AGI？阶跃星辰用万亿+多模交卷，三大模型亮相WAIC

微软前高管创业AGI，大模型创企“五虎”变“六杰”。作者|香草编辑|漠影随着大模型的智能水平迅速增长，科技圈对AGI（通用人工智能）将于几年内降临的预测声音...

阅读原文

AIGC动态

2年前 (2024)

上海WAIC大会现场“大闹天宫”：模型够猛，产品够酷，公司够强

衡宇发自凹非寺量子位 | 公众号 QbitAI今年上海世界人工智能大会，谁最受关注？展区现场，有个挤得水泄不通的互动—— 像孙猴子一样在全世界大闹天宫的AI大...

阅读原文

AIGC动态

2年前 (2024)

1 2 345 6…16