首个开源MoE大模型发布！7Bx8个专家，离GPT-4最近的一集

AIGC动态2年前 (2023)发布量子位

352 0 0

首个开源MoE大模型发布！7Bx8个专家，离GPT-4最近的一集

AIGC动态欢迎阅读

原标题：首个开源MoE大模型发布！7Bx8个专家，离GPT-4最近的一集

关键字：模型,磁力,链接,专家,对比

文章来源：量子位

内容字数：3370字

内容摘要：梦晨发自凹非寺量子位 | 公众号 QbitAI“取消今晚所有计划！”，许多AI开发者决定不睡了。只因首个开源MoE大模型刚刚由Mistral AI发布。MoE架构全称专家混合（Mixture-of-Experts），也就是传闻中GPT-4采用的方案，可以说这是开源大模型离GPT-4最近的一集了。没有发布会、没有宣传视频，只靠一个磁力链接，就产生如此轰动效果。具体参数还得是网速快的人下载完之后，从配置文件里截图发出来的：7B参数x8个专家，对每个token选择前两个最相关的专家来处理。以至于OpenAI创始成员Karpathy都吐槽，是不是少了点什么？怎么缺了一个那种排练很多次的专业范视频，大谈特谈AI变革啊。至于吐槽的是谁，懂得都懂了。以及他还解释了为什么AI社区这几天如此活跃：最大的深度学习会议NeurIPS即将在下周开启。MoE，开源大模型新阶段？为何这款开源MoE模型如此受关注？…

原文链接：点此阅读原文：首个开源MoE大模型发布！7Bx8个专家，离GPT-4最近的一集

联系作者

文章来源：量子位

作者微信：QbitAI

作者简介：追踪人工智能新趋势，关注科技行业新突破

# AIGC动态 # 专家 # 对比 # 模型 # 磁力 # 链接

© 版权声明

文章版权归作者所有，未经允许请勿转载。

蝉镜AI数字人

相关文章

唯一答对“strawberry中有几个r”的开源项目，被我找到了！

夕小瑶科技说

993

清华SuperBench全球测评出炉，Claude 3拿下多个冠军！合成数据才是人类未来？

543

小时级的长视频生成！浙江大学发布MovieDreamer，AI电影时代到来了？

夕小瑶科技说

436

小模型如何进行上下文学习？字节跳动 & 华东师大联合提出自进化文本识别器

316

1亿参数的细胞大模型来了！登Nature子刊，清华大学团队发布scFoundation：对2万基因同时建模

HyperAI超神经

642

0.36秒即可完成一次高分辨率全球海洋预报！国防科技大学推出「羲和」大模型，性能超越主流数值预报系统，预报时长可达30天

HyperAI超神经

630

蝉镜AI数字人

暂无评论

暂无评论...