路由 - OpenI

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

9个月前

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

1年前 (2024)

腾讯混元又来开源，一出手就是最大MoE大模型

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

12个月前

深度揭秘：Meta工程师如何构建超大规模AI训练网络？

新智元报道编辑：乔杨【新智元导读】最近，Meta的多个工程团队联合发表了一篇论文，描述了在引入基于GPU的分布式训练时，他们如何为其「量身定制」专用的数...

阅读原文

AIGC动态

1年前 (2024)

华为GTS LocMoE+：高可扩展性亲和度 MoE 架构，低开销实现主动路由

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

1年前 (2024)

150B token从头训练，普林斯顿Meta发布完全可微MoE架构Lory

新智元报道编辑：乔杨好困【新智元导读】前几天，普林斯顿大学联合Meta在arXiv上发表了他们最新的研究成果——Lory模型，论文提出构建完全可微的MoE模型，是...

阅读原文

AIGC动态

1年前 (2024)

DeepMind升级Transformer，前向通过FLOPs最多可降一半

机器之心报道编辑：Panda W引入混合深度，DeepMind 新设计可大幅提升 Transformer 效率。Transformer 的重要性无需多言，目前也有很多研究团队致力于改进这...

阅读原文

AIGC动态

2年前 (2024)

打破MoE训练效率与性能瓶颈，华为盘古稀疏大模型全新架构LocMoE出炉

机器之心专栏机器之心编辑部2023 年 12 月，首个开源 MoE 大模型 Mixtral 8×7B 发布，在多种基准测试中，其表现近乎超越了 GPT-3.5 和 LLaMA 2 70B，而推理...

阅读原文

AIGC动态

2年前 (2024)

2080 Ti就能跑70B大模型，上交大新框架让LLM推理增速11倍

上交大IPADS实验室投稿量子位 | 公众号 QbitAI原本需要一张16万元的80G A100干的活，现在只需要一张不到2万元的24G 4090就够了！上海交大IPADS实验室推出的...

阅读原文

AIGC动态

2年前 (2023)

降本提效！阿里提出大模型集成新方法

夕小瑶科技说原创作者 | 智商掉了一地、Python随着对大型语言模型（LLM）研究的不断深入，越来越多的工作不再局限于模型本身的性能提升，而是更加关注如何在...

阅读原文

AIGC动态

2年前 (2023)

标签：路由