大小 - OpenI

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

9个月前

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

1年前 (2024)

vLLM vs TensorRT-LLM 性能对比测试，基于0910较新版本

大会预告12月5日-6日，2024中国生成式AI大会（上海站）将举办。上海科大助理教授、博导顾家远，腾讯优图实验室天衍研究中心负责人吴贤，银河通用机器人合伙人...

阅读原文

AIGC动态

12个月前

深入浅出Batch Size，对模型训练的影响分析

开讲预告11月7日晚7点，上海 AI Lab OpenGVLab 博士后研究员罗根，将以《Mono-InternVL: 突破原生多模态大模型性能瓶颈》为主题进行直播讲解，欢迎扫码报名~...

阅读原文

AIGC动态

1年前 (2024)

NeurIPS 2024 | 大模型的词表大小，同样适用于Scaling Law

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

1年前 (2024)

数据集汇总｜18个电影/音乐数据集汇总，覆盖影片/歌曲推荐、电影评价、歌词识别、音乐流派······

作者：李姝编辑：李宝珠 HyperAI超神经 (hyper.ai) 为大家汇总了电影与音乐相关的数据集，覆盖电影/音乐推荐、电影预测、歌词识别等各个方面，纯干货技术分...

阅读原文

AIGC动态

1年前 (2024)

图解大模型训练之：流水线并行，以GPipe为例

回顾ChatGPT的发展历程，我们可以总结出大语言模型（LLM）取得惊艳效果的要点（重要性从高到低排序）：愿意烧钱，且接受“烧钱 != 好模型”的现实高质量的训...

阅读原文

AIGC动态

1年前 (2024)

图解大模型训练之：流水线并行，以GPipe为例

回顾ChatGPT的发展历程，我们可以总结出大语言模型（LLM）取得惊艳效果的要点（重要性从高到低排序）：愿意烧钱，且接受“烧钱 != 好模型”的现实高质量的训...

阅读原文

AIGC动态

1年前 (2024)

图解大模型训练之：流水线并行，以GPipe为例

回顾ChatGPT的发展历程，我们可以总结出大语言模型（LLM）取得惊艳效果的要点（重要性从高到低排序）：愿意烧钱，且接受“烧钱 != 好模型”的现实高质量的训...

阅读原文

AIGC动态

1年前 (2024)

Mistral多模态大模型来了！120亿参数，原生支持任意大小/数量图像，公司估值已达420亿

明敏发自凹非寺量子位 | 公众号 QbitAIMistral的多模态大模型来了！ Pixtral 12B正式发布，同时具备语言和视觉处理能力。它建立在文本模型Nemo 12B基础上...

阅读原文

AIGC动态

1年前 (2024)

数据集汇总丨萝卜快跑明年盈利？自动驾驶开启「端到端」新时代，高质量数据集助力 AI 大模型上车

作者：李姝编辑：李姝自动驾驶开启「端到端」新时代，高质量数据集扮演重要角色。对此，HyperAI超神经为大家汇总了热门开源的自动驾驶数据集，快来收藏使用...

阅读原文

AIGC动态

1年前 (2024)

MoE也有Scaling Law，「百万专家」利用率近100%！DeepMind华人挑战MoE极限

新智元报道编辑：编辑部【新智元导读】MoE已然成为AI界的主流架构，不论是开源Grok，还是闭源GPT-4，皆是其拥趸。然而，这些模型的专家，最大数量仅有32个。...

阅读原文

AIGC动态

1年前 (2024)

开发者狂喜！Meta最新发布的LLM Compiler，实现77%自动调优效率

机器之心报道编辑：山茶花Meta搞了个很牛的LLM Compiler，帮助程序员更高效地写代码。昨天，三大 AI 巨头 OpenAI、Google、Meta 组团发布自家大模型最新研究...

阅读原文

AIGC动态

1年前 (2024)

Intel入局大模型，烧钱搜索130亿种网络结构，让LLaMa2瘦身30%

夕小瑶科技说原创作者 | 任同学大语言模型在多个领域大放异彩，但它们的高内存和计算成本限制了广泛使用。神经架构搜索（NAS）能自动找到最优模型架构，减少...

阅读原文

AIGC动态

1年前 (2024)

用神经架构搜索给LLM瘦身，模型变小，准确度有时反而更高

机器之心报道编辑：Panda用神经架构搜索给 LLM 瘦身，同等准确度可让 LLaMA2-7B 模型大小降 2 倍。大型语言模型（LLM）的一个主要特点是「大」，也因此其训...

阅读原文

AIGC动态

1年前 (2024)

【图像分割数据集汇总】字节发布 COCONut 入选 CVPR 2024，立即体验 Segment Anything 分割万物！

随着计算机视觉技术的不断发展，图像分割在诸多领域展现出重要的应用价值。近年来，各种图像分割数据集如雨后春笋般涌现。上个月，字节跳动发布了首个大规模...

阅读原文

AIGC动态

2年前 (2024)

大模型一定就比小模型好？谷歌的这项研究说不一定

机器之心报道编辑：Panda在这个大模型不断创造新成就的时代，我们通常对机器学习模型有一个直观认知：越大越好。但事实果真如此吗？近日，Google Research ...

阅读原文

AIGC动态

2年前 (2024)

标签：大小