标签：模型

大模型预测，下一个token何必是文字？

明敏金磊发自凹非寺量子位 | 公众号 QbitAI太快了太快了… 大模型的生成技能，已经到了普通人看不懂的境界！它可以根据用户过去5年的体检报告，生成未来第...

阅读原文

AIGC动态

2年前 (2024)

博鳌热议AI大模型，人民网报告梳理产业机遇：端云结合、芯片、开源

明敏发自凹非寺量子位 | 公众号 QbitAI中国大模型产业该怎么看？最新权威参考来了。博鳌亚洲论坛2024年年会期间，人民网正式发布《2024年中国AI大模型产...

阅读原文

AIGC动态

2年前 (2024)

马斯克突发Grok 1.5！上下文长度至128k、HumanEval得分超GPT-4

丰色西风发自凹非寺量子位 | 公众号 QbitAI就在刚刚，马斯克Grok大模型宣布重大升级。难怪之前突然开源了Grok-1，因为他有更强的Grok-1.5了，主打推理能...

阅读原文

AIGC动态

2年前 (2024)

吉娃娃or松饼难题被解决！IDEA研究院新模型打通文本视觉Prompt，连黑客帝国的都能数清楚

白交发自凹非寺量子位 | 公众号 QbitAI还记得黑客帝国经典的子弹时间吗？ IDEA研究院最新检测模型T-Rex2，可以齐刷刷给全部识别出来~ 而面对难倒一众大模型...

阅读原文

AIGC动态

2年前 (2024)

Mamba架构第一次做大！混合Transformer，打败Transformer

丰色发自凹非寺量子位 | 公众号 QbitAI精彩精彩，第一个把爆火Mamba架构真正扩展到足够大的工作来了。 520亿参数，还是Mamba+Transformer混合架构。它的名...

阅读原文

AIGC动态

2年前 (2024)

谁将取代 Transformer？

来源：AI科技评论作者：张进（ AI科技评论） 2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智能的一篇圣经，此后席卷全球的人工智能热潮...

阅读原文

AIGC动态

2年前 (2024)

马斯克官宣Grok-1.5！超GPT-4 16倍上下文，推理能力超DBRX，网友：赢在敢说！

作者 | 李忠良、褚杏娟、核子可乐引言：还记得 3 月 18 日，马斯克开源 Grok 的那一刻吗？如今，Grok 1.5 即将登场，其卓越的编码与数学处理能力、更深入的上...

阅读原文

AIGC动态

2年前 (2024)

再豪掷 198.8 亿元！亚马逊 30 年来最大手笔倾注 OpenAI 对家公司 Anthropic

整理 | 傅宇琪当地时间 3 月 27 日，科技巨头亚马逊宣布，将向 AI 公司 Anthropic 追加投资 27.5 亿美元（约 198.8 亿人民币），以完成去年承诺的投资协议，...

阅读原文

AIGC动态

2年前 (2024)

AI创业吧！不缺计算资源那种

机器之心发布机器之心编辑部大模型技术革命爆发一年多，对大众来说，大模型神秘的样子逐渐清晰，AI 创业也从兴奋期慢慢开始务实。当前 AI 技术创业周期已经...

阅读原文

AIGC动态

2年前 (2024)

Attention isn’t all you need！Mamba混合大模型开源：三倍Transformer吞吐量

机器之心报道编辑：小舟Mamba 时代来了？自 2017 年开创性研究论文《Attention is All You Need》问世以来，transformer 架构就一直主导着生成式人工智能领...

阅读原文

AIGC动态

2年前 (2024)

马斯克大模型Grok1.5来了：推理能力大升级，支持128k上下文

机器之心报道编辑：泽南马斯克搞大模型，速度也奇快。 Grok 1 开源才刚有 10 天，Grok 1.5 就来了。本周五早上，马斯克旗下的人工智能公司 xAI 正式推出了 G...

阅读原文

AIGC动态

2年前 (2024)

DeepMind终结大模型幻觉？标注事实比人类靠谱、还便宜20倍，全开源

机器之心报道编辑：杜伟DeepMind 这篇论文一出，人类标注者的饭碗也要被砸了吗？大模型的幻觉终于要终结了？今日，社媒平台 reddit 上的一则帖子引起网友...

阅读原文

AIGC动态

2年前 (2024)

Champ首发开源：人体视频生成新SOTA，5天斩获1k星，demo可玩

机器之心专栏机器之心编辑部一张照片 + 一段视频，就能让照片活起来！近日，由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作 Champ 火爆全网。该...

阅读原文

AIGC动态

2年前 (2024)

只要千元级，人人可用百亿级多模态大模型！国产「AI模盒」秒级训练推理

新智元报道编辑：编辑部【新智元导读】从今天起，千元级就能解锁专属大模型了！这款搭载首颗纯国产14nm Chiplet大模型推理芯片的「深目」AI模盒，可以轻松实...

阅读原文

AIGC动态

2年前 (2024)

Mamba超强进化体一举颠覆Transformer！单张A100跑140K上下文

新智元报道编辑：编辑部【新智元导读】52B的生产级Mamba大模型来了！这个超强变体Jamba刚刚打破世界纪录，它能正面硬刚Transformer，256K超长上下文窗口，吞...

阅读原文

AIGC动态

2年前 (2024)

1…264 265266267 268…483