标签:模型

大模型预测,下一个token何必是文字?

明敏 金磊 发自 凹非寺量子位 | 公众号 QbitAI太快了太快了… 大模型的生成技能,已经到了普通人看不懂的境界! 它可以根据用户过去5年的体检报告,生成未来第...
阅读原文

博鳌热议AI大模型,人民网报告梳理产业机遇:端云结合、芯片、开源

明敏 发自 凹非寺量子位 | 公众号 QbitAI中国大模型产业该怎么看? 最新权威参考来了。 博鳌亚洲论坛2024年年会期间,人民网正式发布《2024年中国AI大模型产...
阅读原文

马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4

丰色 西风 发自 凹非寺量子位 | 公众号 QbitAI就在刚刚,马斯克Grok大模型宣布重大升级。 难怪之前突然开源了Grok-1,因为他有更强的Grok-1.5了,主打推理能...
阅读原文

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt,连黑客帝国的都能数清楚

白交 发自 凹非寺量子位 | 公众号 QbitAI还记得黑客帝国经典的子弹时间吗? IDEA研究院最新检测模型T-Rex2,可以齐刷刷给全部识别出来~ 而面对难倒一众大模型...
阅读原文

Mamba架构第一次做大!混合Transformer,打败Transformer

丰色 发自 凹非寺量子位 | 公众号 QbitAI精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。 520亿参数,还是Mamba+Transformer混合架构。 它的名...
阅读原文

谁将取代 Transformer?

来源:AI科技评论 作者:张进( AI科技评论) 2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智能的一篇圣经,此后席卷全球的人工智能热潮...
阅读原文

马斯克官宣Grok-1.5!超GPT-4 16倍上下文,推理能力超DBRX,网友:赢在敢说!

作者 | 李忠良、褚杏娟、核子可乐引言:还记得 3 月 18 日,马斯克开源 Grok 的那一刻吗?如今,Grok 1.5 即将登场,其卓越的编码与数学处理能力、更深入的上...
阅读原文

再豪掷 198.8 亿元!亚马逊 30 年来最大手笔倾注 OpenAI 对家公司 Anthropic

整理 | 傅宇琪 当地时间 3 月 27 日,科技巨头亚马逊宣布,将向 AI 公司 Anthropic 追加投资 27.5 亿美元(约 198.8 亿人民币),以完成去年承诺的投资协议,...
阅读原文

Champ首发开源:人体视频生成新SOTA,5天斩获1k星,demo可玩

机器之心专栏 机器之心编辑部一张照片 + 一段视频,就能让照片活起来!近日,由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作 Champ 火爆全网。该...
阅读原文

AI创业吧!不缺计算资源那种

机器之心发布 机器之心编辑部大模型技术革命爆发一年多,对大众来说,大模型神秘的样子逐渐清晰,AI 创业也从兴奋期慢慢开始务实。 当前 AI 技术创业周期已经...
阅读原文

Attention isn’t all you need!Mamba混合大模型开源:三倍Transformer吞吐量

机器之心报道 编辑:小舟Mamba 时代来了? 自 2017 年开创性研究论文《Attention is All You Need》问世以来,transformer 架构就一直主导着生成式人工智能领...
阅读原文

马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文

机器之心报道 编辑:泽南马斯克搞大模型,速度也奇快。 Grok 1 开源才刚有 10 天,Grok 1.5 就来了。本周五早上,马斯克旗下的人工智能公司 xAI 正式推出了 G...
阅读原文

DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源

机器之心报道 编辑:杜伟DeepMind 这篇论文一出,人类标注者的饭碗也要被砸了吗? 大模型的幻觉终于要终结了? 今日,社媒平台 reddit 上的一则帖子引起网友...
阅读原文

只要千元级,人人可用百亿级多模态大模型!国产「AI模盒」秒级训练推理

新智元报道编辑:编辑部 【新智元导读】从今天起,千元级就能解锁专属大模型了!这款搭载首颗纯国产14nm Chiplet大模型推理芯片的「深目」AI模盒,可以轻松实...
阅读原文

Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文

新智元报道编辑:编辑部 【新智元导读】52B的生产级Mamba大模型来了!这个超强变体Jamba刚刚打破世界纪录,它能正面硬刚Transformer,256K超长上下文窗口,吞...
阅读原文