标签:架构
Attention isn’t all you need!Mamba混合大模型开源:三倍Transformer吞吐量
机器之心报道 编辑:小舟Mamba 时代来了? 自 2017 年开创性研究论文《Attention is All You Need》问世以来,transformer 架构就一直主导着生成式人工智能领...
Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文
新智元报道编辑:编辑部 【新智元导读】52B的生产级Mamba大模型来了!这个超强变体Jamba刚刚打破世界纪录,它能正面硬刚Transformer,256K超长上下文窗口,吞...
Databricks发布DBRX:性能超ChatGPT,为当前最强大开源模型
点击上方蓝字关注我们“Databricks推出DBRX,一款1320亿参数的开源AI模型,性能超越GPT-3.5。采用创新“专家混合”架构,DBRX在语言理解、编程和数学基准测试中...
谁将替代 Transformer?
非 Transformer 面临的共同考验依然是证明自己的天花板有多高。作者丨张进 编辑丨陈彩娴 2017年谷歌发表的论文《Attention Is All You Need》成为当下人工智...
史上最强 AI 芯片,到底强在哪?
这两天,我们再次回顾了黄仁勋在 GTC 2024 上的演讲,在对产品做更深一层的分析解读时,发现了一些当时熬夜忽略掉的亮点。 一是老黄的演讲风格,幽默、自然、...
苏妈现身北京,AMD喊出了AI PC Yes!
机器之心报道 作者:泽南面对生成式 AI 时代,AMD 已经准备好了一套从云到端的全方位算力体系。 这一次,苏姿丰来到国内,宣告了 AI PC 时代的到来。3 月 21 ...
英伟达B200打破摩尔定律!老黄顺便公开GPT-4的秘密
梦晨 克雷西 发自 凹非寺量子位 | 公众号 QbitAI整个AI圈最想知道的秘密,被老黄在PPT某页的小字里写出来了? 时隔两年,英伟达官宣新一代Blackwell架构,为A...
老黄炸场!深夜发布全球最强芯片B200!推理速度提升30倍
夕小瑶科技说 分享来源 | 量子位 AI春晚GTC开幕,皮衣老黄再次燃爆全场。 时隔两年,英伟达官宣新一代Blackwell架构,定位直指“新工业革命的引擎” ,“把AI扩...
英伟达吞噬世界!新架构超级GPU问世,AI算力一步提升30倍
机器之心报道 机器之心编辑部「这才是我理想中的 GPU。」—— 黄仁勋。「这不是演唱会。你们是来参加开发者大会的!」老黄出场时,现场爆发出了巨大的欢呼声。 ...
比 Sora DiT 架构早两个月的 U-ViT,由这家中国 AIGC 公司提出
CVPR2023 曾拒稿 OpeanAI 的 DiT,收录生数科技的 U-ViT。作者丨王悦 编辑丨陈彩娴 「Sora 出来之后,团队就开始连轴转,没休息过。」这是 AI 科技评论了解到...
清华系多模态大模型公司刚刚融了数亿元!放话“今年达到Sora效果”
衡宇 发自 凹非寺量子位 | 公众号 QbitAI清华系多模态大模型公司,又拿钱了! 生数科技,师出清华朱军团队,是国内最早布局多模态大模型的团队之一。 市场消...
Figure简历数量暴涨218%;阿里云成立联盟推进大模型应用;批准1030亿卢比AI项目丨AIGC大事日报
03/08 全球AIGC产业要闻 1、Inflection-2.5用40%计算量实现近GPT-4性能 2、谷歌新API实现手机PC大模型端侧运行 3、OpenAI CTO被曝是罢免事件关键人物 4、印度...
OpenAI调查结果将公示;创企一年前已发类Sora架构;Meta将推出巨型视频推荐模型丨AIGC大事日报
03/07 全球AIGC产业要闻 1、OpenAI将任命新董事 公示CEO罢免调查结果 2、曝创企一年前已发类Sora架构 3、智源提出通用计算机控制智能体框架Cradle 4、零一万...
比亚迪 168 万的仰望 U9 ,给了中国超跑一个答案
仰望 U9 另一种 超跑逻辑关于中国人自己造超跑这件事,我们总是怀着复杂的感情,既期待,又害怕。 期待的是,希望有车企能够摘下汽车工业王冠上的宝石,飞驰...
国内公司有望做出Sora吗?这支清华系大模型团队给出了希望
机器之心原创 作者:张倩在 Sora 代表的视频生成路线上,国内公司其实已有一定的技术储备。2023 年年底,很多人都预测,未来一年将是视频生成快速发展的一年...