标签:架构

贾扬清质疑 Groq CEO “其芯片价格接近免费”说法,前员工出来实锤:根本不切实际!

整理|冬梅、褚杏娟 在人工智能的世界里,正在发生一场翻天覆地的变化,随着 ChatGPT、Sora 的横空出世,我们正在从深度学习时代转向生成式人工智能时代,而...
阅读原文

Stable Diffusion 3 发布:模型与 Sora 同架构、解决文字乱码、更好理解物理世界

2月23日凌晨,Stability AI放出了Stable Diffusion 3.0,采用了和爆火Sora同样的DiT架构,画面质量、文字渲染、复杂对象理解大提升。 与SDXL、MidJourney和Da...
阅读原文

AI芯片黑马Groq走红,英伟达又多了一个挑战者|甲子光年

天下武功,唯快不破。作者|苏霍伊‍‍‍ 编辑|赵健 本周,一匹 AI 芯片黑马 Groq 在业内走红。 Groq 推出了一款全新的 AI 芯片 LPU(Language Processing Unit...
阅读原文

Stable Diffusion 3深夜横空出世!模型与Sora同架构,也能「理解」物理世界

新智元报道编辑:Aeneas 好困 【新智元导读】今日份炸弹又来了!深夜,Stability AI放出了Stable Diffusion 3.0,它采用了和爆火Sora同样的DiT架构,画面质量...
阅读原文

与Sora同架构的Stable Diffusion 3.0 震撼发布!4 秒视频生成却翻车,网友:还是等 Sora 吧!

编译 | Tina Stability AI 发布了 Stable Diffusion 3.0,这款图像生成 AI 模型再次刷新了人们的认知。 这款由 Stability AI 倾力打造的文本变图模型,可是迄...
阅读原文

Stable Diffusion 3震撼发布,采用Sora同源技术,文字终于不乱码了

机器之心报道 编辑:张倩、蛋酱Stable Diffusion 3 和 Sora 一样采用了 diffusion transformer 架构。 继 OpenAI 的 Sora 连续一周霸屏后,昨晚,生成式 AI ...
阅读原文

“打假”Sora,谷歌Gemini 1.5 Pro第一波评测出炉|甲子光年

Gemini 与 Sora 互相伤害。作者|刘杨楠 编辑|赵健 OpenAI 与谷歌同一天发布的两款 AI 模型正在“互相伤害”。 先是 OpenAI 的 “世界模拟器” Sora 完全抢走了...
阅读原文

10倍英伟达GPU:大模型专用芯片一夜成名,来自谷歌TPU创业团队

机器之心报道 编辑:泽南、蛋酱能带来完全不同的大模型体验。我们知道,大模型到 GPT-3.5 这种千亿体量以后,训练和推理的算力就不是普通创业公司所能承担的...
阅读原文

RNN模型挑战Transformer霸权!1%成本性能比肩Mistral-7B,支持100+种语言全球最多

新智元报道编辑:alan 【新智元导读】大模型内卷时代,也不断有人跳出来挑战Transformer的统治地位,RWKV最新发布的Eagle 7B模型登顶了多语言基准测试,同时...
阅读原文

PRO | 多模态趋势下,Transformer并非主流架构唯一解

2023年,几乎 AI 的每个领域都在以前所未有的速度进化,同时,AI也在不断地推动着具身智能、自动驾驶等关键赛道的技术边界。 多模态趋势下,Transformer 作为...
阅读原文

我们还需要Transformer中的注意力吗?

选自interconnects 作者:Nathan Lambert 机器之心编译 机器之心编辑部状态空间模型正在兴起,注意力是否已到尽头?最近几周,AI 社区有一个热门话题:用无注...
阅读原文

黄院士回应奥特曼7万亿芯片计划:笑了

鱼羊 克雷西 发自 凹非寺量子位 | 公众号 QbitAI前脚奥特曼刚被曝要筹7万亿美元,与英伟达争雄,重塑全球半导体格局。 后脚老黄还真回应了:老伙计,夸张了哈...
阅读原文

无注意力大模型Eagle7B:基于RWKV,推理成本降低10-100 倍

机器之心报道 编辑:陈萍Eagle 7B 可将推理成本降低 10-100 倍。在 AI 赛道中,与动辄上千亿参数的模型相比,最近,小模型开始受到大家的青睐。比如法国 AI ...
阅读原文

拳打Gen-2脚踢Pika,谷歌爆肝7个月祭出AI视频大模型!首提时空架构,时长史诗级延长

新智元报道编辑:编辑部 【新智元导读】爆肝7个月,谷歌祭出了AI视频大模型Lumiere,直接改变了游戏规则!全新架构让视频时长和一致性全面飞升,时长直接碾压...
阅读原文

MoE与Mamba强强联合,将状态空间模型扩展到数百亿参数

机器之心报道 编辑:Panda性能与 Mamba 一样,但所需训练步骤数却少 2.2 倍。状态空间模型(SSM)是近来一种备受关注的 Transformer 替代技术,其优势是能在...
阅读原文
18910111214