标签:架构

Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的

新智元报道编辑:乔杨 【新智元导读】最近,Latent Space发布的播客节目中请来了Meta的AI科学家Thomas Scialom。他在节目中揭秘了Llama 3.1的一些研发思路,...
阅读原文

视频生成产品 PixVerse 版本大更新!支持一键生成5段、最长 40S 连续视频

今年6 月份起,视频生成赛道持续涌现新的产品,从可灵到 Luma、Runway Gen3,模型能力和产品化效果越来越卷。 7 月 24 日,爱诗科技正式发布视频生成产品 Pix...
阅读原文

挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2

新智元报道编辑:乔杨 【新智元导读】Scaling Law还没走到尽头,「小模型」逐渐成为科技巨头们的追赶趋势。Meta最近发布的MobileLLM系列,规模甚至降低到了1B...
阅读原文

前谷歌科学家Yi Tay「LLM演义」系列博客第一弹:BERT为何匿迹江湖?

新智元报道编辑:庸庸 乔杨 【新智元导读】前谷歌科学家Yi Tay重磅推出「LLM时代的模型架构」系列博客,首篇博文的话题关于:基于encoder-only架构的BERT是如...
阅读原文

Mamba写代码真的超越Transformer!原始论文入选顶流新会议

西风 发自 凹非寺量子位 | 公众号 QbitAI“欧洲OpenAI”和“Transformer挑战者”强强联合了! Mistral AI刚刚推出了其第一个基于Mamba2架构的开源模型——Codestral...
阅读原文

原作亲自下场!Mistral首款开源7B Mamba模型「埃及艳后」效果惊艳

新智元报道编辑:编辑部 【新智元导读】最近,7B小模型又成为了AI巨头们竞相追赶的潮流。继谷歌的Gemma2 7B后,Mistral今天又发布了两个7B模型,分别是针对ST...
阅读原文

Mistral AI两连发:7B数学推理专用、Mamba2架构代码大模型

机器之心报道 机器之心编辑部网友很好奇,Mathstral能不能搞定「9.11和9.9谁大」这一问题。昨天,AI圈竟然被「9.11和9.9谁大」这样简单的问题攻陷了,包括Ope...
阅读原文

首款采用 AMD 技术的 AI PC 即将登场

联合变局 x86 进军 AI PC 时代五月,微软向全世界介绍了一个专为 AI 体验而设计的全新 Windows PC 品类:Windows 11 AI + PC,并将其描述为更快、更智能的 Wi...
阅读原文

神经网络架构「殊途同归」?ICML 2024论文:模型不同,但学习内容相同

新智元报道编辑:乔杨 【新智元导读】深度神经网络有多种规模和架构,大家普遍认为这会影响到模型学习到的抽象表示。然而,UCL两位学者发表在ICML 2024上第一...
阅读原文

Mamba真比Transformer更优吗?Mamba原作者:两个都要!混合架构才是最优解

新智元报道编辑:乔杨 【新智元导读】Mamba模型由于匹敌Transformer的巨大潜力,在推出半年多的时间内引起了巨大关注。但在大规模预训练的场景下,这两个架构...
阅读原文

H100利用率飙升至75%!英伟达亲自下场FlashAttention三代升级,比标准注意力快16倍

明敏 克雷西 发自 凹非寺量子位 | 公众号 QbitAI大模型训练推理神作,又更新了! 主流大模型都在用的FlashAttention,刚刚升级第三代。 时隔一年,FlashAtten...
阅读原文

英伟达AMD差点合并,老黄提了个条件,结果黄了

西风 发自 凹非寺量子位 | 公众号 QbitAI在AI浪潮中赢麻了的英伟达,如今市值已达3.1万亿,远超另外两家芯片巨头AMD和英特尔。 但一则内幕爆料引起热议: 英...
阅读原文

100天后,阶跃星辰交出了第二份答卷

从「走路入场」到「跑步前进」,阶跃星辰要加速奔向AGI了。作者|房晓楠 编辑|陈彩娴 今年 3 月,「借着」 2024 全球开发者先锋大会的场子,「国内最后一家...
阅读原文

Llama也能做图像生成!港大字节推出开源自回归文生图模型,在线体验已开放

LlamaGen团队 投稿量子位 | 公众号 QbitAI只需Image Tokenizer,Llama也能做图像生成了,而且效果超过了扩散模型。 来自港大和字节的研究人员,提出了基于自...
阅读原文

​端侧模型打响突围战!VC 疯抢,又一创企“杀”出

6 月,三笔巨额融资掀开大模型战事新篇章。 前脚,加拿大 Cohere 以 50 亿美元估值揽获 4.5 亿美元融资,英伟达、思科助力;后脚,法国 Mistral AI 喜提 6 亿...
阅读原文
1234513