标签:模型
越过智算云发展拐点!解读天翼云智算服务,用“组合拳”突围大模型训推难题
▲头图由AI生成 天翼云万卡方案驱动万亿参数大模型训练 作者|香草 编辑|漠影 在大模型热潮的推动下,AI算力呈现出爆炸式的增长,为云计算行业带来新的机遇。 ...
70万人争先体验!视频生成新王者「可灵AI」又双叒升级了
机器之心报道 编辑:泽南、杜伟难不成,AI 生成短剧时代真的要来了? 最近,各路视频生成 AI 放出的 Demo 让人眼花缭乱。从玩梗图、拼长度再到讲究真实物理逻...
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
机器之心报道 编辑:陈陈2.4B 的 Memory3比更大的 LLM 和 RAG 模型获得了更好的性能。近年来,大型语言模型 (LLM) 因其非凡的性能而获得了前所未有的关注。然...
没想到!AlphaZero式树搜索也能用来增强大语言模型推理与训练
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
实习期间创下 Transformer,他说:当年整个 AI 圈都无法预见我们今天的高度
来源:AI 科技大本营(ID:rgznai100) 整理:王启隆 原文:https://www.youtube.com/watch?v=ZFmapxYBafY 写出 Transformer 论文的那八个人,如今都在干什么...
李彦宏再谈开源:开源模型是智商税,永远应该选择闭源模型|甲子光年
“今天无论是ChatGPT、还是文心一言等闭源模型,一定比开源模型更强大,推理成本更低。”在2024世界人工智能大会(WAIC 2024)期间,百度创始人、董事长兼首席...
大模型风口下,卷应用才有价值!首期 AIGC 实践案例集锦上线啦(免费下载)
2024 年过半,生成式 AI 已从最初的技术探索过渡到应用实践阶段。无论是国外的 OpenAI、谷歌、苹果等头部 AI 公司,还是国内的百度、阿里云、字节跳动、腾讯...
都说 RAG “烂大街”了,但为何深度应用寥寥无几?| 直播预告
大语言模型技术迅猛发展的脚步,正引领着信息检索技术进入一个新的纪元。在这一领域中,RAG 技术将传统信息检索技术与大语言模型技术相结合,为知识理解、知...
新架构RNN反超Transformer:每个隐藏状态都是一个模型,一作:从根本上改变语言模型
梦晨 发自 凹非寺量子位 | 公众号 QbitAI新架构,再次向Transformer发起挑战! 核心思想:将RNN中的隐藏状态换成可学习的模型。 甚至在测试时都可以学习,所...
无人车团队跨维进军好莱坞!推出电影级视觉AI特效,“新时代皮克斯”
一水 发自 凹非寺量子位 | 公众号 QbitAI好莱坞级视觉AI横空出世!一个demo已令网友疯狂~ 来,我们直接看视频: 以上来自Odyssey,能够打造好莱坞级山脉、平...
大模型最强架构TTT问世!斯坦福UCSD等5年磨一剑, 一夜Transformer
新智元报道编辑:编辑部 【新智元导读】超越Transformer和Mamba的新架构,刚刚诞生了。斯坦福UCSD等机构研究者提出的TTT方法,直接替代了注意力机制,语言模...
RAG微调Llama 3竟超越GPT-4!英伟达GaTech华人学者提出RankRAG框架
新智元报道编辑:乔扬好困 【新智元导读】来自佐治亚理工学院和英伟达的两名华人学者带队提出了名为RankRAG的微调框架,简化了原本需要多个模型的复杂的RAG流...
自动驾驶团队进军好莱坞?打造电影级Sora,Odyssey开启「荷马史诗」新篇章
新智元报道编辑:耳朵 【新智元导读】今日,Odyssey视觉AI发布预告,这款获得GV 900万美元种子资金的创新技术,旨在用AI技术讲好电影故事。具备强大的视觉内...
Meta新研究挑战CV领域基操:ViT根本不用patch,用像素做token效果更佳
新智元报道编辑:乔杨 【新智元导读】下一代视觉模型会摒弃patch吗?Meta AI最近发表的一篇论文就质疑了视觉模型中局部关系的必要性。他们提出了PiT架构,让T...
HyperAI超神经 x Apache|CommunityOverCode Asia 2024 AI 专题
7 月 28 日,Apache 将在杭州举办CommunityOverCode Asia 2024 的 AI 专题论坛,给大家带来 Apache 社区建设和发展的最新资讯和前沿实践。本次 CommunityOver...