标签：模型

越过智算云发展拐点！解读天翼云智算服务，用“组合拳”突围大模型训推难题

▲头图由AI生成天翼云万卡方案驱动万亿参数大模型训练作者|香草编辑|漠影在大模型热潮的推动下，AI算力呈现出爆炸式的增长，为云计算行业带来新的机遇。 ...

阅读原文

AIGC动态

2年前 (2024)

70万人争先体验！视频生成新王者「可灵AI」又双叒升级了

机器之心报道编辑：泽南、杜伟难不成，AI 生成短剧时代真的要来了？最近，各路视频生成 AI 放出的 Demo 让人眼花缭乱。从玩梗图、拼长度再到讲究真实物理逻...

阅读原文

AIGC动态

2年前 (2024)

鄂维南院士领衔新作：大模型不止有RAG、参数存储，还有第3种记忆

机器之心报道编辑：陈陈2.4B 的 Memory3比更大的 LLM 和 RAG 模型获得了更好的性能。近年来，大型语言模型 (LLM) 因其非凡的性能而获得了前所未有的关注。然...

阅读原文

AIGC动态

2年前 (2024)

没想到！AlphaZero式树搜索也能用来增强大语言模型推理与训练

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

实习期间创下 Transformer，他说：当年整个 AI 圈都无法预见我们今天的高度

来源：AI 科技大本营（ID：rgznai100）整理：王启隆原文：https://www.youtube.com/watch?v=ZFmapxYBafY 写出 Transformer 论文的那八个人，如今都在干什么...

阅读原文

AIGC动态

2年前 (2024)

李彦宏再谈开源：开源模型是智商税，永远应该选择闭源模型｜甲子光年

“今天无论是ChatGPT、还是文心一言等闭源模型，一定比开源模型更强大，推理成本更低。”在2024世界人工智能大会（WAIC 2024）期间，百度创始人、董事长兼首席...

阅读原文

AIGC动态

2年前 (2024)

大模型风口下，卷应用才有价值！首期 AIGC 实践案例集锦上线啦（免费下载）

2024 年过半，生成式 AI 已从最初的技术探索过渡到应用实践阶段。无论是国外的 OpenAI、谷歌、苹果等头部 AI 公司，还是国内的百度、阿里云、字节跳动、腾讯...

阅读原文

AIGC动态

2年前 (2024)

都说 RAG “烂大街”了，但为何深度应用寥寥无几？| 直播预告

大语言模型技术迅猛发展的脚步，正引领着信息检索技术进入一个新的纪元。在这一领域中，RAG 技术将传统信息检索技术与大语言模型技术相结合，为知识理解、知...

阅读原文

AIGC动态

2年前 (2024)

新架构RNN反超Transformer：每个隐藏状态都是一个模型，一作：从根本上改变语言模型

梦晨发自凹非寺量子位 | 公众号 QbitAI新架构，再次向Transformer发起挑战！核心思想：将RNN中的隐藏状态换成可学习的模型。甚至在测试时都可以学习，所...

阅读原文

AIGC动态

2年前 (2024)

无人车团队跨维进军好莱坞！推出电影级视觉AI特效，“新时代皮克斯”

一水发自凹非寺量子位 | 公众号 QbitAI好莱坞级视觉AI横空出世！一个demo已令网友疯狂~ 来，我们直接看视频：以上来自Odyssey，能够打造好莱坞级山脉、平...

阅读原文

AIGC动态

2年前 (2024)

大模型最强架构TTT问世！斯坦福UCSD等5年磨一剑，一夜Transformer

新智元报道编辑：编辑部【新智元导读】超越Transformer和Mamba的新架构，刚刚诞生了。斯坦福UCSD等机构研究者提出的TTT方法，直接替代了注意力机制，语言模...

阅读原文

AIGC动态

2年前 (2024)

RAG微调Llama 3竟超越GPT-4！英伟达GaTech华人学者提出RankRAG框架

新智元报道编辑：乔扬好困【新智元导读】来自佐治亚理工学院和英伟达的两名华人学者带队提出了名为RankRAG的微调框架，简化了原本需要多个模型的复杂的RAG流...

阅读原文

AIGC动态

2年前 (2024)

自动驾驶团队进军好莱坞？打造电影级Sora，Odyssey开启「荷马史诗」新篇章

新智元报道编辑：耳朵【新智元导读】今日，Odyssey视觉AI发布预告，这款获得GV 900万美元种子资金的创新技术，旨在用AI技术讲好电影故事。具备强大的视觉内...

阅读原文

AIGC动态

2年前 (2024)

Meta新研究挑战CV领域基操：ViT根本不用patch，用像素做token效果更佳

新智元报道编辑：乔杨【新智元导读】下一代视觉模型会摒弃patch吗？Meta AI最近发表的一篇论文就质疑了视觉模型中局部关系的必要性。他们提出了PiT架构，让T...

阅读原文

AIGC动态

2年前 (2024)

HyperAI超神经 x Apache｜CommunityOverCode Asia 2024 AI 专题

7 月 28 日，Apache 将在杭州举办CommunityOverCode Asia 2024 的 AI 专题论坛，给大家带来 Apache 社区建设和发展的最新资讯和前沿实践。本次 CommunityOver...

阅读原文

AIGC动态

2年前 (2024)

1…136 137138139 140…483