标签:架构

杨立昆教授关于通用人工智能世界模型JEPA观点及争议

-本篇附录杨立昆教授世界模型JEPA论文摘要简介和争议背景,全文将在下一篇播出,论文全文约有4.6万字。‍‍‍‍‍‍ 目录 1世界模型JEPA观点及争议背景 2编译作者观...
阅读原文

MoE 高效训练的 A/B 面:与魔鬼做交易,用「显存」换「性能」

在高效训练与高显存占用之间横跳的 MoE,更像是一门妥协的艺术。作者|房晓楠 编辑|陈彩娴 MoE 会成为未来大模型训练的新方向吗? 这是人们发现 MoE 架构可...
阅读原文

Meta首席科学家:不要从事LLM研究!它已经被大公司主导

点击上方蓝字关注我们“摘要:在巴黎VivaTech科技盛会上,Meta AI首席Yann LeCun建议学生不要专注于大型语言模型(LLMs)的研究,并鼓励开发新一代人工智能系...
阅读原文

创业总结!大模型RAG系统三个月的开发心得和思考

直播预告 | 5月28日10点,「智猩猩AI新青年讲座」第236讲正式开讲,密歇根大学安娜堡分校在读博士生张挥杰将直播讲解《利用多级框架和多解码器架构提高扩散模...
阅读原文

Scaling Law的尽头是什么?|甲子引力X

大模型的“摩尔定律”。2024年5月15日,由中国科技产业智库「甲子光年」主办、中关村东升科学城协办的「AI创生时代——2024甲子引力X科技产业新风向」大会在北京...
阅读原文

利用多级框架和多解码器架构提高扩散模型训练效率 | 密歇根大学安娜堡分校在读博士张挥杰主讲

「智猩猩AI新青年讲座」由智猩猩出品,致力于邀请青年学者,主讲他们在生成式AI、LLM、AI Agent、CV等人工智能领域的最新重要研究成果。 AI新青年是加速人工...
阅读原文

英伟达股价首次破1000美元!黄仁勋:Token生意将创造100万亿价值

明敏 发自 凹非寺量子位 | 公众号 QbitAI英伟达股价,盘后首次冲破1000美元大关! 随着本财年第一季度财报公布,多项业绩数据超出预期。盘后英伟达股价暴涨6%...
阅读原文

微软一夜干翻苹果Mac!GPT-4o装进全家桶,微软把全世界PC都AI了

新智元报道编辑:编辑部 【新智元导读】微软昨夜首发Copilot+ PC,直接把钢铁侠的Jarvis带进现实!全新NPU架构,配上地表最强GPT-4o等40+模型,让Windows PC...
阅读原文

GPT模型的前世今生

大数据文摘授权转载自数据派THU 作者:李媛媛 1 GPT模型概述 GPT模型,全称Generative Pre-trained Transformer,由OpenAI团队开发,是一种基于深度学习的自...
阅读原文

微软AI PC震撼发布!回忆功能惊艳全场,超越M3 MacBook Air或成事实?

点击上方蓝字关注我们“微软近日推出了以人工智能为核心的'Copilot Plus PC'系列PC,包括具备'回忆'功能的Surface Laptop和Surface Pro。这些设备搭载高通Snap...
阅读原文

替代MLP的KAN,被开源项目扩展到卷积了

机器之心报道 机器之心编辑部本月初,来自 MIT 等机构的研究者提出了一种非常有潜力的 MLP 替代方法 ——KAN。 KAN 在准确性和可解释性方面表现优于 MLP,而且...
阅读原文

HuggingFace教你怎样做出SOTA视觉模型

克雷西 发自 凹非寺量子位 | 公众号 QbitAI前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。 其他从业者在震撼之余,也再次开始思考怎...
阅读原文

媲美Sora!谷歌Veo来了,文生超1分钟、1080P视频

直播预告|今晚七点,「企业级大模型工程实践在线研讨会」将举行。阿里巴巴 AI 基础架构工程师刘彬、NVIDIA 软件解决方案架构师吴金钟两位技术专家将分别主讲...
阅读原文

腾讯混元文生图大模型全面开源!Sora同架构,更懂中文,免费商用

首个中文原生DiT架构,中文原生文生图大模型来了! 作者|ZeR0 编辑|漠影 智东西5月15日报道,腾讯文生图负责人芦清林周二宣布腾讯混元文生图大模型全面开源。...
阅读原文

首个中文原生DiT架构!腾讯混元文生图大模型全面开源,免费商用

机器之心报道 机器之心编辑部中文 AI 社区迎来了一个好消息:与 Sora 同架构的开源文生图大模型来了! 5 月 14 日,腾讯宣布旗下混元文生图大模型全面升级并...
阅读原文
13456713