标签:模型
OpenAI o1 self-play RL 技术路线推演
导读文章转载自知乎,作者为曹宇,本文对train-time compute和test-time compute相关技术上可能的技术路线进行了推演,在整体思路上还原OpenAI o1的训练及推...
英伟达 Jim Fan:复刻 NLP 的成功路,用通用模型开启具身智能的 GPT-3 时刻
机器人时代已经到来,所有能移动的东西最终都会实现自主运行。作者丨刘洁 编辑丨岑峰 还记得那只“骑”瑜伽球的机械狗吗? 过马路,走草地都稳稳当当,就算瑜伽...
传英伟达 1.65 亿美元收购新创 OctoAI;马斯克脑机接口获批;吴泳铭:AI 最大的想象力不在手机屏幕丨AI情报局
01 要闻提示通义千问三款主力模型再降价,最高降幅85% 阿里CEO吴泳铭:AI最大的想象力不在手机屏幕,而是改变物理世界 英伟达再扩AI版图 传斥资1.65亿美元收...
专访瓴羊CEO朋新宇:AI时代做产品,要从场景解构开始|甲子光年
懂场景者得AI。作者|赵健 大模型落地,到底怎么做?AI技术每天都在迭代,而对于AI落地的实践与思考,阿里巴巴旗下的数据服务商瓴羊在不同的时间段给出了不...
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
新智元报道编辑:编辑部 HXZ 【新智元导读】随OpenAI爆火的CoT,已经引发了大佬间的激战!谷歌DeepMind首席科学家Denny Zhou拿出一篇ICLR 2024论文称:CoT可...
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
新智元报道编辑:编辑部 【新智元导读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂...
KG+LM超越传统架构!海德堡提出全新图语言模型GLM | ACL 2024
新智元报道编辑:alan 【新智元导读】近日,来自海德堡大学的研究人员推出了图语言模型 (GLM),将语言模型的语言能力和知识图谱的结构化知识,统一到了同一种...
大佬亲身示范:操纵AI如此简单,LLM不仅「发疯」还造谣诽谤
新智元报道编辑:乔杨 Frey 【新智元导读】当谷歌的Gemini建议给比萨加胶水时,网友尚能发挥娱乐精神玩梗解构;但当LLM输出的诽谤信息中伤到到真实人类时,AI...
AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law
衡宇 西风 发自 凹非寺量子位 | 公众号 QbitAI《黑神话·悟空》的火爆,带火的不仅是3D游戏本身,还有背后暗潮汹涌的AI 3D生成技术。 一直以来,外界对3D大模...
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
克雷西 发自 凹非寺量子位 | 公众号 QbitAIOpenAI o1的横空出世,开启了大模型演化的新范式——Inference law(推理定律)。 正如英伟达AI科学家Jim Fan所说,o...
o1核心作者MIT演讲:激励AI自我学习,比试图教会AI每一项任务更重要
一水 发自 凹非寺量子位 | 公众号 QbitAI“o1发布后,一个新的范式产生了”。 其中关键,OpenAI研究科学家、o1核心贡献者Hyung Won Chung,刚刚就此分享了他在M...
服务器被挤爆!可灵1.5版本正式上线:不加价升级1080P,4段视频一口气生成
克雷西 发自 凹非寺量子位 | 公众号 QbitAI万众期待之下,可灵全新的1.5版本终于正式上线! 不仅接入了新一代模型,画质和动态质量都大幅提升,会员还能不加...
一口气发 100 个开源模型、主力模型再大降价!阿里:不然谈什么应用爆发?!
整理 | 华卫、褚杏娟 这两天,阿里在云栖大会上又开“卷”大模型了。一口气上架 100 多个开源模型、主力模型再大降价,“量多”又“价低”的策略又给大家带来了一...
万字长文解读百度大模型原生安全构建之路
演讲嘉宾 |冯景辉 编辑 |蔡芳芳 策划 |AICon 全球人工智能开发与应用大会 大模型以其更智能、不确定和不可解释的特点,给安全领域,尤其是内容安全带来了...
真·AI程序员来了,阿里云「通义灵码」全面进化,全流程开发仅用几分钟
机器之心报道 作者:Panda、泽南5 分钟就能完成真人程序员一天的工作量。太轻松了。 在 AI 程序员的帮助下,一个几乎没有专业编程经验的初中生,在人头攒动的...