标签：模型

OpenAI o1 self-play RL 技术路线推演

导读文章转载自知乎，作者为曹宇，本文对train-time compute和test-time compute相关技术上可能的技术路线进行了推演，在整体思路上还原OpenAI o1的训练及推...

阅读原文

AIGC动态

2年前 (2024)

英伟达 Jim Fan：复刻 NLP 的成功路，用通用模型开启具身智能的 GPT-3 时刻

机器人时代已经到来，所有能移动的东西最终都会实现自主运行。作者丨刘洁编辑丨岑峰还记得那只“骑”瑜伽球的机械狗吗？过马路，走草地都稳稳当当，就算瑜伽...

阅读原文

AIGC动态

2年前 (2024)

传英伟达 1.65 亿美元收购新创 OctoAI；马斯克脑机接口获批；吴泳铭：AI 最大的想象力不在手机屏幕丨AI情报局

01 要闻提示通义千问三款主力模型再降价，最高降幅85% 阿里CEO吴泳铭：AI最大的想象力不在手机屏幕，而是改变物理世界英伟达再扩AI版图传斥资1.65亿美元收...

阅读原文

AIGC动态

2年前 (2024)

专访瓴羊CEO朋新宇：AI时代做产品，要从场景解构开始｜甲子光年

懂场景者得AI。作者｜赵健‍‍ 大模型落地，到底怎么做？AI技术每天都在迭代，而对于AI落地的实践与思考，阿里巴巴旗下的数据服务商瓴羊在不同的时间段给出了不...

阅读原文

AIGC动态

2年前 (2024)

KG+LM超越传统架构！海德堡提出全新图语言模型GLM | ACL 2024

新智元报道编辑：alan 【新智元导读】近日，来自海德堡大学的研究人员推出了图语言模型 (GLM)，将语言模型的语言能力和知识图谱的结构化知识，统一到了同一种...

阅读原文

AIGC动态

2年前 (2024)

大佬亲身示范：操纵AI如此简单，LLM不仅「发疯」还造谣诽谤

新智元报道编辑：乔杨 Frey 【新智元导读】当谷歌的Gemini建议给比萨加胶水时，网友尚能发挥娱乐精神玩梗解构；但当LLM输出的诽谤信息中伤到到真实人类时，AI...

阅读原文

AIGC动态

2年前 (2024)

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

新智元报道编辑：编辑部 HXZ 【新智元导读】随OpenAI爆火的CoT，已经引发了大佬间的激战！谷歌DeepMind首席科学家Denny Zhou拿出一篇ICLR 2024论文称：CoT可...

阅读原文

AIGC动态

2年前 (2024)

让OpenAI o1逆天的慢思考，360两月前就做出来了？周鸿祎CoE媲美CoT，应用太前瞻

新智元报道编辑：编辑部【新智元导读】o1大火背后，最关键的技术是CoT。模型通过一步一步推理，恰恰是「慢思考」的核心要义。而这一观点，其实这家国内大厂...

阅读原文

AIGC动态

2年前 (2024)

AI 3D生成天花板再拉升！清华团队炼成3D Scaling Law

衡宇西风发自凹非寺量子位 | 公众号 QbitAI《黑神话·悟空》的火爆，带火的不仅是3D游戏本身，还有背后暗潮汹涌的AI 3D生成技术。一直以来，外界对3D大模...

阅读原文

AIGC动态

2年前 (2024)

三个大模型组队挑战o1，实测360多模型协作干掉提示词工程

克雷西发自凹非寺量子位 | 公众号 QbitAIOpenAI o1的横空出世，开启了大模型演化的新范式——Inference law（推理定律）。正如英伟达AI科学家Jim Fan所说，o...

阅读原文

AIGC动态

2年前 (2024)

o1核心作者MIT演讲：激励AI自我学习，比试图教会AI每一项任务更重要

一水发自凹非寺量子位 | 公众号 QbitAI“o1发布后，一个新的范式产生了”。其中关键，OpenAI研究科学家、o1核心贡献者Hyung Won Chung，刚刚就此分享了他在M...

阅读原文

AIGC动态

2年前 (2024)

服务器被挤爆！可灵1.5版本正式上线：不加价升级1080P，4段视频一口气生成

克雷西发自凹非寺量子位 | 公众号 QbitAI万众期待之下，可灵全新的1.5版本终于正式上线！不仅接入了新一代模型，画质和动态质量都大幅提升，会员还能不加...

阅读原文

AIGC动态

2年前 (2024)

一口气发 100 个开源模型、主力模型再大降价！阿里：不然谈什么应用爆发？！

整理 | 华卫、褚杏娟这两天，阿里在云栖大会上又开“卷”大模型了。一口气上架 100 多个开源模型、主力模型再大降价，“量多”又“价低”的策略又给大家带来了一...

阅读原文

AIGC动态

2年前 (2024)

万字长文解读百度大模型原生安全构建之路

演讲嘉宾｜冯景辉编辑｜蔡芳芳策划｜AICon 全球人工智能开发与应用大会大模型以其更智能、不确定和不可解释的特点，给安全领域，尤其是内容安全带来了...

阅读原文

AIGC动态

2年前 (2024)

真·AI程序员来了，阿里云「通义灵码」全面进化，全流程开发仅用几分钟

机器之心报道作者：Panda、泽南5 分钟就能完成真人程序员一天的工作量。太轻松了。在 AI 程序员的帮助下，一个几乎没有专业编程经验的初中生，在人头攒动的...

阅读原文

AIGC动态

2年前 (2024)

1…56 575859 60…483