标签:任务
连OpenAI都推不动Scaling Law了?MIT把「测试时训练」系统研究了一遍,发现还有路
机器之心报道 机器之心编辑部昨天,The Information 的一篇文章让 AI 社区炸了锅。 这篇文章透露,OpenAI 下一代旗舰模型的质量提升幅度不及前两款旗舰模型之...
o1不是唯一路径!MIT新研究:在测试时训练,模型推理能力最高升至5.8倍
克雷西 发自 凹非寺量子位 | 公众号 QbitAIo1不是通向大模型推理的唯一路径! MIT的新研究发现,在测试时对大模型进行训练,可以让推理水平大幅提升。 在挑战...
曝OpenAI新旗舰模型“难产”,或明年年初发布
GPT进展放缓,OpenAI撞上数据墙,努力寻找出路。 编译|汪越 编辑|Panken 智东西11月11日消息,据The Information报道,OpenAI的GPT系列模型改进速度放缓,公...
LoRA、完全微调到底有何不同?MIT 21页论文讲明白了
机器之心报道 编辑:陈陈、小舟本文旨在了解两种微调大型语言模型方法之间的差异:完全微调和低秩自适应 (LoRA)。这两种方法都用于将预训练模型适应特定的下...
微软开源5级通用AI Agent:浏览网页、查论文,无所不能!
大会预告12月5日-6日,2024中国生成式AI大会(上海站)将举办。上海科大助理教授、博导顾家远,腾讯优图实验室天衍研究中心负责人吴贤,银河通用机器人合伙人...
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
衡宇 发自 凹非寺量子位 | 公众号 QbitAI空间智能版ImageNet来了,来自斯坦福李飞飞吴佳俊团队! HourVideo,一个用于评估多模态模型对长达一小时视频理解能...
NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界?
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
高能干货分享,有关提示词工程的一切都在这份教程里
机器之心报道 编辑:佳琪、Panda想让 AI 帮你自动搞定任务,离不开要在聊天框内用提示词对它发号施令。 但找到合适的提示词并不容易,这需要设计、优化和评估...
MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
「通用大脑」来了!MIT何恺明用大模型思维玩出机器人预训练新花样
大模型的预训练方法也适用机器人,复杂数据无需“量身定做”,也能完美对接。作者丨刘洁 编辑丨岑峰 在机器人领域,一场关于“通用智能”的探索正如火如荼地展开...
一个弹窗整懵Claude,瞬间玩不转电脑了 | 斯坦福&港大新研究
一水 发自 凹非寺量子位 | 公众号 QbitAI纳尼?AI Agent容易受到弹幕影响! 甚至比人类更容易。 事情是这样的,3位来自斯坦福、港大的研究人员发现: 人类有...
智能体首次达到Kaggle Grandmaster水平,华为用结构化推理补齐思维链短板
机器之心报道 编辑:Panda前些时日,AI 大模型开始掌握操作计算机的能力,但整体而言,它们与物理世界互动的能力仍处于早期阶段。 为了提高 LLM 在复杂的现实...
聚焦「视听触感官」协同配合的具身精细操纵,人大胡迪团队领衔探索机器人模态时变性挑战
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
体验 iMac M4 后,我发现了苹果的小心思和乔布斯的影子
苹果常青树 回归之作2001 年,《老友记》第七季正在美国播出,斩获了约 2000 万平均收视人数,位列当年全美电视节目收视率的前五名。 这部从上世纪走来的经典...
玩转「智能体魔方」!清华推出AgentSquare模块化搜索框架,开启AI智能体高速进化时代
新智元报道编辑:LRST 好困 【新智元导读】AI智能体能像有机生命一样自适应演化吗?最近清华大学团队提出了AgentSquare模块化智能体设计框架,通过标准化的模...