标签:能力

微亿智造CEO:具身智能落地工业场景,人形不一定是最优解

关于人形机器人是否有用的争论还在继续,比如,工业场景是否需要人形? 「如果工业场景有一个具备感知、认知、执行的能力的智能体,人形并不一定是工业现场中...
阅读原文

我们能够让开源小模型变得比人类更聪明吗

作者丨 Harish SG 译者丨明知山 策划丨褚杏娟 我是 Harish SG,一名在德克萨斯大学达拉斯分校攻读网络安全硕士学位的安全研究员,目前在思科担任 AI 安全工...
阅读原文

苹果内部员工自揭其短:生成式AI研发竟已落后两年多

机器之心报道 编辑:Panda前两天,苹果更新了 iPad mini 产品线,而这款最小型的 iPad 已经三年没有更新了。很显然,这次更新也是苹果为了让全产品线都具备其...
阅读原文

OpenAI o1正在重塑Agent?

如果需要回答下述问题: “满足Sales Order SO08E34需要采购多少零件?” 你会选择哪种Agent架构?ReAct:Agent利用ReAct框架逐步求解; One-Shot:Agent“一次...
阅读原文

国产3D虚拟人版《Her》「杀向」迪拜

衡宇 发自 Gitex量子位 | 公众号 QbitAI好久没出门,AI产品的世界已经快进到这个样子了? 在全球三大IT展之一的GITEX GLOBAL上,量子位在某个展台,先后体验...
阅读原文

泡沫不可避免,但将有 1% AI 企业脱颖而出——对话哈佛商评总编,李彦宏谈 AI 泡沫

作者 | 百度 审校 | 姜昕蔚 10 月 16 日晚,百度创始人李彦宏在《HBR Live:商业未来》与哈佛商业评论英文版总编辑殷阿笛(Adi Ignatius)对谈时表示,正如...
阅读原文

大模型训练遭投毒损失千万美元?Anthropic惊人发现:LLM植入炸弹,代码库暗藏bug!

新智元报道编辑:Aeneas 好困 【新智元导读】最近,大模型训练遭恶意攻击事件已经刷屏了。就在刚刚,Anthropic也发布了一篇论文,探讨了前沿模型的巨大破坏力...
阅读原文

NVIDIA Research 研究科学家李柏依:探索基于多模态LLM 的自动驾驶智能体 | 公开课预告

让自动驾驶系统适应新环境和不同地区的习惯和法规是自动驾驶领域长期面临的挑战。NVIDIA Research 团队提出的自动驾驶智能体 LLaDA 能够利用 LLM 生成适应不...
阅读原文

再谈LLM逻辑推理的三大谬误

在此前的文章《LLM逻辑推理的枷锁与破局策略》,作者Alejandro Piad Morffis论述了为什么大语言模型不具备推理(reasoning)能力,并在X上引发强烈争论(http...
阅读原文

卷起来!让智能体评估智能体,Meta发布Agent-as-a-Judge

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10

西风 发自 凹非寺量子位 | 公众号 QbitAI国产大模型首次在公开榜单上超过GPT-4o! 就在刚刚,“大模型六小强”之一的零一万物正式对外发布新旗舰模型——Yi-Light...
阅读原文

推理?别闹了!现在的 AI 仍然连小学数学题都搞不定!

“ 研究发现,尽管OpenAI和Google等公司强调其AI模型的推理能力,但苹果的研究表明,当前的大型语言模型(LLMs)在面对微小变化时,推理能力脆弱且不可靠。测...
阅读原文

AI智能体引擎加持:天玑9400让「完全体」AI手机提前问世了

机器之心报道 作者:泽南AI 手机的形态,再次进化了。已经快「卷到头」的手机芯片,终于迎来了一次能力突破。 今年刷爆整个科技圈的 AI 视频生成,不打招呼就...
阅读原文

苹果发文质疑:大语言模型根本无法进行逻辑推理

大语言模型(LLM)是真的会数学推理?还是只是在“套路”解题? 近年来,大语言模型在各种任务中的表现引起广泛关注。一个核心问题逐渐浮现:这些模型是否真正...
阅读原文

o1诞生对下一轮AI爆发的启示:技术远远没有收敛,仍在演进丨智源Workshop精华观点回顾

来源:智源社区 上月,智源社区组织了「智源Workshop:从o1出发,探索LLM推理与思维链」线上研讨会,邀请到多位一线模型研究者参会分享讨论(回放链接:https...
阅读原文
13456756