标签:能力

加强版Claude3.5正式上线,一句话操控电脑的时代真的要来了。

大数据文摘受权 转载自数字生命卡兹克 作者:卡兹克、东毅 夜里十一点,大洋彼岸早上8点整。 Claude带着大货闪亮登场了。 升级版的Claude 3.5 Sonnet,新模型...
阅读原文

荣耀MagicOS 9.0来了个全局智能体,AI手机方向变了

机器之心报道 编辑:泽南、杜伟一夜之间,AI 智能体学会操纵手机了。「太可怕了。」 在直播间里,赵明向周鸿祎现场展示了真正的技术,找 AI 智能体整点咖啡:...
阅读原文

这个重磅新功能让大模型像人类一样操控鼠标、键盘,成熟的 AI 要学会自己打工了

一句话 模拟人类 用电脑天下苦 OpenAI 挤牙膏久矣。 环顾宇内,能够与 OpenAI 抗衡的对手屈指可数,Anthropic 旗下的 Claude 模型算是一个靠谱的劲敌。 盼星...
阅读原文

Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天

新智元报道编辑:编辑部 HYZ 【新智元导读】太科幻了,深夜上线的Claude,可以像人类一样使用计算机了?查看屏幕、移动光标、点击按钮、输入文本,还能查找代...
阅读原文

RAG真能提升LLM推理能力?人大最新研究:数据有噪声,RAG性能不升反降

新智元报道编辑:LRST 【新智元导读】RAG通过纳入外部文档可以辅助LLM进行更复杂的推理,降低问题求解所需的推理深度,但由于文档噪声的存在,其提升效果可能...
阅读原文

微亿智造CEO:具身智能落地工业场景,人形不一定是最优解

关于人形机器人是否有用的争论还在继续,比如,工业场景是否需要人形? 「如果工业场景有一个具备感知、认知、执行的能力的智能体,人形并不一定是工业现场中...
阅读原文

我们能够让开源小模型变得比人类更聪明吗

作者丨 Harish SG 译者丨明知山 策划丨褚杏娟 我是 Harish SG,一名在德克萨斯大学达拉斯分校攻读网络安全硕士学位的安全研究员,目前在思科担任 AI 安全工...
阅读原文

苹果内部员工自揭其短:生成式AI研发竟已落后两年多

机器之心报道 编辑:Panda前两天,苹果更新了 iPad mini 产品线,而这款最小型的 iPad 已经三年没有更新了。很显然,这次更新也是苹果为了让全产品线都具备其...
阅读原文

OpenAI o1正在重塑Agent?

如果需要回答下述问题: “满足Sales Order SO08E34需要采购多少零件?” 你会选择哪种Agent架构?ReAct:Agent利用ReAct框架逐步求解; One-Shot:Agent“一次...
阅读原文

国产3D虚拟人版《Her》「杀向」迪拜

衡宇 发自 Gitex量子位 | 公众号 QbitAI好久没出门,AI产品的世界已经快进到这个样子了? 在全球三大IT展之一的GITEX GLOBAL上,量子位在某个展台,先后体验...
阅读原文

泡沫不可避免,但将有 1% AI 企业脱颖而出——对话哈佛商评总编,李彦宏谈 AI 泡沫

作者 | 百度 审校 | 姜昕蔚 10 月 16 日晚,百度创始人李彦宏在《HBR Live:商业未来》与哈佛商业评论英文版总编辑殷阿笛(Adi Ignatius)对谈时表示,正如...
阅读原文

大模型训练遭投毒损失千万美元?Anthropic惊人发现:LLM植入炸弹,代码库暗藏bug!

新智元报道编辑:Aeneas 好困 【新智元导读】最近,大模型训练遭恶意攻击事件已经刷屏了。就在刚刚,Anthropic也发布了一篇论文,探讨了前沿模型的巨大破坏力...
阅读原文

NVIDIA Research 研究科学家李柏依:探索基于多模态LLM 的自动驾驶智能体 | 公开课预告

让自动驾驶系统适应新环境和不同地区的习惯和法规是自动驾驶领域长期面临的挑战。NVIDIA Research 团队提出的自动驾驶智能体 LLaDA 能够利用 LLM 生成适应不...
阅读原文

再谈LLM逻辑推理的三大谬误

在此前的文章《LLM逻辑推理的枷锁与破局策略》,作者Alejandro Piad Morffis论述了为什么大语言模型不具备推理(reasoning)能力,并在X上引发强烈争论(http...
阅读原文

卷起来!让智能体评估智能体,Meta发布Agent-as-a-Judge

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文
1234555