标签:操作
阿里全新Agent玩转手机:刷短视频自主点赞评论,还学会了跨应用操作
克雷西 发自 凹非寺量子位 | 公众号 QbitAI会操纵手机的智能体,又迎来了全新升级! 新的Agent打破了APP的界限,能够跨应用完成任务,成为了真·超级手机助手...
CMU华人18万打造高能机器人,完爆斯坦福炒虾机器人!全自主操作,1小时学会开12种门
新智元报道编辑:Aeneas 桃子 【新智元导读】斯坦福炒菜机器人的大火,开启了2024年机器人元年。最近,CMU研究团队推出了一款能在开放世界完成任务的机器人,...
AI在操作系统里复制自己,这一天还是来了
梦晨 发自 凹非寺量子位 | 公众号 QbitAI这一天还是来了,AI在操作系统里启动了一个自己的副本。 往小了说,不过是多模态大模型通过操纵鼠标键盘的API执行任...
翻车,才是斯坦福炒菜机器人学习人类的常态
机器之心报道 作者:大盘鸡、陈萍Mobile ALOHA也有翻车时刻。 电视剧中角色的惊艳亮相不一定能打动你的心,但斯坦福全职管家兼御用大厨一定能拿下你对机器人...
斯坦福开源的家用机器人!Transformer 架构驱动,由华人开发!
大数据文摘出品 在科技领域,时不时就会出现一项突破性的成果,彻底重塑我们对可能性的认知。 近日,斯坦福大学、伯克利大学和谷歌 DeepMind 团队合作推出一...
斯坦福炒虾机器人爆火全网!华人团队成本22万元,能做满汉全席还会洗碗
新智元报道编辑:桃子 好困 【新智元导读】今天,大家都被斯坦福华人团队的这个炒菜机器人刷屏了。仅用50个演示,就能让机器人完成各种复杂任务。最重要的是...
鹅厂新智能体亮相!操纵手机水平媲美真人,GitHub一周获1.5K星
克雷西 发自 凹非寺量子位 | 公众号 QbitAI一不留神,大模型已经学会了操纵手机? 最近,腾讯最新多模态智能体框架AppAgent曝光,可以像人类一样操作各种应用...
大模型竟然能玩手机了,还能用软件修图:「AppAgent」会成为2024年的新趋势吗?
机器之心专栏 机器之心编辑部这就是2024年的新趋势吗?近日,一项名为 AppAgent 的创新技术引起了广泛关注。 简单来说,AppAgent 的智能代理能力可以用于操作...
比Siri更懂iPhone!GPT-4V可“操作”手机完成任意指令,无需训练
丰色 发自 凹非寺量子位 | 公众号 QbitAIGPT-4V,就是Siri终结的开始。一项研究发现:无需任何训练,GPT-4V就能直接像人类一样与智能手机进行交互,完成各种...
GPTs教程:如何在几分钟之内通过ChatGPT制作一个GPT
点击上方蓝字关注我们“ OpenAI推出了一款名为GPTs的自定义AI模型创建工具,允许用户为特定目的创建自定义ChatGPT实例,无需编码。该过程允许您定制ChatGPT AI...
《以机器的速度进行决策:将人工智能引入指挥链》
在日益复杂和苛刻的作战环境中运作的需要,有可能使现代军舰上以人为中心的指挥链超负荷。扩大使用快速发展的人工智能技术提供了应对这一挑战的潜力,彻底改...
CMU机器狗,倒立下楼!发布即开源
丰色 发自 凹非寺量子位 | 公众号 QbitAI讲真,机器狗的花活见得多了——但今天还是有被惊艳到。来自CMU的最新成果,直接让狗子学会了:两倍身长的跳高、跳远、...
Apple Watch Series 9/ Ultra 2 首发评测:一个指尖艺术,改变了我使用微信的方式
DoubleTap四两拨千斤8 年前的一个雨天,我撑着伞走在路上,Apple Watch 急促的振动提醒我来了一通电话。我瞄了一眼手表,经历了 3 秒的思想斗争,决定从裤兜...
字节提出 Vi-PRoM 视觉预训练方案,机器人操作成功率更高,操作效果更好了
机器之心专栏机器之心编辑部用对了视觉预训练策略,机器人学习操作能力更高效。近年来,利用大规模真实世界数据进行的视觉预训练取得了显著进展,在基于像素...