AIGC动态欢迎阅读
原标题:阿里全新Agent玩转手机:刷短视频自主点赞评论,还学会了跨应用操作
关键字:报告,操作,任务,指令,模型
文章来源:量子位
内容字数:2920字
内容摘要:
克雷西 发自 凹非寺量子位 | 公众号 QbitAI会操纵手机的智能体,又迎来了全新升级!
新的Agent打破了APP的界限,能够跨应用完成任务,成为了真·超级手机助手。
比如根据指示,它可以自行搜索篮球比赛的结果,然后根据赛况在备忘录中撰写文稿。
来自阿里的一篇最新论文,展示了全新手机操纵智能体框架Mobile-Agent,可以玩转10款应用,还能跨越APP完成用户交给的任务,而且即插即用无需训练。
依托多模态大模型,整个操纵过程完全基于视觉能力实现,不再需要给APP编写XML操作文档。
在Mobile-Agent还只有演示视频的时候,就已经让一众网友为之惊艳:
和树莓派结合到一起,将完爆Rabbit R1(一款大模型硬件)。
想象一下如果它支持语音操纵,并且学会了说话……
那么,Mobile-Agent操纵手机到底有多6呢?
支持跨应用任务目前,Mobile-Agent已经学会了十个APP的操作,以及一些跨应用任务。
比如搜索导航路线、帮忙在购物网站下单,它总能精准找到搜索框并完成目标。
也可以“刷”视频,然后点赞评论,看上去就像熟练的老手。
甚至是安装应用、修改系统设置,也难不倒
原文链接:阿里全新Agent玩转手机:刷短视频自主点赞评论,还学会了跨应用操作
联系作者
文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...