阿里全新Agent玩转手机:刷短视频自主点赞评论,还学会了跨应用操作

AIGC动态11个月前发布 量子位
29 0 0

阿里全新Agent玩转手机:刷短视频自主点赞评论,还学会了跨应用操作

AIGC动态欢迎阅读

原标题:阿里全新Agent玩转手机:刷短视频自主点赞评论,还学会了跨应用操作
关键字:报告,操作,任务,指令,模型
文章来源:量子位
内容字数:2920字

内容摘要:


克雷西 发自 凹非寺量子位 | 公众号 QbitAI会操纵手机的智能体,又迎来了全新升级!
新的Agent打破了APP的界限,能够跨应用完成任务,成为了真·超级手机助手。
比如根据指示,它可以自行搜索篮球比赛的结果,然后根据赛况在备忘录中撰写文稿。
来自阿里的一篇最新论文,展示了全新手机操纵智能体框架Mobile-Agent,可以玩转10款应用,还能跨越APP完成用户交给的任务,而且即插即用无需训练。
依托多模态大模型,整个操纵过程完全基于视觉能力实现,不再需要给APP编写XML操作文档。
在Mobile-Agent还只有演示视频的时候,就已经让一众网友为之惊艳:
和树莓派结合到一起,将完爆Rabbit R1(一款大模型硬件)。
想象一下如果它支持语音操纵,并且学会了说话……
那么,Mobile-Agent操纵手机到底有多6呢?
支持跨应用任务目前,Mobile-Agent已经学会了十个APP的操作,以及一些跨应用任务。
比如搜索导航路线、帮忙在购物网站下单,它总能精准找到搜索框并完成目标。
也可以“刷”视频,然后点赞评论,看上去就像熟练的老手。
甚至是安装应用、修改系统设置,也难不倒


原文链接:阿里全新Agent玩转手机:刷短视频自主点赞评论,还学会了跨应用操作

联系作者

文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...