谷歌、微软加入「AI 操控电脑」战场:谷歌版贾维斯将由Gemini 2.0加持
AIGC动态欢迎阅读
原标题:谷歌、微软加入「AI 操控电脑」战场:谷歌版贾维斯将由Gemini 2.0加持
关键字:解读,多少钱,模型,语义,图标
文章来源:Founder Park
内容字数:0字
内容摘要:
文章转载自「新智元」。
AI接管人类电脑,就是下一个未来!
几天前,Anthropic向所有人展示了,Claude 3.5自主看屏幕操作光标完成复杂任务,足以惊掉下巴。
刚刚,Information独家爆料称,谷歌正开发同类新项目「Project Jarvis」,能将Chrome网页任务自动化。
谷歌「贾维斯」将由未来版Gemini 2.0驱动,预计在12月亮相。
起这个名字,是为了向钢铁侠中的J.A.R.V.I.S致敬。
无独有偶,微软团队悄悄放出的OmniParser,也在笃定AI智能体操控屏幕的未来。
论文地址:https://arxiv.org/pdf/2408.00203
OmniParser主要是一个屏幕解析的工具,可以将截图转化为结构化数据,帮助AI精准理解用户意图。
不仅如此,OpenAI内部已有了AI智能体雏形,可以操控计算机完成在线订餐、自动查询解决编程难题等任务。
包括苹果在内,预计在明年发布跨多个APP屏幕识别能力。最新迭代的Ferret-UI 2,就是通用UI模型。
可见,「Computer use」已经成为科技大厂们,重点发力的下一个战场。点击关注,每天更新
原文链接:谷歌、微软加入「AI 操控电脑」战场:谷歌版贾维斯将由Gemini 2.0加持
联系作者
文章来源:Founder Park
作者微信:
作者简介:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...