利用LLM操控智能手机APP!腾讯提出新的多模态Agent框架AppAgent!

AIGC动态8个月前发布 算法邦
7 0 0

利用LLM操控智能手机APP!腾讯提出新的多模态Agent框架AppAgent!

AIGC动态欢迎阅读

原标题:利用LLM操控智能手机APP!腾讯提出新的多模态Agent框架AppAgent!
关键字:代理人,报告,有效使用,应用程序,元素
文章来源:算法邦
内容字数:6298字

内容摘要:


直播预告 | 1月11日晚7点,「自动驾驶新青年讲座」第34讲正式开讲,新加坡国立大学计算机系在读博士孔令东将主讲《运用视觉基础模型分割「任意」激光雷达点云》,欢迎扫码报名~本文转载自公众号:数源AI,如需转载请与该公众号联系。论文链接:
https://arxiv.org/pdf/2312.13771.pdf开源代码:
https://appagent-official.github.io/
01引言大语言模型 (LLMs) 的出现, 例如ChatGPTGPT-4 ,标志着人工智能和自然语言处理领域的一个重要里程碑。这些先进模型代表了机器理解和生成人类语言的基本变革,展示了以往无法达到的精细和多功能水平。这个领域最令人兴奋的发展之一是LLMs不仅仅能够处理文本,而更像是能够执行复杂任务的Agent。在AutoGPT和MetaGPT 展示了LLMs在需要高级认知功能(如推理、规划和协作)的任务中的实际应用。这些发展的重要性不言而喻,它们将LLMs的实用性拓展到简单的语言任务之外,从而彻底改变了技术和日常生活的各个方面。
02简介本文介绍了一种基于新颖的LLM的多模态Agent框架A


原文链接:利用LLM操控智能手机APP!腾讯提出新的多模态Agent框架AppAgent!

联系作者

文章来源:算法邦
作者微信:allplusai
作者简介:「算法邦」,隶属于智猩猩,关注大模型、生成式AI、计算机视觉三大领域的研究与开发,提供技术文章、讲座、在线研讨会。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...