今日arXiv最热NLP大模型论文：超越GPT-4，清华发布网页导航智能体AutoWebGLM

AIGC动态2年前 (2024)发布夕小瑶科技说

AIGC动态欢迎阅读

原标题：今日arXiv最热NLP大模型论文：超越GPT-4，清华发布网页导航智能体AutoWebGLM
关键字：模型,任务,操作,数据,网页
文章来源：夕小瑶科技说
内容字数：9078字

内容摘要：

夕小瑶科技说原创作者 | Tscom随着大语言模型（LLMs）的发展，Agent在网络导航等任务中展现出了前所未有的能力。想象一下，一个基于LLM的Agent能够在你享用早餐时为你总结在线新闻，这样的场景已经不再遥不可及。这种将LLMs融入日常任务的做法，不仅优化了我们与技术的互动方式，也重新定义了机器辅助生产力的边界。
许多公司都看好这一块的发展，已着手耕耘，期待着引发一场交互技术的变革，如腾讯的AppAgent、阿里的Mobile Agent等。前百度智能家居硬件总经理吕骋再次创业推出的智能网页访问一体机Rabbit R1，更是引领了一股时代潮流。这不，据说Sam Altman与前苹果设计总监Jony Ive共同创办的神秘AI硬件公司，也与这脱不了干系。
但是，目前真正能使用的网页操作Agent，因现实世界中网页行动的多样性、HTML文本的庞大以及网络开放性质带来的决策复杂性等原因，在实际应用中表现得远不尽人意。
为了应对这些挑战，清华大学的研究者们开发了AutoWebGLM，这是一个基于ChatGLM3-6B构建的自动化网络导航Agent，它在多个方面超越了GPT-4（下图），

原文链接：今日arXiv最热NLP大模型论文：超越GPT-4，清华发布网页导航智能体AutoWebGLM

联系作者

文章来源：夕小瑶科技说
作者微信：xixiaoyaoQAQ
作者简介：专业、有趣、深度价值导向的科技媒体。聚集30万AI工程师、研究员，覆盖500多家海内外机构投资人，互联网大厂中高管和AI公司创始人。一线作者来自清北、国内外顶级AI实验室和大厂，兼备敏锐的行业嗅觉和洞察深度。商务合作：zym5189

阅读原文