Meta发布抽象链，大模型工具利用精度+6%，速度+40%！

AIGC动态2年前 (2024)发布夕小瑶科技说

AIGC动态欢迎阅读

原标题：Meta发布抽象链，大模型工具利用精度+6%，速度+40%！
关键字：解读,方法,工具,模型,数学
文章来源：夕小瑶科技说
内容字数：10238字

内容摘要：

夕小瑶科技说原创编辑 | 芒果引言：大语言模型与真实世界知识的对齐挑战在人工智能领域，大型语言模型（LLMs）的发展已经取得了显著进步，特别是在理解和执行指令方面。然而，当涉及到需要调用和组合真实世界知识来生成响应时，这些模型仍然存在错误。例如，它们可能会做出不符合事实的陈述或错误的计算。为了解决这些问题，研究人员提出了使用辅助工具（如搜索引擎提供可靠事实，计算器进行精确数算等）来减少这些错误，这激发了集成外部API调用到输出生成中的工具增强型语言模型的发展。
尽管如此，当前的工具增强型LLMs，例如Toolformer，仍然面临在多步推理中可靠和高效利用工具的挑战。特别是在多步推理任务中，工具调用往往是交错的，即一个API调用的响应常常是后续调用的一部分查询。如果不显式地建模这些推理链中的相互连接，LLMs将无法学习有效的工具使用规划，导致使用工具的推理准确性降低。同时，将文本生成与API调用交错也引入了推理效率低下的问题，模型必须等待API调用的响应才能继续解码过程。在多步推理场景中，这种低效率变得更加明显，因为每个推理过程通常需要多轮API调用。
本文提出了一种新的方法，通

原文链接：Meta发布抽象链，大模型工具利用精度+6%，速度+40%！