大模型“取长补短”新思路入选NeurIPS'24，显著优于现有路由方法，南科大港科大出品

AIGC动态欢迎阅读

原标题：大模型“取长补短”新思路入选NeurIPS'24，显著优于现有路由方法，南科大港科大出品
关键字：样本,准确率,对比,损失,高效
文章来源：量子位
内容字数：0字

内容摘要：

RouterDC团队投稿量子位 | 公众号 QbitAI高效组合多个大模型“取长补短”新思路，被顶会NeurIPS 2024接收。
名为RouterDC，是一种基于双重对比学习的路由架构，具有参数高效性（小于100M的参数）和计算高效性（不需要对于LLM进行梯度回传）的优势。
在具有挑战性语言理解、代码生成和数学推理等推理任务实验中，RouterDC在分布内（+2.76%）和分布外（+1.90%）设定下，都远超于现有的routing方法。
众所周知，LLM通常在不同数据集上预训练和微调，导致它们在不同任务上的性能强弱不同。
LLM路由则是一种组合多个LLM的新思路，它通过学习一个路由器（Router）来为每一个请求（query）选择最合适的LLM。在推理时，LLM路由只需要调用所选的LLM进行推理，使其在保持计算高效性的同时利用多个LLM的互补能力。
RouterDC这种新方法，包括一个较小的语言模型作为编码器和一系列与候选LLM对应的可学习的LLM embeddings。
对于训练数据中的每个query，首先将候选LLM的预测与真实标签进行比较获得表现最好和最差的LLM，然后构造两

原文链接：大模型“取长补短”新思路入选NeurIPS'24，显著优于现有路由方法，南科大港科大出品