Q*项目公开发布！研究团队并非OpenAI

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：Q*项目公开发布！研究团队并非OpenAI
关键字：模型,准确率,数据,状态,团队
文章来源：量子位
内容字数：0字

内容摘要：

昆仑万维投稿量子位 | 公众号 QbitAIQ*项目公开发布，可让小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力。
自去年11月伴随着OpenAI内讧，其神秘Q*项目被爆出后，业内对OpenAI Q*的讨论和猜测就没停过，而OpenAI这边一直避而不谈。
在当时，一些人就从名字猜测Q*可能与Q-Learning有关，例如Meta科学家田渊栋提出Q*可能是Q-learning和A*的结合：
而现在，一项名为Q*的项目突然公开发布，而且真的和Q-Learning、A*有关。
不过，研究团队并非OpenAI，更不是DeepMind（相传，OpenAI的Q*项目前身是GPT-Zero，由Ilya Sutskever发起，名字致敬了DeepMind的Alpha-Zero）。
而是来自国内昆仑万维颜水成团队与新加坡南洋理工大学的一项新工作。
团队表示，希望Q*算法能够打破OpenAI的，提升现有开源模型的推理能力。实验中，Q*算法的表现也很给力：
在GSM8K数据集上，Q*帮助Llama-2-7b提升至80.8%的准确率，超越了ChatGPT；
在MATH数据集上，Q*帮助DeepS

原文链接：Q*项目公开发布！研究团队并非OpenAI