AIGC动态欢迎阅读
内容摘要:
昆仑万维 投稿量子位 | 公众号 QbitAIQ*项目公开发布,可让小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力。
自去年11月伴随着OpenAI内讧,其神秘Q*项目被爆出后,业内对OpenAI Q*的讨论和猜测就没停过,而OpenAI这边一直避而不谈。
在当时,一些人就从名字猜测Q*可能与Q-Learning有关,例如Meta科学家田渊栋提出Q*可能是Q-learning和A*的结合:
而现在,一项名为Q*的项目突然公开发布,而且真的和Q-Learning、A*有关。
不过,研究团队并非OpenAI,更不是DeepMind(相传,OpenAI的Q*项目前身是GPT-Zero,由Ilya Sutskever发起,名字致敬了DeepMind的Alpha-Zero)。
而是来自国内昆仑万维颜水成团队与新加坡南洋理工大学的一项新工作。
团队表示,希望Q*算法能够打破OpenAI的封锁,提升现有开源模型的推理能力。实验中,Q*算法的表现也很给力:
在GSM8K数据集上,Q*帮助Llama-2-7b提升至80.8%的准确率,超越了ChatGPT;
在MATH数据集上,Q*帮助DeepS
联系作者
文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...