百川智能发布超千亿大模型Baichuan 3，中文评测超越GPT-4

AIGC动态2年前 (2024)发布 AI前线

AIGC动态欢迎阅读

原标题：百川智能发布超千亿大模型Baichuan 3，中文评测超越GPT-4
关键字：模型,解读,医疗,智能,数据
文章来源：AI前线
内容字数：7001字

内容摘要：

作者 | 褚杏娟
1 月 29 日，百川智能发布超千亿参数的大语言模型 Baichuan 3。
在多个权威通用能力评测如 CMMLU、GAOKAO 和 AGI-Eval 中，Baichuan 3 都展现了出色的能力，尤其在中文任务上更是超越了 GPT-4。而在数学和代码专项评测如 MATH、HumanEval 和 MBPP 中同样表现出色，证明了 Baichuan 3 在自然语言处理和代码生成领域的强大实力。
不仅如此，其在对逻辑推理能力及专业性要求极高的 MCMLE、MedExam、CMExam 等权威医疗评测上的中文效果同样超过了 GPT-4，是中文医疗任务表现最佳的大模型。Baichuan 3 还突破“迭代式强化学习”技术，进一步提升了语义理解和生成能力，在诗词创作的格式、韵律、表意等方面表现优异，领先于其他大模型。
链接：https://www.baichuan-ai.com/百川智能做了哪些改进与百亿、几百亿级别参数模型训练不同，超千亿参数模型在训练过程中对高质量数据，训练稳定性、训练效率的要求都高出几个量级。为解决相关问题，百川智能在训练过程中针对性地提出了“动态数据选择”

原文链接：百川智能发布超千亿大模型Baichuan 3，中文评测超越GPT-4