百川智能发布超千亿大模型Baichuan 3,中文评测超越GPT-4

AIGC动态11个月前发布 AI前线
14 0 0

百川智能发布超千亿大模型Baichuan 3,中文评测超越GPT-4

AIGC动态欢迎阅读

原标题:百川智能发布超千亿大模型Baichuan 3,中文评测超越GPT-4
关键字:模型,解读,医疗,智能,数据
文章来源:AI前线
内容字数:7001字

内容摘要:


作者 | 褚杏娟
1 月 29 日,百川智能发布超千亿参数的大语言模型 Baichuan 3。
在多个权威通用能力评测如 CMMLU、GAOKAO 和 AGI-Eval 中,Baichuan 3 都展现了出色的能力,尤其在中文任务上更是超越了 GPT-4。而在数学和代码专项评测如 MATH、HumanEval 和 MBPP 中同样表现出色,证明了 Baichuan 3 在自然语言处理和代码生成领域的强大实力。
不仅如此,其在对逻辑推理能力及专业性要求极高的 MCMLE、MedExam、CMExam 等权威医疗评测上的中文效果同样超过了 GPT-4,是中文医疗任务表现最佳的大模型。Baichuan 3 还突破“迭代式强化学习”技术,进一步提升了语义理解和生成能力,在诗词创作的格式、韵律、表意等方面表现优异,领先于其他大模型。
链接:https://www.baichuan-ai.com/百川智能做了哪些改进与百亿、几百亿级别参数模型训练不同,超千亿参数模型在训练过程中对高质量数据,训练稳定性、训练效率的要求都高出几个量级。为解决相关问题,百川智能在训练过程中针对性地提出了“动态数据选择”


原文链接:百川智能发布超千亿大模型Baichuan 3,中文评测超越GPT-4

联系作者

文章来源:AI前线
作者微信:ai-front
作者简介:面向AI爱好者、开发者和科学家,提供AI领域技术资讯、一线业界实践案例、搜罗整理业界技术分享干货、AI论文解读。每周一节技术分享公开课,助力你全面拥抱人工智能技术。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...