最懂医疗的国产推理大模型,果然来自百川智能

国内首个全场景深度思考模型问世。

最懂医疗的国产推理大模型,果然来自百川智能

原标题:最懂医疗的国产推理大模型,果然来自百川智能
文章来源:机器之心
内容字数:8400字

百川智能发布国内首个全场景深度思考模型Baichuan-M1-preview,引领AI大模型新一轮竞争

近日,全球AI大模型竞争进入白热化阶段,百川智能发布国内首个全场景深度思考模型Baichuan-M1-preview,标志着这一轮军备竞赛达到。该模型具备语言推理、视觉推理和搜索推理三大能力,在多个权威评测中超越了GPT-4o、Claude3.5 Sonnet等模型,并在百小应App上线。

Baichuan-M1-preview 的核心能力与优势

  1. 全场景推理能力:Baichuan-M1-preview 同时具备语言、视觉和搜索三种推理能力,能够处理更复杂的问题。

  2. 卓越的数学和代码能力:在数学基准测试和代码任务上超越了o1-preview等模型,展现出强大的逻辑推理和代码理解能力。

  3. 领先的视觉推理能力:在MMMU-val、MathVista等权威评测中,其视觉推理能力超越了GPT-4o、Claude3.5 Sonnet等模型。

  4. 医疗循证模式:Baichuan-M1-preview 的一大亮点是其医疗循证模式,能够像资深医疗专家一样进行深度思考,并基于亿级条目的循证医学知识库提供可靠的医学解答,显著提升了医疗推理的可靠性。

医疗循证模式详解

Baichuan-M1-preview 的医疗循证模式,通过自建的涵盖亿级条目的循证医学知识库,并对证据进行多层分级和专业分析,避免信息混杂导致的误判,最终形成全面、连贯的医学结论。此模式提升了模型医疗结果的可信度,也为大模型在医疗等高度专业领域的落地应用指明了方向,可辅助临床诊断和治疗,提升医学科研效率,并为患者提供可靠的第二诊疗意见。

Baichuan-M1-14B 开源及技术细节

百川智能开源了Baichuan-M1-14B模型,该模型在权威医学知识和临床能力评测上表现优异,超越了更大参数量的Qwen2.5-72B-Instruct。其技术细节包括:

  1. 万亿级token严肃医疗数据:涵盖中/英文专业医疗论文、真实医疗病例、教材书籍等,并进行数据合成,生成超千亿token高质量医疗推理数据。

  2. 多阶段领域提升方案:将训练分为通识提升、医疗基础知识提升和医疗进阶知识提升三个阶段,逐步提升模型能力。

  3. 系统化强化学习训练流程:采用ELO、TDPO和PPO等方法,提升模型生成质量、逻辑推理能力和用户偏好贴合度。

大模型推理能力的突破与未来

Baichuan-M1系列模型善于通过深度思考解决复杂推理问题,尤其擅长复杂医疗问题的推理。这代表着大模型技术发展的一个新阶段,即从单纯的预训练Scaling Law向强化学习Scaling Law的转变,模型能够像人类一样进行系统性的思考,解决更复杂的问题。百川智能选择医疗领域作为突破口,展现了其挑战难题、推动AI技术进步的决心。


联系作者

文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...
第五届
全国人工智能大赛

总奖金超 233 万!

报名即将截止