最懂医疗的国产推理大模型，果然来自百川智能

AIGC动态2年前 (2025)发布机器之心

国内首个全场景深度思考模型问世。

原标题：最懂医疗的国产推理大模型，果然来自百川智能
文章来源：机器之心
内容字数：8400字

百川智能发布国内首个全场景深度思考模型Baichuan-M1-preview，引领AI大模型新一轮竞争

近日，全球AI大模型竞争进入白热化阶段，百川智能发布国内首个全场景深度思考模型Baichuan-M1-preview，标志着这一轮军备竞赛达到。该模型具备语言推理、视觉推理和搜索推理三大能力，在多个权威评测中超越了GPT-4o、Claude3.5 Sonnet等模型，并在百小应App上线。

Baichuan-M1-preview 的核心能力与优势

全场景推理能力：Baichuan-M1-preview 同时具备语言、视觉和搜索三种推理能力，能够处理更复杂的问题。
卓越的数学和代码能力：在数学基准测试和代码任务上超越了o1-preview等模型，展现出强大的逻辑推理和代码理解能力。
领先的视觉推理能力：在MMMU-val、MathVista等权威评测中，其视觉推理能力超越了GPT-4o、Claude3.5 Sonnet等模型。
医疗循证模式：Baichuan-M1-preview 的一大亮点是其医疗循证模式，能够像资深医疗专家一样进行深度思考，并基于亿级条目的循证医学知识库提供可靠的医学解答，显著提升了医疗推理的可靠性。

医疗循证模式详解

Baichuan-M1-preview 的医疗循证模式，通过自建的涵盖亿级条目的循证医学知识库，并对证据进行多层分级和专业分析，避免信息混杂导致的误判，最终形成全面、连贯的医学结论。此模式提升了模型医疗结果的可信度，也为大模型在医疗等高度专业领域的落地应用指明了方向，可辅助临床诊断和治疗，提升医学科研效率，并为患者提供可靠的第二诊疗意见。

Baichuan-M1-14B 开源及技术细节

百川智能开源了Baichuan-M1-14B模型，该模型在权威医学知识和临床能力评测上表现优异，超越了更大参数量的Qwen2.5-72B-Instruct。其技术细节包括：

万亿级token严肃医疗数据：涵盖中/英文专业医疗论文、真实医疗病例、教材书籍等，并进行数据合成，生成超千亿token高质量医疗推理数据。
多阶段领域提升方案：将训练分为通识提升、医疗基础知识提升和医疗进阶知识提升三个阶段，逐步提升模型能力。
系统化强化学习训练流程：采用ELO、TDPO和PPO等方法，提升模型生成质量、逻辑推理能力和用户偏好贴合度。

大模型推理能力的突破与未来

Baichuan-M1系列模型善于通过深度思考解决复杂推理问题，尤其擅长复杂医疗问题的推理。这代表着大模型技术发展的一个新阶段，即从单纯的预训练Scaling Law向强化学习Scaling Law的转变，模型能够像人类一样进行系统性的思考，解决更复杂的问题。百川智能选择医疗领域作为突破口，展现了其挑战难题、推动AI技术进步的决心。

联系作者

文章来源：机器之心
作者微信：
作者简介：专业的人工智能媒体和产业服务平台

阅读原文

# AIGC动态 # AI辅助医疗诊断 # 医疗AI推理模型 # 国产大模型医疗应用 # 大模型医疗长尾应用 # 百川智能医疗技术

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

最懂医疗的国产推理大模型，果然来自百川智能

国内首个全场景深度思考模型问世。

百川智能发布国内首个全场景深度思考模型Baichuan-M1-preview，引领AI大模型新一轮竞争

Baichuan-M1-preview 的核心能力与优势

医疗循证模式详解

Baichuan-M1-14B 开源及技术细节

大模型推理能力的突破与未来

联系作者

阿里云通义大模型新技术：MoE模型训练专家平衡的关键细节

自由画布第一波实测，边玩边把DDL列表清空了

相关文章

暂无评论