在AI落地的诸多垂直领域中,医疗一直被视为“高门槛、高回报”的终极战场。过去一年,通用大模型在问诊场景里频频试水,但结果往往不尽如人意:回答看似专业,实则经不起循证推敲;用户问完即走,缺乏持续健康管理。行业亟需一场从“能聊”到“靠谱”的质变。就在近日于清华大学百川大楼举办的“AI医疗新范式”学术论坛上,百川智能创始人兼CEO王小川正式发布了新一代医疗专用大模型Baichuan-M4,以及基于企业微信生态的AI家庭医生产品“百小医”。这一步,试图用“大脑+身体”的双轮模型,撬动AI医疗长期存在的“问诊有余、可及性不足”的困局。

1. Baichuan-M4:权威医疗榜单登顶,幻觉率压降至3.3%
通用大模型在医疗场景下的三大硬伤——幻觉严重、循证推理弱、追问能力差——几乎被视为行业共识。Baichuan-M4的应对方案是“从底层算法手术”:
-
全球顶尖水平:在HealthBench、HealthBench Hard、HealthBench Professional三大权威医疗评测榜单中,Baichuan-M4均拿下全球第一,超越了GPT-5.5和Opus4.7等主流通用模型。这意味着它在医学知识问答、诊断推理、药物相互作用等核心维度上已具备显著优势。
-
极低幻觉率:得益于百川自研的“事实感知强化学习算法”,Baichuan-M4裸模型的事实性幻觉率被控制在3.3%。要知道,此前公开的医疗大模型幻觉率普遍在10%以上,这一数字直接让AI问诊的安全边际大幅提升。
-
临床深度绑定:百川智能已与北京儿童医院、中国医学科学院肿瘤医院、上海交通大学医学院附属瑞金医院三家顶级三甲医院开展联合临床研究。不是简单的“API对接”,而是让大模型直接参与真实诊疗数据的验证与迭代——这是模型从“实验室高分”走向“临床可信”的关键一步。
2. 百小医:把AI塞进微信家庭群的“健康管家”
王小川在论坛上提出了一个形象的比喻:“大脑解决能力问题,身体解决可及性问题。”如果Baichuan-M4是“大脑”,那么AI家庭医生“百小医”就是连接用户与医疗资源的“身体”。它的产品逻辑非常直白——降低使用门槛,做用户身边的“家人”:
-
即开即用,伴身式服务:“百小医”运行在企业微信生态内(百小医@百川家庭医生),用户将其添加至家庭群聊后,它就像一个“新家庭成员”一样实时在线,随时响应。不需要下载App、不需要学习复杂交互,天然适合中老年用户。
-
全生命周期健康档案:系统会自动为每位家庭成员建立独立的健康档案,并在日常对话中捕捉并结构化用户的体征、病史、检查数据。这种“无感录入”比传统手动填表高效得多。
-
主动健康干预:与传统“你问我答”的被动型机器人不同,百小医具备主动识别能力。比如家人在群里随口说“最近有点头晕”,它能敏锐捕捉到高风险信号,主动提醒:是否量过血压?是否建议预约复诊?甚至按时提醒服药。这种“事后跟进”变成了“事前预警”,价值截然不同。
3. 行业观察:AI医疗进入“精准手术”阶段
王小川在论坛上坦承,去年通用大模型在医疗问诊方面规模虽大,但用户反馈并不理想。医疗行业的深层矛盾在于优质资源的供给严重不足——中国每千人医生数仅为2.4人,而基层医疗水平参差不齐。因此,AI医疗的前置条件不是“替代医生”,而是找准产品形态:
-
从“问诊机”到“全科医生”:百小医的出现,把AI从“一次性问答工具”升级为覆盖诊前准备、诊后随访、长期健康记录管理的“全科医生”。它不追求一次给出终极诊断,而是做持续的健康监护与导诊。
-
构建四级医疗新范式:百川智能的蓝图是打通AI能力,形成“家庭级-基层医院-顶级三甲”的联动机制。家庭端由百小医做第一道筛查与慢病管理,复杂病情再精准转诊到对应医院。这种分级协作,理论上能让三甲医院的专家资源更集中处理疑难杂症,让常见病、慢病管理回归家庭和社区。
——客观来看,3.3%的幻觉率虽然远优于行业平均水平,但在真实医疗场景中,任何一次错误都可能造成严重后果,医疗AI的“最后一公里”仍需大量临床验证。百小医依附于微信生态的策略虽然降低了获客成本,但用户隐私与数据安全如何保障?家庭群聊中的敏感健康信息是否会被滥用?这些都是产品落地前必须正视的问题。不过,从Baichuan-M4的技术底子到百小医的产品形态,百川智能确实正在走一条比“大模型+通用对话”更务实的路——让AI先当好“家庭健康助手”,再谈更远的医疗变革。