![]() ![]() 作者|牛贝塔 编辑|Jessica 今年春节,如果你回了老家,可能会发现一个有趣的现象: 七大姑八大姨们的养生导师悄悄换了人,他们不再热衷于转发标题惊悚的营销号文章,有点头疼脑热,第一反应是先问问AI;拿到一份天书般的体检报告,也是顺手截图,发给AI帮忙划重点、做解读。 尤其是登上春晚的“蚂蚁阿福”,借着顶级流量的破圈效应和一个喜气洋洋的好名字,迅速收割了从Z世代到银发族的全龄段粉丝,热度堪比AI健康界的豆包,成了国民数字健康新宠。 ![]() 就在这些AI+健康应用忙着跑马圈地、争夺用户时,学术圈的“卷王”们却一头扎向了另一个更硬核的方向: 让AI深度参与、甚至重塑临床诊疗的核心环节。 最近,斯坦福和普林斯顿的团队发布了首个医疗“世界模型”MedOS,它不再满足于让AI在屏幕上打打“嘴仗”,而是试图让AI理解手术刀的力道、感知药物在体内的代谢流动,甚至能驱动机器人进行精准的辅助操作。 ![]() 几乎同一时间,上海交大的团队在《自然》上秀出其开发的DeepRare系统,其像一个会“边思考边写病历”的AI医生,每一步诊断推理都清晰可视、有迹可循,仿佛给AI装上了实时工作的“思维导图”,实战水平相当能打。 测试数据显示,在最具挑战性的场景下,即没有基因检测结果,仅凭病人的临床症状,DeepRare系统对罕见病的首次诊断准确率就达到了57.18%,将原有国际最好模型的纪录提升了近24个百分点。 一边,是国民级应用火爆出圈,日活轻松突破千万,深入寻常百姓家;另一边,是硬核技术不断“捅破天花板”,剑指诊断、手术等临床核心腹地。 这“冰火两重天”的景象,看似分裂,却共同指向一个清晰的信号: 熬过了漫长概念炒作期的医疗AI,在2026年,正式驶入了价值的深水区。 ![]() AI学会拥抱复杂现实: 从“应试高手”到“临床老手” 诺贝尔奖得主丹尼尔·卡尼曼在《思考,快与慢》中,将人类的思维决策描绘为两个系统: 系统1是快速、自动、直觉式的“快思考”,处理日常熟悉状况;系统2则是缓慢、理性、需要专注的“慢思考”,用于解决复杂计算和疑难问题。 在医疗领域,前者好比老道的医生一眼识别出常见感冒,后者则如同专家会诊时,面对罕见病征进行的抽丝剥茧般的深度推理。 如今,MedOS的面世,正是以这种“双系统”架构,试图复刻并超越人类医生的决策模式,构建AI对医疗物理世界的动态理解能力。 它的“快系统”能处理实时风险预警与毫秒级操作,例如在手术中预判出血风险并瞬间调整机械臂轨迹,其反应速度超越了人类神经传导。 而“慢系统”则负责全局策略规划,整合患者全周期的病史、影像、基因组等多模态数据,为从诊断、治疗到康复的完整路径制定最优方案。 基于此,你可以构想一场未来感十足的手术: 主刀医生佩戴智能眼镜,系统同步获取第一视角画面;AI在云端充当“超级外脑”,实时分析画面,识别关键解剖结构,提示风险;同时,它将分析结果同步给手术台旁的协作机器人,让其担任“AI一助”,在现实世界中对手术操作进行稳定、避让或精准递送等辅助干预。 ![]() 当然,MedOS的野心不止于充当一个高级工具,它试图理解诊疗本身作为一个动态复杂系统的全貌。 曾几何时,评价一个医疗AI“牛不牛”,主要看它能不能在执业医师资格考试中拿高分。但医生们心里都清楚: 考试考的是理想化、标准化的知识,而真实的病人,从来不按教科书生病! MedOS给出的解法是什么? 答案是,构建一个“状态-动作-结果”的模拟环境,让AI不仅知道“某种药能降压”,更能推演“这个药对眼前这位合并特定肾病、有着独特基因谱的患者,其血压、肾功能、电解质会产生何种动态、连锁的影响”。 在面对复杂的癌症病例时,MedOS能自主识别关键基因突变,自动调用国际癌症基因组图谱等数据库,挖掘共突变模式,执行生存分析,并生成结构化的预后评估报告。 可以说AI的一小步,临床的一大步! 当然,AI要想真正踏入临床核心区,除了理解世界的复杂性,还必须攻克两大信任难题: 第一,杜绝“幻觉”,不能输出错误但看似合理的答案,毕竟,AI+医疗信口胡诌不仅要钱更要命。第二,打开“黑盒”,让决策过程透明可信。 这,正是上海交大DeepRare系统所补上的关键一环。 ![]() DeepRare诞生 AI打开黑盒说亮话 如果说MedOS试图让AI理解手术刀的物理力道,那么DeepRare的野心,则是让AI学会像人类顶尖专家一样进行“慢思考”,在罕见病临床症状的迷雾中,一步步提出假设、检索证据、交叉验证,最终点亮确诊的灯塔。 DeepRare并非一个简单的疾病分类模型,它是全球首个“可溯源智能体式罕见病诊断系统”。你可以把它想象成一个由AI驱动的、高度协同的“赛博专家会诊中心”: 系统内部设置了多个专业“智能体”,有的擅长从海量医学文献中检索最新证据,有的专精于在庞大病例库中寻找表型相似的患者,有的则负责深度解析基因变异数据。所有这些“专家”由一个中央“调度员”协调,有序开展工作。 其最革命性的设计,在于“白盒化”: 每一次诊断,系统都会生成一条完整的“逻辑证据链”,清晰展示从初始假设生成、多源证据检索与评估,到最终结论修正的完整思考过程。 这相当于给AI配备了一个实时绘制、全程直播的“思维导图”,让它的思考不再是神秘不可知的“黑箱”,而是医生可以审阅、质疑甚至参与协作的开放过程。 ![]() 值得一提的是,DeepRare的诞生,直指罕见病确诊难的全球性临床困境,全球有超过3亿罕见病患者,涉及超7000种疾病,约80%与遗传相关,然而,这些患者平均要经历长达5年以上、辗转多位医生的“诊断奇幻漂流”,才能获得一个明确答案。 困境的根源,在于人类认知的局限与疾病的极端复杂性:任何医生一生中见过的特定罕见病例都可能寥寥无几。 DeepRare带来了诊断范式的代际升级,它从三个维度重构了医疗AI的能力边界: 第一,全域知识链接,打破医学数据孤岛,深度整合海量文献与真实世界病例数据,为推理构建坚实的知识底座。 第二,拥有“慢思考”能力,跳出传统AI基于模式匹配的“快思考”逻辑,模仿人类专家的思考路径: 主动提问以补充关键信息,通过“假设-验证-自我反思”的迭代循环,不断推敲线索、修正逻辑。 这种反思机制,正是对抗AI“幻觉”的利器。 第三,实现全流程白盒推理,生成的诊断报告附带完整证据链和可验证的引用,让医生不仅能知其然,更能知其所以然,从而敢于采纳、便于复核,建立深度信任。 ![]() 在仅凭临床症状的最严苛测试中,DeepRare首诊准确率57.18%的成绩,比之前最佳模型提升近24个百分点。 这意味着,在缺乏昂贵基因检测条件的基层医院,医生首次获得了一把高效进行罕见病初筛的“智能钥匙”! 据悉,目前,基于该成果的平台已上线,吸引了全球超600家机构的用户,并在上海交大医学院附属新华医院进行内部部署测试,即将”融入诊疗全流程。 ![]() 这让我们感慨,一边是MedOS深入手术核心,定义AI在物理世界中的协同范式,另一边是DeepRare扎根诊断源头,重塑人机之间的信任基石。“冰火两重天”的突破,路径迥异,却共同勾勒出2026年医疗AI驶入深水区后的新航向: 不再满足于在标准化考试中当“学霸”,而是勇敢跳进真实世界的复杂性与不确定性中,用可解释、可追溯、可深度协作的硬核能力,去攻克那些最棘手的临床痛点。 不过,驶入深水区,意味着暗流更急,风浪更大。AI的诊断建议或术中辅助开始直接、深度地影响临床决策时,一系列挑战也随之浮出水面。 首当其冲的是责任界定难题,如果AI的参与导致了不良后果,责任链条该如何划分?是算法固有缺陷、训练数据偏差、医生判断失误,还是系统部署不当? 在医患关系本就紧张的当下,现有的医疗事故责任认定框架面临巨大挑战。 这要求未来的医疗AI系统必须具备比“可解释性”更进一步的“可审计性”,即完整、不可篡改地记录每一次决策交互中的所有输入、推理过程、输出建议以及医生的最终决断,形成清晰、可追溯的“数字责任链”。 其次,是漫长的临床价值验证周期。 医疗领域的创新容错率极低,任何新技术从实验室突破到广泛临床采纳,都需要经过极其严格和漫长的有效性、安全性验证。AI模型在动态、复杂的真实医疗场景中的长期表现,仍需大量前瞻性临床研究来证实。 总的来说,医疗AI的竞争,已进入比拼真实世界理解力、临床融合深度与系统工程能力的“硬核长跑”阶段,前方的海水更深,暗流更急,但航标也已清晰: 那就是以人为中心,以解决真实临床痛点为唯一价值尺度。 ![]() ![]() |