太平洋网络
产品库
聚超值
视频
站内导航

首页 > AI> 正文

学会《思考快与慢》，DeepRare、MedOS驶入AI+医疗深水区

超前实验室发布于：2026-03-04 17:11

作者｜牛贝塔

编辑｜Jessica

今年春节，如果你回了老家，可能会发现一个有趣的现象：

七大姑八大姨们的养生导师悄悄换了人，他们不再热衷于转发标题惊悚的营销号文章，有点头疼脑热，第一反应是先问问AI；拿到一份天书般的体检报告，也是顺手截图，发给AI帮忙划重点、做解读。

尤其是登上春晚的“蚂蚁阿福”，借着顶级流量的破圈效应和一个喜气洋洋的好名字，迅速收割了从Z世代到银发族的全龄段粉丝，热度堪比AI健康界的豆包，成了国民数字健康新宠。

就在这些AI+健康应用忙着跑马圈地、争夺用户时，学术圈的“卷王”们却一头扎向了另一个更硬核的方向：

让AI深度参与、甚至重塑临床诊疗的核心环节。

最近，斯坦福和普林斯顿的团队发布了首个医疗“世界模型”MedOS，它不再满足于让AI在屏幕上打打“嘴仗”，而是试图让AI理解手术刀的力道、感知药物在体内的代谢流动，甚至能驱动机器人进行精准的辅助操作。

几乎同一时间，上海交大的团队在《自然》上秀出其开发的DeepRare系统，其像一个会“边思考边写病历”的AI医生，每一步诊断推理都清晰可视、有迹可循，仿佛给AI装上了实时工作的“思维导图”，实战水平相当能打。

测试数据显示，在最具挑战性的场景下，即没有基因检测结果，仅凭病人的临床症状，DeepRare系统对罕见病的首次诊断准确率就达到了57.18%，将原有国际最好模型的纪录提升了近24个百分点。

一边，是国民级应用火爆出圈，日活轻松突破千万，深入寻常百姓家；另一边，是硬核技术不断“捅破天花板”，剑指诊断、手术等临床核心腹地。

这“冰火两重天”的景象，看似分裂，却共同指向一个清晰的信号：

熬过了漫长概念炒作期的医疗AI，在2026年，正式驶入了价值的深水区。

AI学会拥抱复杂现实：

从“应试高手”到“临床老手”

诺贝尔奖得主丹尼尔·卡尼曼在《思考，快与慢》中，将人类的思维决策描绘为两个系统：

系统1是快速、自动、直觉式的“快思考”，处理日常熟悉状况；系统2则是缓慢、理性、需要专注的“慢思考”，用于解决复杂计算和疑难问题。

在医疗领域，前者好比老道的医生一眼识别出常见感冒，后者则如同专家会诊时，面对罕见病征进行的抽丝剥茧般的深度推理。

如今，MedOS的面世，正是以这种“双系统”架构，试图复刻并超越人类医生的决策模式，构建AI对医疗物理世界的动态理解能力。

它的“快系统”能处理实时风险预警与毫秒级操作，例如在手术中预判出血风险并瞬间调整机械臂轨迹，其反应速度超越了人类神经传导。

而“慢系统”则负责全局策略规划，整合患者全周期的病史、影像、基因组等多模态数据，为从诊断、治疗到康复的完整路径制定最优方案。

基于此，你可以构想一场未来感十足的手术：

主刀医生佩戴智能眼镜，系统同步获取第一视角画面；AI在云端充当“超级外脑”，实时分析画面，识别关键解剖结构，提示风险；同时，它将分析结果同步给手术台旁的协作机器人，让其担任“AI一助”，在现实世界中对手术操作进行稳定、避让或精准递送等辅助干预。

当然，MedOS的野心不止于充当一个高级工具，它试图理解诊疗本身作为一个动态复杂系统的全貌。

曾几何时，评价一个医疗AI“牛不牛”，主要看它能不能在执业医师资格考试中拿高分。但医生们心里都清楚：

考试考的是理想化、标准化的知识，而真实的病人，从来不按教科书生病！

MedOS给出的解法是什么？

答案是，构建一个“状态-动作-结果”的模拟环境，让AI不仅知道“某种药能降压”，更能推演“这个药对眼前这位合并特定肾病、有着独特基因谱的患者，其血压、肾功能、电解质会产生何种动态、连锁的影响”。

在面对复杂的癌症病例时，MedOS能自主识别关键基因突变，自动调用国际癌症基因组图谱等数据库，挖掘共突变模式，执行生存分析，并生成结构化的预后评估报告。

可以说AI的一小步，临床的一大步！

当然，AI要想真正踏入临床核心区，除了理解世界的复杂性，还必须攻克两大信任难题：

第一，杜绝“幻觉”，不能输出错误但看似合理的答案，毕竟，AI+医疗信口胡诌不仅要钱更要命。第二，打开“黑盒”，让决策过程透明可信。

这，正是上海交大DeepRare系统所补上的关键一环。

DeepRare诞生

AI打开黑盒说亮话

如果说MedOS试图让AI理解手术刀的物理力道，那么DeepRare的野心，则是让AI学会像人类顶尖专家一样进行“慢思考”，在罕见病临床症状的迷雾中，一步步提出假设、检索证据、交叉验证，最终点亮确诊的灯塔。

DeepRare并非一个简单的疾病分类模型，它是全球首个“可溯源智能体式罕见病诊断系统”。你可以把它想象成一个由AI驱动的、高度协同的“赛博专家会诊中心”：

系统内部设置了多个专业“智能体”，有的擅长从海量医学文献中检索最新证据，有的专精于在庞大病例库中寻找表型相似的患者，有的则负责深度解析基因变异数据。所有这些“专家”由一个中央“调度员”协调，有序开展工作。

其最革命性的设计，在于“白盒化”：

每一次诊断，系统都会生成一条完整的“逻辑证据链”，清晰展示从初始假设生成、多源证据检索与评估，到最终结论修正的完整思考过程。

这相当于给AI配备了一个实时绘制、全程直播的“思维导图”，让它的思考不再是神秘不可知的“黑箱”，而是医生可以审阅、质疑甚至参与协作的开放过程。

值得一提的是，DeepRare的诞生，直指罕见病确诊难的全球性临床困境，全球有超过3亿罕见病患者，涉及超7000种疾病，约80%与遗传相关，然而，这些患者平均要经历长达5年以上、辗转多位医生的“诊断奇幻漂流”，才能获得一个明确答案。

困境的根源，在于人类认知的局限与疾病的极端复杂性：任何医生一生中见过的特定罕见病例都可能寥寥无几。

DeepRare带来了诊断范式的代际升级，它从三个维度重构了医疗AI的能力边界：

第一，全域知识链接，打破医学数据孤岛，深度整合海量文献与真实世界病例数据，为推理构建坚实的知识底座。

第二，拥有“慢思考”能力，跳出传统AI基于模式匹配的“快思考”逻辑，模仿人类专家的思考路径：

主动提问以补充关键信息，通过“假设-验证-自我反思”的迭代循环，不断推敲线索、修正逻辑。

这种反思机制，正是对抗AI“幻觉”的利器。

第三，实现全流程白盒推理，生成的诊断报告附带完整证据链和可验证的引用，让医生不仅能知其然，更能知其所以然，从而敢于采纳、便于复核，建立深度信任。

在仅凭临床症状的最严苛测试中，DeepRare首诊准确率57.18%的成绩，比之前最佳模型提升近24个百分点。

这意味着，在缺乏昂贵基因检测条件的基层医院，医生首次获得了一把高效进行罕见病初筛的“智能钥匙”！

据悉，目前，基于该成果的平台已上线，吸引了全球超600家机构的用户，并在上海交大医学院附属新华医院进行内部部署测试，即将”融入诊疗全流程。

这让我们感慨，一边是MedOS深入手术核心，定义AI在物理世界中的协同范式，另一边是DeepRare扎根诊断源头，重塑人机之间的信任基石。“冰火两重天”的突破，路径迥异，却共同勾勒出2026年医疗AI驶入深水区后的新航向：

不再满足于在标准化考试中当“学霸”，而是勇敢跳进真实世界的复杂性与不确定性中，用可解释、可追溯、可深度协作的硬核能力，去攻克那些最棘手的临床痛点。

不过，驶入深水区，意味着暗流更急，风浪更大。AI的诊断建议或术中辅助开始直接、深度地影响临床决策时，一系列挑战也随之浮出水面。

首当其冲的是责任界定难题，如果AI的参与导致了不良后果，责任链条该如何划分？是算法固有缺陷、训练数据偏差、医生判断失误，还是系统部署不当？

在医患关系本就紧张的当下，现有的医疗事故责任认定框架面临巨大挑战。

这要求未来的医疗AI系统必须具备比“可解释性”更进一步的“可审计性”，即完整、不可篡改地记录每一次决策交互中的所有输入、推理过程、输出建议以及医生的最终决断，形成清晰、可追溯的“数字责任链”。

其次，是漫长的临床价值验证周期。

医疗领域的创新容错率极低，任何新技术从实验室突破到广泛临床采纳，都需要经过极其严格和漫长的有效性、安全性验证。AI模型在动态、复杂的真实医疗场景中的长期表现，仍需大量前瞻性临床研究来证实。

总的来说，医疗AI的竞争，已进入比拼真实世界理解力、临床融合深度与系统工程能力的“硬核长跑”阶段，前方的海水更深，暗流更急，但航标也已清晰：

那就是以人为中心，以解决真实临床痛点为唯一价值尺度。

超前实验室
前沿科技，超前观察 ——超前实验室｜AI应用｜科技动向｜前沿趋势｜｜大模型｜硬核产品｜技术解读｜

学会《思考快与慢》，DeepRare、MedOS驶入AI+医疗深水区

相关推荐

热榜