SLAMTEC 2018-12-21
【新智元导读】AI医疗的神话真的被舆论筑得有点太高了!人们应该把关注落到地上,AI工具越来越多地走进中国医院,医生的真实使用感受如何?AI真的能辅助决策?还能帮医生“做科研”,“发论文” ? 答案,恐怕比你想的要复杂,要精彩…
当DeepMind 宣布让AlphaGo “退休”,组建 DeepMind Health 大举进军智能医疗之后,这家名震一时的公司也未能免俗地陷入了商业变现的泥石流。
两年多的时间里,DeepMind Health 在医疗领域取得了不少成果,包括研发出能在几秒钟内比人类眼科专家更准确地检测出 50 多种眼疾的 AI。然而,或许是 AlphaGo 留下的光芒过于耀眼,DeepMind 没能再次创造出举世轰动的奇迹。
2018年11月,谷歌母公司 Alphabet 宣布重组,将 DeepMind 医疗业务拆分出来,并入新组建的 Google Health 部门。原有的 DeepMind Health 将不再作为独立的子品牌存在。
这一举措体现了谷歌下注智能医疗的决心,同时也反映了当前智能医疗创业公司普遍所面临的困境——DeepMind 无疑是世界最顶尖的 AI 研发团队,连他们都啃不动的骨头,其他人该从何处下口?
于是,很多人开始担心,智能医疗的泡沫是不是就快要破了?
时间拉回到 7 年前。
2011 年,IBM 的认知计算系统 Watson 在美国最受欢迎的智力问答电视节目《危险边缘》中击败了人类冠军,在全美乃至世界范围内掀起了不啻 AlphaGo 的人工智能热潮。
随后,IBM 宣布让 Watson 进军包括医疗在内的一系列商业领域,直到今天,在不少人心目当中,IBM Watson 都是“智能医疗”的代名词。
2015年,IBM 组建了 Watson Health 部门,致力于找到人工智能与其他技术的最佳整合方式,助力医疗及健康领域的专业人士应对全球最严峻的医疗挑战。
IBM 组建 Watson Health 部门,致力于用人工智能助力医疗健康
如今,IBM Watson Health 已经发布了 150 多个解决方案,覆盖医疗支付、服务提供、政府管理、生命科学四大领域,形成了一个贯穿医疗健康领域多个关键环节的创新认知和解决方案完整链条,除了一系列正在研发的认知科技解决方案之外,已经发布的包括:
医疗不仅是医学问题,也是社会问题。Watson Health 的案例说明,除了领先的技术以及与顶级医院或医学院达成合作,智能医疗要落地,还需要找对场景,找准商业模式,说服政策制定者、监管部门、医院领导、临床医生、患者及家属、保险公司等无数当事人,以及十年乃至更久的时间。
要做到这一切,如果不依托资金雄厚且在行业里有大量积累的平台型公司,几乎是不可能实现的。不管你愿不愿意承认,智能医疗是巨头的游戏,这也是 Alphabet 出面整合组建 Google Health 的原因之一。
有了人工智能,医学治疗的将不再是一些毛病,而是人类本身。基于病人的临床症状和观察结果,不同人的健康状况之间存在着很大的差距,不仅仅是身体素质,还包括这个人的社会经济地位、家庭环境、成长历史。
除了基因和医疗,社会经济地位、家庭环境和个人生活习惯都对一个人的健康和寿命有影响。来源:Kaiser Family Foundation
理想的智能医疗,能够将这些社会决定因素以及决策支持系统考虑进去,而决策支持系统则是建立在广泛的标准和各式各样的任务上。例如,基于过去在类似患者上做过的工作开展深度个性化护理,或者指导医护人员获取最新信息,帮助他们做出最有效的决策。
作为智能医疗最早的践行者,IBM Watson Health 目前已有两款产品进入中国:Watson 肿瘤解决方案 (Watsonfor Oncology, WfO) 和 Watson 基因解决方案 (Watson for Genomics, WfG)。
根据在中国推广 WfO 和 WfG 的百洋智能科技提供的数据,截至 2018 年 11 月 4 日,Watson 肿瘤解决方案 (WfO) 已经在中国 20 多个省份、40 多座城市共 81 家医院签约落地。此外,有 261 家医院使用过 WfO,系统内注册医生 1133 人,使用过这一系统的医生有 785 人,共有 4 万多名患者体验过 Watson 肿瘤系统的服务。
“Watson 可以帮助年轻医生成长,提高资深医生的效率,避免医生出错,是不知疲倦、不耍脾气的忠实助手,还是毫无保留的互动者。”中国临床肿瘤学会 (CSCO) 常务理事、秘书长江泽飞表示:“AI 之于医生就像 GPS 之于驾驶,为新司机指路省心,为老司机引路省力。”
同济大学附属上海市第十人民医院肿瘤科主任、肿瘤学教研室主任、主任医师许青举了这样一个例子。他们接收了一位罹患十二指肠癌的病人,将患者信息输入 WfO 后得到了非常好的病例推荐。
Watson 肿瘤解决方案 (WfO) 操作界面。来源:IBM Watson Health
“当时,Regorafenib(拜耳公司开发的口服多激酶抑制剂,靶向血管生成,基质和致癌受体酪氨酸激酶。自 2009 年以来,它被研究作为多种肿瘤类型的潜在治疗选择,2015 年已获得两项美国先进癌症批准)还没有上市,WfO 就已经推荐使用这个药物了。”许青教授说。
去年开始,这个病人进行了 Regorafenib 的临床应用。“WfO 给出的建议治疗方案里,不仅有用药方案,比如 160 毫克一天,用 21 天,休息一周,28 天一个周期,还会列出这些药不适合跟其它药物的联合应用,以及备案反应的情况,比方说在亚洲患者里面,有消化道出血的病人、有穿孔的病人要特别谨慎。”
“对刚刚上市的药品来讲,WfO 对临床医生,特别是年轻临床医生的辅助是非常重要的。不仅如此,WfO 还会打印出很多患者教育的材料,告诉患者应该注意哪些问题。”
上海、北京、广州等地的大医院都承担着一些附属医院的会诊工作,但让这些医院的医生每次都去现场指导是不现实的。IBM Watson 可以让大医院的医生从去隐私、脱敏的病人基本信息输入到病情的分期、病理诊断方案、用药的顺序对附属医院的医生进行演示,对远程会诊、远程医疗起到比较好的作用。
许青教授表示,上海十院应用了 WfO 之后,他们与河南周口市中医院肿瘤科主任张跃强的团队做了多次基于 IBM WfO 的远程会诊,大家都非常满意,通过这种方法,患者能够得到符合国际最新标准的规范化治疗。
南京市第一医院肿瘤科的陈锦飞教授团队,利用 WfO 与哈佛大学的教授进行了多学科的远程会诊讨论,实现了便利的国际交流。
多学科会诊中客观中立的专家
在像肿瘤这样的复杂疾病诊疗过程中,会采取一种叫做“多学科专家组会诊”的方法。多学科协作诊疗模式 (Multi-Disciplinary Team, MDT) 指的是临床多学科工作团队,针对某一疾病进行的临床讨论会,从而制定出治疗方案。
在肿瘤诊疗中,通常包括肿瘤外科、肿瘤内科、介入科、放疗科、影像科、病理科及护理团队和基础研究团队。在欧美国家,多学科诊疗模式 (MDT) 已成常态,英国甚至已经立法,规定每一位癌症患者都需经过 MDT 综合治疗。
但参与会诊的各个专科医师从自身角度出发,给出的诊疗意见往往不同,有时候很难达成一致。“一些 MDT 的组长因为个人知识层面的局限性,可能会出现一些偏差。老司机开车偶尔也会绕弯路,”许青教授说:“这个时候如果有电子化、第三方客观的规范的指引,就能确保 MDT 大的方向不会犯错,引导 MDT 朝着一个比较正确的方向发展。”
当专家意见不能达成一致时,医生只需要在 Watson 肿瘤系统中输入患者的各项病例信息,Watson 就能快速给出治疗方案,包括推荐方案、考虑方案和不推荐方案三档,以及推荐与否的原因。Watson 得出的结论都是科学客观且符合循证医学原理的,不但能提高会诊效率,还能在一定程度上保证会诊的讨论和质量。
许青教授介绍,上海十院在原有的 MDT 模式上进行了创新,让患者及其家属也参与到诊疗过程当中,这种人工智能 + 多学科专家会诊 + 患者及其家属的“三位一体”模式,“让患者非常满意”。
在国内最早引入规范化、制度化 MDT 的浙江大学医学院附属邵逸夫医院,MDT 人工智能决策已经参与到了远程 MDT 中,比如邵逸夫医院和美国梅奥医院(2017-2018年度美国最佳医院排名第一的医院)的远程会诊。患者不出家门,就能得到各地专家最新的治疗方案。
传统的病例教学主要采取“师带徒”的形式,不同的老师带出来的学生水平也不尽相同。有时候同一个病例,不同的老师即使结论相同,但给到学生的解释却有差别。相比之下,给 Watson 输入同一个病例,一定会得到相同的结论和解释,这对于学生的规范化培养起到了很大的帮助。
此外,每个病例的复杂程度也不一样,有时候临床带教老师非常辛苦,WfO 就成了一个很好的教学工具,能够不厌其烦地把诊治流程详尽地解释给年轻医生,后者在学习过程中,也了解了从诊断到治疗方案的选择是怎样一个过程。
“每个周四我们都会安排两到三例的患者做教学查房,也会邀请其他学科进行讨论,建立了相关的较完整的多学科病例讨论的模式。”许青说。
除了年轻医生,Watson 对资深医生也能起到帮助作用。在如今信息爆炸的时代,医疗信息几乎每天都在更新,“我感觉大学五年学的东西到现在几乎没用,”江泽飞说:“知识更新这么快,我们会面对一个巨大的问题,很多书读了后才知道没什么用,或者就封面上一句话有用。”
人工智能能让医生快速便捷地获取前沿信息。WfO 曾在美国历史最长、规模最大的癌症中心——纪念斯隆凯特琳肿瘤中心 (MSKCC) 接受了严格的训练,学习了 330 多种医学期刊、250 本肿瘤专著及 2700 多万份的论文研究数据,其中包括基于美国国家综合癌症网络 (NCCN, 由美国 28 个癌症中心组成的联盟,其中大多数被美国国家癌症研究所指定为综合癌症中心) 的癌症治疗指南,以及 MSKCC 在美国 100 多年癌症临床治疗实践经验。
此外,许青表示,Watson 强大的文献搜集功能和不断更新的数据库,还能够帮助医生快速调出相关文献,省去了查阅文献的时间,对于不熟悉领域的知识,也方便在比较短的时间里了解和掌握。
Watson 肿瘤提供的诊疗方案与 MSKCC 顶级专家团队方案符合度超过 90%,覆盖 13 个癌种。WfO 只会在已知的知识范围内给出合适的方案,不会给出未经临床验证的方案,而且它还会不断地快速学习和更新进步。
肿瘤领域都有相应的指南和规范,比如说外科的最新指南、内科的最新指南、病理科、影像的最新进展。有时候,医生会因工作繁忙而及时无法细看。“WfO 把以往书面的或者说散的规范和指南,形成了智能化、便捷式的方式,供临床医生第一时间更便捷地获得它。”许青教授说。
“指南是一个框架,Watson 是把指南个性化了,具体到某个病人身上会是什么样子。”一位被访专家补充说。
今年 6 月在权威医学会议、美国临床肿瘤医学会 (ASCO) 年会上发表的一项研究证实,WfO 可以提高临床决策和指南规范性,与 WfO 方案一致的胃癌患者能够获得更好的预后,WfG 可以辅助 NGS(高通量测序技术)伴随诊断技术,进一步提升靶向/免疫药物在临床治疗的精准性。
WfG 操作界面。来源:IBM Watson Health
除了作为诊疗决策辅助工具,IBM Watson 在医学研究和论文发表中也发挥着越来越大的作用。
IBM Watson Health 帮助全球各地的医疗专业人员和研究人员将数据和知识转化为洞察,做出明智的患者医疗决策。2018 年上半年,IBM 与合作伙伴一共发布了 160 多份证据,包括在同行评审医学文献以及美国临床肿瘤医学会 (ASCO)、ISPOR 和 ADA 等主要科学活动中发表论文。
从 WfO 和 WfG 进入中国以来,中国的医生做了很多的验证和论证工作:WfO 在中国开展的验证等各项研究 18 个,完成 9 个,发表 9 篇文章,其中在 2018 年 ASCO 年会上发表摘要 5 篇,全文投稿 2 篇;WfG 在中国开展了 10 个研究,完成了 3 个,去年有 1 篇在 ASCO 年会发表,全文投稿有 1 篇,还有几个正在进行当中。
2018 年 ASCO 年会有 6 篇中国医生投稿的 Watson 研究文章被收录:广东省人民医院张绪超教授用 WfG 做的研究、江泽飞教授在 CSCO 发表的乳腺癌研究、北大肿瘤医院武爱文教授的 2 篇论文、南京大学第一医院陈锦飞教授的胃癌研究,还有许青教授的文章。
许青教授介绍,上海十院参与了美国临床肿瘤学年会,向国外医疗机构分享“三位一体”模式。相关论文在 ASCO 发表。
北大肿瘤医院把 WfO 在二期结肠癌高危患者当中提出的治疗方案,与北肿的 MDT 的决策团队对比,结果发现,Watson与医院方案的符合率高达89.1%,与国内顶级医院的决策高度一致。
另外一研究来自南京市第一医院陈锦飞教授团队,研究人员调取 300 多位胃癌术后经治患者的病历资料和治疗方案,以重演的方式,把病人的资料输入 WfO,将 Watson 的推荐方案与医生实际使用的方案进行一致性对比。结果发现,跟 Watson 推荐方案一致病人的存活率是 29.2 个月,不一致的存活率是 25 个月。不要小看这 4 个月的时间,事实上,有时候一款新的肿瘤药物也只能延长患者几个月的生命。
北卡罗莱纳州立大学对 1000 多个病例做了回顾性的对比研究,之前分子肿瘤学专家团队要发现这些可治疗的突变需要很长时间,而 WfG 只花了不到 3 分钟,就发现了人类专家找到的 99% 的突变。不仅如此,WfG 发现了额外的 32% 病例中的突变,这是人类专家原先没有发现的。美国肿瘤癌症中心的负责人 Norman Sharpless 教授专门为这个对比性研究写了一篇文章,证明了使用认知计算能够更好更快地对基因数据进行精确的分析。
广东省人民医院张绪超教授团队使用 Watson 基因组学解决方案 (WfG),对 115 例肺癌患者的 NGS 数据进行解读,发现专家组平均每周解读 10 例,而 WfG 可以在 30 分钟内完成 10 例样本数据的解读。比较后发现,WfG 的解读结果不仅将专家组的解读结果完全覆盖,而且 56.52%的样本 (65例) 由 WfG 解读出额外可干预的变异位点 (actionable mutation)。
今年 ASCO 年会发表的另一篇中国医生论文,使用 WfG 在 43% 的样本中发现了和人工标记出同样的基因突变,在剩下 57% 的样本中识别出平均 1.54 个额外基因突变。
在 CSCO 的盛会上,江教授的学生总结认为,WfO 的优势是坚持证据优先,文献支持、立足数据不纠结,做到学习、吸收,同时要重视创新和提高。
当然,IBM Watson Health 还有很多需要提高的地方。
近来关于 Watson 的负面新闻也甚嚣尘上。但在所有这些事件中,没有任何一件是直接针对 Watson 的技术提出质疑。实际上,纵览当前智能医疗业界,Watson Health 是当之无愧的前瞻者。
如果非要说 Watson 没有达到预期,在很大程度上是因为人们把智能医疗技术给“神化”了,还有就是缺乏对 Watson 工作原理的了解。
优质医疗大数据
与所有的机器学习系统一样,Watson 认知计算也需要大量的数据。美国的临床医疗数据库里,积累了医生在临床实践中留下的成千上万个病人的标注数据。但是,这些标注是医生为了辅助他们自己的工作进行的,往往不适合用于训练人工智能系统。
而为了训练智能系统,请医生专门对大量的医疗图像进行标注又是不现实的,因为这需要耗费大量的人力和时间成本。此外,不同于其他类型的数据标注,医疗图像标注需要丰富的临床经验,即使是资深医生,有时候也会在某个标注上产生意见分歧。
因此,这件事情只有靠计算机设计深度学习算法来完成。而要设计深度学习算法,关键就是带有准确标记的医疗图像大数据。于是,这就成了一个典型的进退两难问题。
美国国家卫生研究院(NIH)临床中心在几个月前开源了大型 CT 图像数据集 DeepLesion,这也是迄今全球规模最大的多类别、病灶级别标注的开放获取临床医疗图像数据集。DeepLesion 项目技术负责人、现平安科技美国东部研究院院长吕乐博士在接受新智元采访时表示,为了构建 DeepLesion 数据集,研究人员倾注了一年多的时间,期间在计算机视觉顶会 CVPR 以及国际医学图像计算与计算机辅助干预大会 (MICCAI)、北美放射学年会 (RSNA) 等医学和放射影像国际顶会上,先后发表了 12 篇研究论文。
上面说的,还仅仅只是医疗的二维图像数据,更不用提 fMRI、电子病例、保险单等等等等各种不同类型的数据。
从 2015 开始,IBM 就一直在医疗数据收购方面大力投入,迄今已经投资了 40 多亿美元用于收购医疗技术公司,包括医疗数据公司 Explorys 和 Truven,医疗管理软件公司 Phytel,医学成像软件公司 Merge Healthcare。
Explorys 和 Phytel 拥有 1 亿脱敏的病例资料;Truven 有 2 亿的医保索赔纪录;Merge Healthcare 有 3000 万份医学影像。到目前为止,IBM 汇聚了总量超过 60 万 TB,覆盖约 3 亿人口的去隐、脱敏数据。
除了数据,还有一个更加本质的问题。Watson 肿瘤解决方案内部有一个非常先进的基于循证医学的决策支持引擎,由 IBM Watson 和 MSKCC 的专家共同开发并训练。
在训练时,WfO 首先会接收到护士、医生所填的去隐私的与患者相关的具体的属性和具体的病例情况,这个引擎能够进行自动化的分析,之后它将会利用自动检索、自然语言处理、个性化分析、自动推理等技术,动态分析各类假设和问题,为医生提供一系列的推荐治疗方案建议,哪些方案是根据循证医学是优选的,哪些是次选的,并且每项建议都会列举出具体的循证医学证据。
Watson认知决策系统工作流程示意图。来源:seekingalpha.com
但是,这反过来也意味着,当没有明确的证据时,Watson 就没有训练数据,因此反馈诊疗建议也就无从谈起。
这里要特别强调一下,Watson 肿瘤解决方案是不做诊断的。WfO 是一个辅助决策支持系统,它仅仅是为医生提供治疗的选择方案,最终的决策权是在医生和患者的手中。
最好的学生和老师
Watson 最大的特点,就在于它能快速地学习和进步。
而这给了未来医疗无限的可能。
2017年,Watson “医生”新增癌种 4 个,新增治疗 6 项,各项指标都在持续地升级和改进。到 2018 年,WfO 已经覆盖了 13 个癌种,分别是乳腺癌、肺癌、直肠癌、结肠癌、胃癌、宫颈癌、卵巢癌、前列腺癌、膀胱癌、肝癌、甲状腺、食管癌和子宫内膜癌。
未来两年 Watson 还将新增 3 个癌种。
“很快,IBM Watson 肿瘤解决方案就会纳入中国的指南。我们也要感谢中国医生在使用过程中提出的建设性意见,这使得我们的系统越来越成熟。”IBM Watson Health 副总健康官、肿瘤学家 Nathan Levitan 表示。将来,Watson 肿瘤将更适合中国的医患。
Nathan Levitan 说:“Watson 肿瘤并不是一个静态的系统,这个系统正在与全球范围内的医生合作,并根据当地的市场需求做出微调和改善。同时,它也是不断丰富自身的功能,学习更多的内容。”