JadeMoon 2017-12-05
15年前,科学家们在对人类生活的大量数据进行研究之后,对人类基因组进行了测序,到目前为止,这仍然是一个巨大的挑战。
周一,Google发布了一个名为DeepVariant的工具,它使用最新的人工智能技术,从测序数据中构建出一幅更准确的人类基因组图像。在重构基因组序列方面比以前的经典方法具有更高的准确性。
DeepVariant可帮助将高通量测序读数转换为完整基因组的图像。用深度神经网络从DNA测序数据中快速精确识别碱基变异位点。
高通量测序在2000年代变得广泛可用,并使得基因组测序更容易获得。但是使用这样的系统生成的数据仅提供了有限的、容易出错的全基因组快照。对于科学家而言,区分测序过程中产生的随机错误的小突变,特别是在基因组的重复部分中,通常具有挑战性。因为这些突变很可能与疾病如癌症直接相关。
有多种工具可用于解释这些读数,包括GATK、VarDict和FreeBayes。然而,这些软件程序通常使用更简单的统计和机器学习方法来来识别突变,尝试排除读取错误。
哈佛大学公共卫生学院的研究科学家布拉德·查普曼(Brad Chapman)认为,在这个领域的挑战之一是在基因组部分,每个工具都有其长处和短处。他对早期版本的DeepVariant进行了测试,他认为这些比较困难的部分对于临床测序来说越来越重要。
DeepVariant由Google Brain团队的研究人员开发,该团队专注于开发和应用AI技术。
Verily是一家专注于生命科学领域的子公司。该团队从瓶颈基因组(GIAB)项目中收集了数百万个高通量读段和完全测序的基因组,这是一个公私合作的项目,以促进基因组测序工具和技术。他们将数据输入到深度学习系统中,并精心调整模型的参数,直到学会用高准确度来解释顺序数据为止。
去年,DeepVariant赢得了PrecisionFDA真相挑战赛的第一名,这是一个由FDA执行的比赛为的是促进更精确的基因测序。
Deep Genomics公司首席执行官Brendan Frey表示,“DeepVariant的成功非常重要,因为它证明了在基因组学中,深度学习可以用来自动训练性能优于复杂手工系统的系统。
DeepVariant的发布是机器学习可能促进基因组进展的最新信号。
Deep Genomics是几家尝试使用AI方法的公司之一,如利用深度学习梳理出疾病的遗传原因,并确定潜在的药物治疗方法。
Frey表示,人工智能的影响将不仅仅是帮助测序基因组数据。他认为,“目前阻断药物的缺口在于我们无法准确地将遗传变异与疾病机制进行对照,并利用这些知识快速确定拯救生命的疗法。”
另一个在这个领域的知名公司是无锡Nextcode,它在上海、雷克雅未克和马萨诸塞州剑桥设有办事处。无锡Nextcode已经积累了世界上最大的全测序人类基因组序列,并且该公司正在大量投资于机器学习方法。
DeepVariant也将在Google云端平台上提供。谷歌及其竞争对手正在疯狂地将机器学习功能添加到他们的云平台上,以吸引任何想要使用最新的人工智能技术的人。
总的来说,AI在未来几年帮助很多方面的医药领域取得了巨大的飞跃。有很多机会可以挖掘许多不同类型的医疗数据,例如图像或医疗记录,可以预测人类医生可能会错过的疾病。
但基因组医学代表了一个特别大的机会,因为数据的规模和复杂性是前所未有的。 Frey表示,“这是历史上第一次,我们测量生物学的能力,甚至是对它采取行动,远远超过了我们理解它的能力。AI是我们解释和处理海量数据的唯一技术。这将彻底改变医学的未来。”