springlys 2017-08-22
Innoplexus 端到端的生命科学研究平台使用人工智能产生智能数据和见解,来协助生命科学公司更有效地对药物进行可行性评估。该平台以创建促进决策的自动化服务产品为目标,编译了数亿兆字节的科学信息,分布于临床试验数据库、生物学数据库、主要的专利局、论坛和监管机构。
作者 | Julian Mitchell
编译 | Rik R 刘燕
人工智能和机器学习应用的增加正在稳步改变医学研究与治疗的模式,使研究者能够实时访问每一份白皮书,以及遗传疾病方面的临床病例研究。通过开发这样一个复杂的信息数据库,研究人员不仅可以了解全方位的医疗条件,还可以进一步缩短开发治疗方案所需的时间。
Innoplexus 成立于 2011 年,是一家技术及产品开发公司,专注于解决制药和生命科学行业的复杂问题。该公司 CEO Gunjan Bhardwaj 在创立 Innoplexus 之前曾为 Ernst & Young 和波士顿咨询集团工作。
针对药物临床前期、临床期、监管期以及商业化阶段,其端到端的生命科学(Life Sciences)研究平台使用人工智能产生智能数据和见解,来协助生命科学公司更有效地对药物进行可行性评估。该平台以创建促进决策的自动化服务产品为目标,编译了数亿兆字节的科学信息,分布于临床试验数据库、生物学数据库、主要的专利局、论坛和监管机构。
除了加强研究力度,Innoplexus 还致力于帮助生命科学和医疗保健机构利用这些技术来提高信息搜索水平。例如,一位药品开发人员或许正在寻找现有的研究,一位医学研究人员可能在寻找替代疗法,或者一位医生在试图找寻有关某一疾病的数据——增加获取相关信息的机会,能够消除发现障碍,并促进研究成果的快速增长。
以下是一份针对 Innoplexus 公司联合创始人 Guarav Tripathi 的问答,内容主要涉及三个方面:公司愿景、医疗行业研究的干扰,以及人工智能如何定义现代医学的未来。
你创办 Innoplexus 的动机是什么?你看到了哪些具体的市场空间或机会?
Gaurav Tripathi:生命科学行业所依赖的大部分信息,都是基于一个过往的数据与分析咨询模型。从本质上讲,数据是通过人工方式进行收集和策划,然后以高溢价被出售给客户。这种信息在某些行业可能会有所帮助,但在药物开发和医学研究等研究密集型领域中,专家们需要更全面且可理解的数据资产。我们设想的解决方案是一个自动化数据即服务(DaaS)模型,允许用户实时、无缝地使用数据。我们还建立了一个分析即服务模型(AaaS),为业界提供持续的和定制化的见解,这种方式在以前是无法实现的。这些见解能够使数据更有利于决策支持,但无法连续获得,往往存在于需要大量人力的时间密集型批量作业中。由于健康产业发展很快,数据的访问和分析速度变得至关重要。
怎样改变医学研究与治疗的模式?
Gaurav Tripathi:研究人员的知识水平、测试范围有限,且无法获取可访问的数据平台上存储着的全部信息。有关医学、研究和病患的全部数据资产往往不会被开放给他们,或是分布在几十、几百个信息源中。我们的目标是信息的民主化,将成千上万个信息源中的数据汇总到一个易于使用的平台上,利用最新的人工智能和机器学习技术,为生命科学专家提供相关信息,帮助他们以更低的时间与资金成本来实现自己的目标。这种模式不仅限于研究领域,如果医生可以通过这类平台获得更多数据及诊断工具,就可以快速学习和使用其他人更为丰富的经验,更快地确诊疾病、制定出治疗方案。当这些行业的专业人员拥有了更好的数据,创新的脚步就会加快。
你们的专利技术和核心服务是什么?
Gaurav Tripathi:我们一开始建立了一个综合数据服务平台(iPlexus),凝聚了整个生命科学领域的数字图谱,以期帮助行业打造一个之前从未有过的数据资源集。这使我们能够为特定的业务用例构建更多连续的分析应用程序,从而使信息的可操作性更强。客户向我们的平台和特定的应用程序授权,来帮助他们充分利用好现有的数据资产。如果他们需要在平台上添加定制化的应用程序,我们会为他们提供所需的技术、基础设施和支持。我们还允许第三方在我们的平台上建立应用程序,并正在努力建立一个强大的开发生态系统,以帮助培养更多的创新。我们的主要目标是实现数据访问与数据消费的无缝化,同时通过直观的用户界面来提供连续洞见。
困扰医学研究领域的最大陷阱或障碍是什么?你的直接解决方案是什么?
Gaurav Tripathi:无论是围绕具体分析用例的零散方法,或是大规模的大数据方法,都由于工作的单一性而失败。因此,我们认为大数据需要一个通用人工智能平台。如果没有人工智能平台,制药公司和医疗保健公司可能会投资于基于较小数据工具的研究,可能会徒劳无功。这种投资的失败可能意味着错过了一个生物标志物,或是研发某种药物而失败。利用人工智能解决方案来帮助他们利用所有可用数据的公司更可能从他们的研究中看到投资回报率(ROI)。我们的平台 iPlexus 可以从网页和企业资源库中自动爬取大量数据,根据具体使用情况进行聚集,并分析他们的模式、关系和实体。然后它会在一个直观的用户界面上可视化呈现出最终结果。这一过程框架被我们称为 CAAV——爬取、汇总、分析、可视化。这个想法用来确定所有已知的药物、疾病和治疗技术信息,使数据探索过程更加人性化。因此,用户不需要像使用传统的数据解决方案时那样,花几个月来获取某个数据,或是投资于专有的解决方案。
相比于众多市面上的其它技术驱动型数据库,人工智能和机器学习有哪些优势?
Gaurav Tripathi:制药和生命科学行业的数据驱动挑战是多维度的。衡量信息对大规模计算的有用程度的 4V(体积、变化、速度和准确性)标准已经过时。这些复杂的行业需要更多的智能系统。数据的深度,或相互影响的多层结构,都需要能够更快建立连接的机器。其密度之大使得基本的查询搜索也变得困难。例如,一句话可以概括出多年的研究成果。同样,该行业所涉及的数据面也很广,从出版物到基因序列,再到病患记录。旧的技术驱动型数据库依赖于已知数据,但它们天生无法探测完整的未知数据。这就是为什么人工智能和机器学习对该行业的数据可操作性至关重要。它们可以帮助我们超越人类大脑的数据推断能力,例如发现未知的模式、隐藏的网络,以及生物实体间未被发现的联系,提供这些见解可以带来重大的发现。
你如何看待公司在未来 3-5 年内的发展?你希望对这个行业产生哪些影响?
Gaurav Tripathi:我们的目标是让该平台成为企业、研究人员和学术机构搜索生命科学知识的首选来源。随着我们正逐渐向这个目标靠近,以前只有少数拥有大量 IT 预算的企业才可获得的数据,未来将被提供给行业内的中小型企业。谈到影响,我们计划与各个利益相关者合作,共同解决那些治疗效果更明显的主要问题。阶段性目标是垂直整合行业的各项数据;最终,我们将在平台周围创建一个生态系统,其上的任何开发人员或企业都将能够无缝地消费数据,或者在我们的平台上开发和发布自己的应用程序。