过去的6年是精准医疗蓬勃发展的黄金期。基于新一代基因测序技术(NGS)的基因检测技术为临床分子检测带来了革命性的变化。基因检测正在成为从科研到临床不可缺失的一部分。
但目前大多数医院的信息化系统中,由于种种原因,并没有包含完整的基因检测数据。这就使得临床精准诊疗的数据源出现了空缺,而只有将基因数据真正与临床数据融为一体,才能得到真正可用于精准医疗的大数据。
基因检测进入临床是大势所趋
狭义的精准医疗包含了精准检测和精准治疗。作为精准检测的核心组成部分,基因测序的发展使得精准医疗迈出了跨时代的一大步。以肿瘤靶向治疗为例,并不是所有的肿瘤患者对某一款靶向药物都有应答,患者在用药前通常需要接受一次靶向药物伴随诊断,让患者得以在用药前就进行一次初步预判。
当然在这个过程中受益的不仅仅是肿瘤患者,医院的诊疗信息一直是药物研发的重要支撑,基因大数据加持下的医疗数据会使得药企的药物研发变得更加精准。
一方面,临床诊疗方面精准度的提升,终将推动医院的临床决策的质量。越来越多的医院把基因数据纳入临床诊疗的依据。从2010年至今,临床级基因检测出现了爆发式增长,各医疗机构以及院外的第三方检测机构积累了海量的基因数据。基因检测在临床上已经为各类患者提供了真实有效的辅助诊断和用药指导。
但在另一方面,在临床中不乏出现基因检测显示可以使用某靶向药,但服用后却没有任何效果用药有效性问题的案例。基因测序在临床的渗透越深,人们就越发地意识到基因与表型对应关系的复杂性。越来越清晰的认知是,精准检测的组成不应当单单只是基因检测,基于各种临床和基因的医疗信息的整合,必将推动医疗行业更加快速地进入精准医疗时代。
医基云数据研究院执行院长何新军
“我认为在基因和临床信息的整合中,将有很多信息可以挖掘。”医基云数据研究院执行院长何新军表示,“这些信息可以指导临床诊疗、助力药物研发。”
在临床组学与基因组学数据处理的探索队伍中,医基云是独特的存在。在基因信息融入临床诊疗的关键历史节点,医基云建立了临床和基因数据处理的智慧医疗平台,致力于回馈临床诊疗。
基因数据是医疗大数据的一部分
进行基因数据与临床数据处理的最终目的是为临床诊疗提供精准支撑。也就是说,不论是基因数据还是临床数据,这些最后的形式并不是独立存在,而是将成为医疗大数据的一部分。在这个多维度的数据中,很大一部分基因数据将来自第三方检测机构,但临床数据一定来自院内。
在多年信息化的推动下,医疗机构的临床系统积累的数据标准化程度比较高。但在现阶段,基因数据来自医院外,系统多种多样,数据处理标准不统一,数据质量各种各样,这就造成了基因数据的多元异构化。
“这使得由基因数据出发来处理临床数据的路径变得非常困难。”何博士告诉动脉网。且不说数据质量问题,目前基因突变与疾病之间的对应关系也并不十分明确,这些因素进一步增加了通过基因数据处理临床表型数据的难度。基于多年的工作经验,在他看来,从医疗机构已有的临床数据平台出发,基于院内数据处理院外的生物样本库和基因数据是比较有效的路径。这也是医基云与其他同类项目的最大的区别。
“医基云走的是这条路,在医疗机构实现这种智慧处理,帮助临床机构发掘医疗大数据潜能,实现数据呈现、疾病模型建立、药物不良反应的监测等。”他说道。
规范是第一步
相比其他数据,基因数据是比较“年轻”的存在,无论是数据规范还是数据质量,都有所欠缺。何博士强调,涉及到这类数据的处理,第一步必须去伪存真。数据规范化处理后,才能进行下一步的应用。“这个工作就好比是修高速公路,做的是基础工作,但需要很大的人力和资源的投入。”他这样比喻。
数据清洗后,下一步就是价值的挖掘与分析。基因与疾病之间存在一定的对应关系,但临床表型并不只接受基因的调控。生活环境、饮食结构、生活习惯、社会经济条件都会影响最终的临床表型。因此,将患者疾病史、日常习惯等数据与基因信息的结合,就有可能对疾病的影响因素有更多的发现。
但各组学间的信息的关系非常复杂,且数据量级庞大。要对这些信息进行进一步的挖掘和分析,是人力几乎不可能完成的任务。因此,要进行大规模的处理,必须依靠人工智能的力量。“这是精准医学发展到这个阶段的需求。”何新军博士表示。在这个过程中,医基云将技术平台与人工智能技术结合起来,依靠深度学习与算法的力量对医疗大数据的深层价值进行挖掘。
价值发现
医基云的定位是通过深度处理来沉淀临床信息,最终为医疗机构提供支撑,实现精准诊断和治疗。基于对基因和临床数据的深度挖掘,不仅能为医院的诊疗提供更多证据,还能在临床科研中给到研究人员更深度、更真实的科研灵感,帮助医生在临床科研中取得具有更具行业影响力的成果。
同时,医疗大数据也能够支持药厂的药物研发。目前很多靶向药物研发是围绕基因突变的靶标进行的。但正如前文所提,临床上不乏有基因检测结果显示存在突变,但服药无效的案例。深层次的信息挖掘能够对这一现象解释,从而进一步指导临床用药和药企的药物研发,精准医疗的精准程度将进一步得到提升。
“肿瘤靶向治疗离开基因检测是不成立的,靶向治疗需要有伴随诊断。”何博士表示,“院外检测获取的基因信息多局限于样本,在那个基础上做外延非常难。”精准诊断不仅仅包含基因信息,还需要考虑临床表征、疾病史等维度。在医基云的团队中,不仅包含了生物信息、前后端,还有相当一部分医学背景的成员。何博士认为,基因与临床数据的处理是个跨学科工程,只有跨学科背景的团队才能对市场需求和产品有更好的理解。
他告诉动脉网,尝试将基因数据与临床数据处理的企业很多,但只有真正接触到临床需要才能见识到这个工程的复杂性。“数据模型和呈现方式等都需要与临床沟通,理解转化他们的需求。”他这样表示。
通过对此前医疗大数据平台的分析,何博士认为医基云的最终产品应该作为一个工具而存在,帮助医院进行数据的清洗等。时间越久,这些信息所释放的能量也就越大。
据了解,目前医基云已经完成了底层平台的开发,正式进入部分国内一流医院开始信息处理工作。在可预见的未来里,基因数据融入临床将成为趋势,而基于对行业的理解和在数据挖掘上的优势,医基云已经迈出了一大步。
*文中图片由受访者提供。
文 | 周梦亚
网站、公众号等转载请联系授权