点击上方“转化医学网”订阅我们!
干货 | 靠谱 | 实用
随着测序技术快速进步、生物信息与大数据科学的交叉应用,精准医疗成为近年来不断发展的医疗新模式。精准医疗是由数据驱动、个性化的医疗模式,其发展离不开数据技术。转化医学网有幸采访到国内领先的精准医疗数据管理分析平台GeneDock(聚道科技)的创始人、CEO李厦戎,让我们跟着李总的脚步,一起用数据的视角探究医疗健康的魅力。
利用海量基因数据引领产业变革
创立GeneDock之前,我在阿里巴巴友盟担任首席数据科学家,做的主要是推荐系统、计算广告、用户行为建模和数据应用产品,这个过程积累了很多数据平台架构和数据建模经验。13年末我跟朋友聊天了解到基因测序这个新技术方向,深入了解之后,我觉得基因技术的普及对于人类健康有很大的帮助,人类基因组序列与健康数据的紧密联系将给临床医疗带来巨大的改变。而基因很大程度上是一个数据问题,我所积累的知识技能是可以帮助这个领域解决数据方面的问题。
一组人类基因组信息翻译出来的数据大约有上百TB,面对海量的基因数据,其存储、处理、管理和协作同样需要我之前所熟悉的分布式计算系统和数据技术,因此我拉上了阿里云的资深产品经理王乐珩。我们一起创立了GeneDock,致力于将这些技术应用到精准医疗领域来。
挖掘医疗大数据,助力个体化诊疗
精准医疗数据具备大数据的特点,即规模大(Volume),数据类型多(Variety),数据产生和处理速度高(Velocity),数据精准度对分析结果影响大(Veracity)以及数据价值高(Value)。但相比于其他非医疗领域的大数据,精准医疗大数据有其独特之处:
首先,精准医疗数据对个体产生直接的应用价值,可以帮助个人直接了解自己的疾病和健康状况,而且随着个体长周期的数据积累,会帮助个人更好的找到治疗和干预方式,实现对健康状况有更长期的监控调整。
其次,这个价值是长周期的。互联网大数据产生价值的生命周期比较短,特别是在电商和广告行业中的推荐和重定向需求,所用到的数据是越新越好。相比之下,基因数据会在个体整个生命周期中都产生价值,甚至还能帮助到后代分析家族遗传特征。陆军军医大学附属第一医院医学遗传中心的袁慧军教授团队在过去的4年时间里面,深入全国31个省市自治区的特殊学校和基层医疗机构,为2万多个受遗传性耳聋问题困扰的个人和家庭进行了免费的基因检测,积累了中国人群在特定疾病领域的高质量数据,比使用国际公开数据库更准确的帮助受检者明确病因,并提供遗传咨询和指导,这是精准医疗数据的长周期普惠价值。
精准医疗大数据具有聚集价值。由于基因组尚有大量未知,很多个例所携带的基因变异无法明确致病性,就需要累积更多个体基因组数据,并通过群体分析去发现规律。近年来由于“冰桶挑战”所受到关注的罕见性疾病很多是遗传性疾病,由于病例分布的稀疏性,如何聚集足够多的病例和基因数据,是帮助了解这些疾病,找到致病原因,进而开发治疗方案的重要起点。个体数据聚沙成塔,最后造福个体,这正是精准医疗大数据重要的意义。
打通上下游产业链,建构基因数据网络
我们目前主要有四个产品,GeneDock SeqFlow(组学数据生产线)、GeneDock Clinic(精准医疗工作站)、GeneDock Lab(智能分子诊断实验室)以及GeneDock Link(分子诊断协作系统),分别对应基因数据生产线、临床应用、样本检测和分析解读四个环节。
这些产品完整覆盖了精准医疗的诊疗场景,我们帮助医疗机构解决临床信息采集、实验室管理、样本检测管理、分析报告等实际工作需求,建设涵盖整个业务流程和数据流程的精准医学操作系统。对于基因测序的企业来说,我们为他们解决大规模的数据传输、分析和管理需求,提供了更低成本、更快的数据分析处理平台。
我们在给行业、机构等提供院端的数据平台和业务系统的同时,也具备为企业提供公有云的基因组数据分析、处理的能力。我们希望最终能将这些串联成一个基因数据的网络,让精准医疗的上下游能够相互连接。
我相信,未来的整个医学行业是一个数据驱动的行业,数据技术的普及和数据驱动的医学模式需要的相应的数据系统,我们一直在研发底层技术,为精准医疗的普惠做准备。
积极布局人工智能
人工智能最重要的基础是有大量高质量的数据,精准医疗数据资源具有这个显著特征,同样,人工智能技术也在深刻地改变精准医疗模式。
我们正在与业内数个专家团队一起开发细分疾病的诊断辅助模型和决策支持系统。比如,我们今年在美国人类遗传学会(ASHG)年会上展示了与陆军军医大学附属第一医院医学遗传中心开发的遗传性耳聋基因变异功能预测模型,这个模型利用陆军军医大学附属第一医院医学遗传中心建立的中国遗传性耳聋基因研究战略联盟(CDGC)数据和机器学习技术,预测效果优于市面上的产品。
通常情况下,一个成年人的变异数量大概有200万个,其中的绝大多数都是良性突变,而对健康医疗而言,真正有价值的是那些高风险突变、致病突变和致癌突变。对于特定疾病,可能只有1-2个有意义的突变,突变的寻找过滤有如大海捞针。所以在精准医疗领域,人工智能会成为临床医生的得力助手。我们也希望能与更多的专家合作,一起开发相关模型。
李厦戎
GeneDock创始人兼CEO,前阿里巴巴友盟首席数据科学家,有多年的分布式计算和大规模机器学习算法研发经历,对大数据应用有丰富经验。他致力于运用数据技术推动生命健康行业的革新,2014年创办GeneDock。
GeneDock聚道科技
GeneDock成立于2014年9月,作为国家高新技术企业,长期致力于研发精准医疗数据技术,积累了业界领先的数据技术、丰富的平台建设经验和极强的服务协作能力。目前已为数十家顶级医疗、科研机构及业界领先企业提供精准医疗数据平台服务,包括陆军军医大学附属第一医院、上海交通大学医学院附属新华医院、四川大学华西医院、上海交通大学附属第六人民医院、南方医科大学、中信湘雅生殖与遗传专科医院、中国医科院肿瘤医院、厦门大学附属中山医院、中国疾病预防控制中心、中科院微生物研究所、华大科技、艾吉泰康、WeGene、泛生子、信诺佰世、LinkDoc、金准基因等。