2019年10月8日,由天士力资本控股(北京)有限公司主办的第三届健康投资创新生态大会在北京举行。
会上,上海交通大学医学院附属瑞金医院内分泌代谢学科的曹亚南博士以“中国人代谢性疾病大数据和基因组学研究和应用”为主题,进行了分享,动脉网对其精彩内容进行了整编。曹亚南博士所在的瑞金医院有着100多年的历史,是国内最早成立内分泌学科的医院之一。
近10年来,该院内分泌学科一直处于全国顶尖地位。同时,内分泌科也是该院的重点学科之一。瑞金医院内分泌代谢学科一直围绕着内分泌疾病和代谢病,开展临床和基础研究,并在近20年的研究中,建立了生物样本库,并进行转化性研究。
近年来,在复杂性疾病和慢性病研究方面,大数据凸显出了强大的力量。通过对立研究,或是对特定人群、患者的研究,得到十几万,甚至上百万量级的数据,并通过大数据方式进行相关的科学研究或临床研究。
与传统的研究假设相比,大数据研究不具备偏向性,更高效,可为研究者提供更多线索。因此,在目前的医学研究包括新药靶点发现中,大数据正逐渐成为主要的研究方式。
目前,国际上大的数据库或样本库大部分都由北美或欧洲发起设立。有的数据库和样本库经过了几十年的建设,已经完成了从样本库、队列到数据库的转化。但是,东亚、南美洲和非洲等地区现在还没有大的队列研究,特别是从样本库到数据库的转化。
尤其值得我们关注的是,中国地区虽然开始重视标准数据库的建立,但数据还不够完善,这是未来工作的重要方向。
另外,近五年来,生物样本库的重要性越来越凸显。英国生物样本库(UKbiobank)的全自动化生物样本库可实现自动化仓储、自动化管理、自动化取放。通过对样本库进行数据转化,并运用AI进行整合,可以从数据中挖掘大量的新靶点和生物标志物。故此,这类样本库的价值受到了格外重视。
数据采集标准化为数据库赋予研究和应用价值
样本库需要优秀的样本来源。现在,全球良好的疾病队列、自然队列、社区队列或是特定人群队列,都要经过严格的临床管理设计和不断随访。
当前组学数据库以基因组学信息为主,希望通过基因组学数据和表型数据等进行关联分析,从中得到重要结果,需要良好的队列管理、随访,以及标准化的队列信息采集。
信息的采集需要做好标准化。实际上,在国内,临床信息采集的标准化仍然是一个非常严重的问题。不同的医院对于特定的生物信息采集(尤其是检查数据的采集),可能使用的是不同的方法,采用的试剂盒、采集设备不同,正常值也不一样,最终可能导致队列数据来源不同,标准不统一,直接进行比较会出现问题。
因此,在建设样本库和数据库时,必须做好数据采集标准化,这样才能赋予数据库后续的应用和研究价值。
基因组学是目前全球组学数据库的重点
目前,全球已有很多大规模的基因组学数据库。通过对人群中携带的基因变异进行检测,获得的基因变异数据库是非常重要的人群特征。不同的人群基因变异背景和结构存在非常大的差异,这与表型密切相关。
有些变异基因在人群中的分布频率较高,属于常见变异,这些基因变异大部分的对表型的影响较弱,很多基因变异的作用累加在一起影响表型。另外还有一些变异基因虽然在人群中的频率很低,但对表型的影响非常大,也可能是一些遗传性疾病的病因。这些基因变异和疾病发生的关系密切,其中有些是很好的生物标志物或药物靶点,是基因组学研究中的重点。
目前,针对生物样本库或大规模队列采集基因组信息的主要方法有两种:一种是高深度全基因组测序,这是目前数据质量最好的办法,但花费较高。另一种是利用基因芯片做基因分型检测,这种方法获得的基因变异数据相对较少,但成本低,不到全基因组测序的十分之一。
英国的Biobank项目主要采用了基因芯片方式,对50万人的样本进行了基因分析,并在《nature》等杂志上发表了系列研究成果。这些成果主要通过全基因组多态相关比较研究(GWAS),获得基因变异和人类疾病的相关性、发现罕见编码变异的生物学功能、药物基因组学相关生物标志物等,得到了大量有价值的信息。
国际上还有多个大规模基因组数据库,例如DiscovEHR,他们采集了5万人的外显子测序数据,发表了多项研究成果。2018年他们在《NEJM》杂志上发表了HSD17B13基因失活变异与慢性肝病相关性的研究,并继续开展靶向干预研究。
在过去5年至10年当中,GWAS研究已发现了非常多的靶点,已经有两款药物批准上市、2款处于III期临床、3款处于II期临床、17款处于I期临床,以及7款处于临床前阶段。
亟需针对代谢疾病和复杂性疾病建立中国人的数据库
大部分肿瘤的致病基因和体细胞突变在不同人群中的差异很小,其主要致病机制是相同的,所以基于欧洲人和其他人群研究的发现,对中国人同样适用。
但是,对于代谢疾病和复杂疾病,东亚人群,包括中国人,其遗传背景和欧美人群差异很大,在标志物、药物基因组等方面的差异也非常大,只借用欧美人群产生的知识和成果是不合适的。
目前,基因组学的大部分发现还是来自于欧洲人群,来自于亚洲或非洲等人群的数据比例很低。因此,中国未来应完善针对中国人的复杂疾病数据库和体系。
*封面图片来源:123rf
2019未来医疗100强大会
这是一场链接10000人、1000家创新企业、500家投资机构参与的盛会。
6大产品体系直击创投关系;
7种互动形式助力找融资、找项目、找合作;
4大主题展区,医疗创投高效匹配。
2019年12月20-22日(周五—周日),
相聚北京,共襄盛典。
长按识别下方二维码
参与同期活动—2019未来医疗100强榜征集
扫码参与2019未来医疗100强榜征集
文 | 焦艳丽
微信 | LOVEISJYL
添加时请注明:姓名-公司-职位
网站、公众号等转载请联系授权
投稿请联系微信:q19930797