2018 年 11 月 8 - 9 日,由百迈客研究院主办的第五届全国功能基因组学高峰论坛在北京圆满召开,此次大会汇聚了来自全国众多高校以及科研院所的知名教授专家,其中包括陈润生、邓兴旺两位院士,他们分别在大会针对大数据、基因组展开了精彩演讲。百迈客创始人兼董事长郑洪坤于开幕式正式致词,并参与了 Nanopore 的授牌仪式。与会间隙,郑洪坤接受了记者采访。他细致地讲述了基因组学腾飞的历程,在这过程中百迈客不仅扮演了参与者的角色,更重要的是成为了基因大数据方向的先锋探索者和引领者。
作为一名“专业对口”的企业家,郑洪坤见证了整个基因组学和生物信息学的发展历程。从上世纪末开始,生物界开始逐渐兴起了一代测序,基因组学和生物信息学在此基础上也迅速平行发展起来。一代测序速度快,但是一次只能测一条单一的序列,且最长也就能测 1000-1500 bp,所以被广泛应用在单序列测序上。在当时,一代测序非常昂贵,测一个完整的人类基因组可能要花费 30 亿美金,更不要谈开发和普及工具软件。
百迈客创始人兼董事长郑洪坤
二代测序被称作高通量测序,是通过物理或化学的方式将 DNA 随机打断成无数 300bp 左右的小片段进行测序,因此它一次能够同时测很多的序列。高通量测序出现后,数据产量和用户突飞猛涨,科研市场对测序服务公司以及分析软件的需求也随之上升。郑洪坤瞄准了市场的这一空缺,于 2009 年自己创立了百迈客生物科技公司。在生物信息学光速发展的今天,有很多机会转瞬即逝;在察觉到高通量测序应用前景无限时,他毅然决定走出工作单位,自己在这一领域创业打拼,这也才有了百迈客的诞生。
郑洪坤多次谈到生物信息学离不开分析工具,服务工具的应用普及,一定程度上会制约数据挖掘的效率。百迈客在加入到这一行业后,连续多次更新 Illumina 测序仪,并率先在 2014 年 9 月开通了生物云平台。生物云可以让更多人方便地将生物信息分析利用起来,并且可以不断优化、增强软件的可持续性。对整个生物信息行业来说,生物云是一种更高效的方式,能有效减少开发的重复性的问题,为用户开启了生物科技服务的 2.0 新时代。现今,百迈客生物云平台将再次迎来革新,与 Nanopore 的碰撞,标志着当下生物信息学仍处在风云变幻年代。
在迅速发展的生物信息学背景下,目前生信人才的培养体系却相对薄弱。高校学生的学习过于基础和理论化,因此人才队伍建设创新在百迈客公司显得尤为重要。在新员工加入之后,公司都会让技术娴熟的工程师带领培训,并会积极鼓励他们自己进行项目操作。郑洪坤表示,许多人在操作项目过程中才会发现适合自己的方向,公司会根据员工的选择给予他们需要的深层培训。保证技术人才不流失,并持续保持创新头脑,这是百迈客人才创新的计划。
目前百迈客公司已经发展 9 年有余,如何能在浩如烟海的测序服务公司中立足,也是萦绕百迈客漫长探索之路的问题。最初公司会更强调做一些和别人不一样的产品,但是随着行业发展成熟,可用的技术就摆在眼前,所有人都能接触到,想从战略上做创新比较难。“既然都能做就把它做好。”百迈客一直秉承着四个字的企业文化“持续创新”,在已有的技术基础上使其变得更好,提升服务质量,简化基因测序,优化大数据运算和人工智能等方向,都是百迈客发展的重点。目前全国生物医学科研单位,百迈客使用覆盖率达到了 90% 以上,服务用户数量在创新的生物云行业中也是数一数二。
如今在二代测序已经到了一个发展的平台期,而三代测序技术成本在不断下降,意味着大量科学家会转向去研究结构变异,包括基因组层面、转录组层面。看到这个现象,这也是百迈客下一步的创新方向,把三代测序技术和生物云平台结合起来。如今百迈客正站在三代测序时代的最前端,在此次大会上最重要的事就是百迈客与 Nanopore 进行了授牌仪式,这两个测序科技服务公司的合作,预示着百迈客已经做好迈入下一个新阶段的准备。
公司硬件有了、平台有了,关键还是需要人来使用,需要服务对象参与。这一点百迈客在多年的科技服务中已经颇有经验,它们发现利用高通量测序来进行实验,在很多方面都是一个高效的方法。最关键的一点是,不论研究基础的好坏,高通量技术都能够有较大的应用空间。
无论是研究人、肿瘤还是水稻等比较成熟的物种,亦或是不成熟的如水产、中草药,高通量测序都能不受切入条件的限制。因此服务对象可以通过百迈客获得这一科研优势,郑洪坤表示,科技服务不单单是帮助合作伙伴发表文章,而是通过一个项目能够帮助科学家提升他们对数据的分析能力,这既是百迈客提出的“科技服务 2.0 ”的意义。
作为最具特色的生物云平台服务,其特点不仅仅只是让科学家进行一次性输入,然后拿走分析结果就结束了。它把整个百迈客技术体系嫁接到整个数据平台,里面不光只是包含自身的科研项目,而是有一个庞大的数据集。科学家通过与百迈客合作,能够一定程度上地利用整个云平台数据。
百迈客生物云平台设立的初衷,是为了让每一个人能够查看自己希望看的基因数据,这些人既包括你我,也包括科学家。即使没有生物信息学背景,所有人都能够在平台上看懂你想看的数据。为了实现这一目标必须有三样装备,首先得有高性能计算和存储的硬件支撑,还需要可视化、交互式的软件解读数据,最重要的是基因大数据本身。百迈客生物云平台对此进行整合,数据端应用人工智能,可以帮助科学家搜寻需求方向的数据、配套的软件分析,以及人工培养,让科学家轻松和数据平台连接起来,降低知识需求和学习门槛。
如今百迈客先后在国际顶级学术期刊上发表论文上千篇,累积影响因子已经达到 3000 以上。这是百迈客作为科技服务公司持续创新的丰硕成果,同时也是作为行业先锋最强有力的竞争数据。正如百迈客的服务宗旨描述的一样,它们正在“为世界创造新的可能”,让生物科技更快,让人类生活质量更高。