雷锋网《AI掘金志》频道:只做 AI +「安防、医疗、零售」三大传统领域的深度采访报道。
“经世致用”是大多数中国学者的终极理想。在古代,实现理想的途径是入仕为官,对应到现代,或许就是进入产业界。
作为一名学者,俞益洲已经攀上了山巅。今年11月,他先后获得了2018 ACM杰出科学家和2019年度 IEEE Fellow两大殊荣。为他赢得双冕加身的主要有两项研究成果:一是他早期做的基于图像的建模和渲染方面的研究,其核心是将三维计算机视觉和图形学相结合;二是近年来做的将机器学习和底层计算机视觉相结合的研究。这些研究工作在当时非常热门和富有前瞻性,在行业内造成了巨大反响。
谈到这些研究成果以及它们带来的荣誉,俞益洲十分轻描淡写,“这是对我过去工作的一种肯定,说明我的研究成果对别人有参考价值和借鉴意义。”
他没有提到的是,这两项荣誉也给他的职业生涯上半场画上了一个完美的句号。
作为一个深居象牙塔十八载的学者,今年秋季,俞益洲正式加盟深睿医疗担任首席科学家,这意味着他的工作重心将从学术界转向产业界。促使他做出这项决定的,是内心对知识“经世致用”的渴望。
过去十几年里,俞益洲一直在高校从事教学和研究工作,他的不少研究成果成功实现了产业化。比如他曾经作为主要成员研发的部分计算机视觉和图形处理技术,被广泛应用于《黑客帝国》、《碟中谍2》、《加勒比海盗3:世界的尽头》等美国电影的特效制作。
但俞益洲始终认为,这种转化并不彻底,也缺乏针对性,他希望自己的研究成果能够在更关键的领域帮助到更多人。思虑再三,他决定走出象牙塔,投身到产业界亲自推动学术研究成果的产品转化。
俞益洲考虑过几个方向——自动驾驶、安防和医疗。综合考量后,他认为,自动驾驶虽然看起来和计算机视觉密切相关,但它对后者的依赖程度并没有外界想象的那么高,它更多是依靠传感器等硬件设备,更偏向物联网的概念。安防行业对计算机视觉技术的需求非常旺盛,不过这个行业已经非常成熟,盘踞着几大巨头,留给后来者的发挥空间不大。相比之下,医学影像分析和计算机视觉有许多相通之处,医学“悬壶济世”的精神也更契合他对“经世致用”的想象。
再美好的理念也需要有承接的平台,俞益洲进入医疗行业,很大程度也归因于深睿医疗团队的吸引力。“他们的团队非常强大,也具备很好的互补性”,俞益洲对雷锋网说道。
早在正式加盟前,俞益洲就和深睿医疗有过很多接触,过程中他逐渐对后者有了了解。深睿医疗董事长雷鸣是“百度七剑客”之一,他对技术和商业都拥有非常透彻的理解。CEO乔昕具备深厚的医学背景,曾经先后在国内三甲医院和西门子医疗位居要职。CTO李一鸣则曾经就职于百度和高德信息技术有限公司,在大数据和机器学习方面有着深厚的造诣。
多元融合的团队基因使得深睿医疗能够真正从临床的角度出发思考问题 ,同时又很好地平衡了商业性,这是它最吸引俞益洲的地方,也是它能够飞速成长的秘诀。
今年4月份,深睿医疗对外宣布完成B轮1.5亿元融资,由君联资本领投,联想之星跟投。至此,成立刚刚一年时间,深睿医疗就累计获得了3亿元融资,这样的融资速度在行业内实属罕见。
半年后,深睿医疗又用产品实力诠释了它被资本看好的原因。不久前,深睿医疗在CCR大会上一口气发布了四大品类七款AI产品,对于一家成立不到两年的公司来说,这样的产品布局速度实在令人叹为观止。而这些产品身上融入了俞益洲的不少心血。
以首席科学家的身份加盟后,俞益洲把更多精力投入到了深睿医疗的产品研发当中。在深睿医疗,他的主要职责是带领公司的技术团队——深睿研究院。和高校时期相比,新工作包含的内容更加复杂:一方面,他需要带领研究院的算法团队进行项目攻关;另一方面,公司正处于快速成长阶段,他需要对外延揽人才,不断为公司注入新鲜血液。
从计算机视觉到医学影像分析,俞益洲的研究重心也发生了很多变化。计算机视觉和医学影像分析有很多相通的地方,但后者也有其独特的挑战,比如训练数据少,数据分布高度不均匀,数据标注的一致性较差,数据类型丰富(多模态影像,文本+影像)等等。
“这意味着我们需要专门为医疗场景设计一些图像处理和分析的算法;比如研制可以在小样本上训练,但泛化性强、对数据分布不敏感、对标注一致性容忍度高的AI模型”,俞益洲向雷锋网介绍道。
作为公司技术团队的负责人,俞益洲不仅要带领团队做具体项目的技术攻关,还要和外部高校、科研院所合作,进行前瞻性技术的研发。如何平衡两方面的工作,十分考验管理者的领导艺术。俞益洲介绍,平衡的关键在于合理分工,“同一组人同时干两件事,可能什么都干不好”。深睿医疗内部80%的技术人员在从事产品级别的算法研发,剩下20%做前沿技术的探索。此外,深睿医疗还和10多家国内外顶级学术机构建立了长期学术科研合作,“两边相加,我们在前瞻性技术上投入的人力和资源并不少”。
事实证明,这种投入是意义重大且富有成效的。不久前,深睿医疗就联合香港大学、中山大学推出了一项最新研究成果——通过一种新的、非局部的上下文编码网络提高医学图像分割算法的鲁棒性。
俞益洲介绍,在医学图像分析中,算法的鲁棒性非常重要。如果算法对对抗噪声的鲁棒性较差,输入的图像稍有扰动,结果就会出现很大差异,这在临床上是不可用的。遗憾的是,目前所有最新的、基于卷积神经网络的医学图像分割算法对对抗噪声的抵抗性都比较差。主要原因在于,训练医学图像分割算法的训练集较小,经常导致过拟合,从而降低了模型的泛化能力。在自然图像领域,这一问题已经得到了解决,但相同的对抗训练策略放在医学图像上效果并不好。
为此,深睿医疗联合香港大学、中山大学提出了通过非局部上下文编码网络提高医学图像分割算法的鲁棒性。从实际效果来看,这种方法在对抗噪声环境下得到的结果“几乎和没有噪声环境下得到的结果一样。”这项研究成果将发表于一流的人工智能学术大会AAAI 2019.
虽然医学影像分析算法的某些方面还有待提高,但总体而言,经过两三年的发展,医学影像AI已经步入了相对成熟的阶段。典型表现之一就是产品形态更加多样化了:过去行业内主要围绕肺部CT和眼底彩照两种影像数据进行产品开发;如今,针对更多病种和影像数据类型的算法已经初露端倪。
接下来,如何基于多模态影像数据进行综合分析诊断也将成为企业的发力方向。俞益洲介绍,相比单模态数据,多模态数据综合诊断的精确度更高,但这项技术也面临不少挑战。首先,这种方法需要的数据种类更多,给数据采集提出了挑战;其次,多模态数据间的对准一直是全行业的技术难题;最后,图像对准后如何将多种模态的数据融合,进行综合分析,也有待进一步探索。
即便这些问题顺利解决,基于医学影像数据的诊断方法仍然存在局限性,我们还需要结合病史等文本信息进行综合考量,这正是大部分医生正在做的。医疗AI从业者们已经意识到了这个问题,也在朝这个方向努力。“可能在不久的将来我们就能看到一些研究成果”。
俞益洲认为,在深度学习等人工智能技术的带动下,医学正在从“基于征象的医学”转向“数据驱动的医学”。他坚信,随着技术发展,人工智能的知识和经验一定能够超越单个专家的水平,只是通往未来的路上还有许多障碍需要踏平。
对于俞益洲来说,踏足产业界并非终点,而恰恰是一个新的起点,他的研究和探索才刚刚开始。
长按二维码,关注雷锋网旗下「AI掘金志」