【智能医疗】AI+医疗，微软有哪些布局？

2017 年 11 月 18 日 产业智能官

编者按：近几年来，医疗和人工智能碰撞出了相当多的火花，大量资金短期投入到医疗领域当中。然而在微软亚洲研究院副院长张益肇博士看来，人工智能医疗是一场持久战，大家一定要沉下心多调研、多思考、多学习。

人工智能大潮之下，微软在医疗领域又有哪些布局？近日，张益肇博士接受雷锋网AI掘金志的专访，解读了“AI+医疗”可能带来的巨大变革。本文授权转载自公众号“AI掘金志”。

“作为一个研究人工智能二十多年，同时在医学影像处理方向耕耘八年的过来人。我认为现阶段医疗人工智存在的一大挑战是，从业者们既没捋顺流程，也没想清模式。单纯觉得我有AI技术，有几家合作医院，就能大干一场。现在风口的确很火，很多基金也愿意投钱。但医疗与其他行业不同，它是一个文火慢炖的过程，不见得那么容易。”

在微软亚洲研究院副院长张益肇博士接受专访的一个多小时里，他不断在强调人工智能在医疗领域的长期价值，但也有存在一些短期的担忧。以下是雷锋网AI掘金志与张益肇博士的访谈内容：

您怎么看待今年医学影像+AI大热的现象？

当然是好事。我经常谈一个观点，人类如果想要健健康康活到100岁，技术将扮演着非常重要的角色。近几年我也看到不少计算机界精英投入大量人力财力到医疗领域，如此大规模的医工交叉大潮非常激动人心。

这里我也不得不提醒大家，在医疗领域，无论是创业者也好，投资人也罢，必须要有愿意长期投入和投资的心态，切勿焦躁，保持平常心。

我个人研究人工智能二十几年，其中八年时间在专攻医疗，我不觉得这个领域很容易出成果。

医学技术的落地，不仅要千辛万苦找对场景，还要说服政策制定者、监管部门、医院采购者、科室主任、临床医生、病人等无数当事人证明技术的有效性、安全性和可行性。最后，你还要明白你的产品谁来买单。

现阶段行业存在的一个挑战在于，很多时候，大家这三大关都没有想清楚。单纯觉得我有AI技术，找到一些合作对象，就能大干一场了。

现在医疗+AI的确很火，很多创投也愿意投这个钱。但从长久来看，不见得那么容易，也没那么快，大家一定要沉下心多调研、多思考、多学习。

美国很多新药研发公司可以获得大量的融资，有些甚至不盈利也能够上市。大家期待它所研发的新药品最终能通过FDA，并且在药效达到预期后，公司市值能够上涨5倍、10倍甚至更多。当然，面临一文不值的风险也非常巨大。

大家在投资时明知道风险很大，明知短时间内账面并不可观，但仍旧愿意投资、愿意长期等待，因为他们能够真正理解风险。国内医疗人工智能大潮中，我最担心的是国内医疗人工智能创业者和投资者并没有真正理解风险，就开始投入大量资源在其中，这很可怕。

微软目前在医疗AI方向有哪些研究？

微软其实在医疗领域投入很多，在世界各地的研究院里有不少同事在做相关方面的工作。

医学影像处理这块，微软亚洲研究院和微软剑桥研究院都有在做。不过微软亚洲研究院聚焦在病理切片，英国剑桥研究院专攻CT。我们微软亚洲研究院近几年开始钻研脑肿瘤病理切片的识别和判断，通过细胞的形态、大小、结构等，去辅助分析和判断病人所处的癌症阶段。近两年在该领域我们基于“神经网络＋深度学习”的模式取得了两大突破：

首先，实现了对大尺寸病理切片的图片处理。通常图片的尺寸为224*224像素，但脑肿瘤病理切片的尺寸却达到了20万*20万、甚至40万*40万像素。对于大尺寸病理切片影像的识别系统，我们没有沿用业内常用的数字医学图像数据库，反而在ImageNet的基础之上利用尽可能多的图片，通过自己搭建的神经网络和深度学习算法不断进行大量训练而成，最终实现了对大尺寸病理切片的图片处理。

对大尺寸病理切片图片通过神经网络与深度学习算法进行处理的流程

其次，在解决了细胞层面的图像识别之后，又实现了对病变腺体的识别。对病变腺体的识别，主要是基于医学角度三个可以衡量癌细胞扩散程度和预后能力的指标：细胞的分化能力，腺体的状况和有丝分裂水平。我们针对这三个角度，通过多渠道（Multi-Channel）的数据采集和分析，希望在未来帮助医生实现对病人术后、康复水平乃至复发的可能性做出预估和判断。

腺体图像经过计算机处理后被抽象成不同的结构，以便于计算机进一步识别与判断

不同种类的恶性肿瘤切片经过算法处理后进行分类

该研究结果也可以扩展至其他疾病的二维医学影像的识别和判断，例如我们正在研究的肠癌等。此外，我们还在研究肝肿瘤患者的CT三维影像。

除了医学图像外，我们在医学文献的处理和理解上也有所研究。全球平均每年有将近50多万篇医学研究文献发表，这种情况下，医生在查询所需文献时，不可能覆盖到位。我们微软亚洲研究院具体是如何解决这一问题的呢？比如医生在寻找遗传基因的研究与哪几篇文章相关，我们会通过算法自动对相关文献进行关联。另外也在做不少与医学相关的自然语言处理，比如不同病人想要问相关的医疗问题，可能有很多不同的方法来表达。而在话语里又有像阿莫西林等药物在不同医院里有几十种、上百种叫法。

我们的工作就是用AI技术让这些话语和词汇的不同表达，转换为机器可以理解的统一信号。最终以AI系统的形态解答各种医学问题。

团队研究医学影像处理这8年间，相比于过去有哪些大的进步？

深度学习算是一个比较大的跨越，坦白讲，2013、2014年前后，深度学习开始被应用到医学影像分析当中。按照传统方式，很多医学影像分析题目要做特征提取，这个特征甚至可能是细胞，过程较为复杂。而深度学习可以自己学习并提取特征，节省了很多设计特征的时间。

其次就是迁移学习，我们在ImageNet上训练出一个深度学习模型，以它作为基础做医学影像分析，虽然ImageNet上的图像为自然图片，但从中训练出来的特征提取能力，对医学影像也相当有用。

这个过程中您发现了哪些新的思路，并走过哪些弯路？

2012年我们团队开始用弱监督学习来更好地使用数据，这是一个对我们意义很大的方向。

大家也都知道医生的时间非常宝贵，如果你没办法尽量节省他们的精力与时间，相比而言，你获得数据的能力会更弱。用更优秀的算法去填部分数据的坑，这是一个很好的思路，而不是单纯想着从医院拿更多数据。

弱监督学习在医学影像中的应用会是一个好的开始，也是一个值得长期投入的方向。

找到好的场景，再找到好的数据库，其实比大家想的要耗时。很多时候，找到一个优质数据库外，还要找到一个既懂技术，又能帮忙做标注的医生。

对于我们走过的弯路，更多是认知和思维上的弯路吧：过早觉得我们已较好地解决了医学问题。

包括我们在内的很多公司用Kaggel数据做基础训练，但这种研究仅是长期研究的起步，而且这个起步往往并不见得特别有用，所以大家应理性看待从Kaggle中训练出的结果。在医疗+AI方向，大家不要迷信短时间内得到的数字结果，一定要做好长期投入的准备。

语音识别从1960年代就开始萌芽，直到1970也还是所谓的非连续性语音识别，离绝大部分使用场景很远。尽管语音识别在今天已经解决得很好，但在复杂环境和语境下的识别率仍旧不是特别理想。人工智能在医学中的应用亦是如此。

像您刚提到的深度学习和迁移学习让医疗人工智能大跨步发展，但这两者的不可解释性使得很多医学问题无法询证，这个难题目前微软亚洲研究院有没有一个标准对其进行参考？

深度学习的可解释性确实是一个很热的题目。算法可解释性通常可以用看边界和颜色特征来判断正负，偏统计学方法，但也很难说出具体原因。

其实很多医学任务也是靠统计来做。之前有医生提到说，假如一个肿瘤小于5厘米和大于5厘米该各应怎么判断。大家提到“5厘米”这个单位也凭经验去描述，为什么是5，而不是5.1或4.9。

我的意思是，医学本身很多判断是依照经验来做，这些经验里，也存在一些无法解释的因素，因此不能完全否定“不可解释性”。

很多AI功能尤其像靠深度学习训练出来的系统，除了给你一个明确的判断外，还会生成百分比形式的“程度值”做参考，这个程度值体现机器对判断的“自信”与否。现阶段我们希望只做辅助医生的工具，最后的结论还是需要医生自己判断。

任何系统都多多少少会产生一定的误差和偏差，哪怕简单的血压仪也可能存在偏差，所以最终还需让医生把所有信号整合起来判断机器给出的结果是否合理。

也确实因为深度学习存在的弊病，最近Hinton提出要“抛弃”反向传播，您怎么看待这件事的？

反向传播也有几十年的历史了，这期间陆续有人提出不同的想法、不同的算法。人的学习能力很强，无需很多数据，往往通过一两个样本就能学习、分类，但现在机器没有办法靠少量不同样本进行驱动。所以人工智能在算法层面可提升的空间很大，所以要有新的学习方法来做，尤其像可供使用数据量较小的医疗领域。

相比于医学影像处理，语音电子病历录入服务各方面的条件更为成熟，Nuance和讯飞都已在医院落地，微软亚洲研究院目前有没有切入这个方向？

推出这类产品，需要做的事情就比较专比较细了。我加入微软之前在Nuance Communications做语音识别，你提到的语音电子病历录入是Nuance的主要业务之一。

但国内很多人可能有所不知，Nuance的业务里，语音转录系统只是一方面，另一方面Nuance还需雇人把机器转好的文字，进行人工整理。所以Nuance提供的是一整套服务，而非单一的语音识别这一环节的产品。与此同时，Nuance针对不同场景、不同科室做不同的产品优化和服务。所以如果做这类产品，研究之外的任务和工作相对来说会比较多。

您此前一直研究语音，是什么原因致使您开始做跨度很大的医学影像？

从研究角度讲，无论是语音还是影像，两者之间有很多相通点，都是基于机器学习作为发动机，数据作为汽油来建模、判断。

当然了，医学影像也确实有很多专业知识需要学习，更具挑战性，同时也更有意思。因为你需要跟很多不同领域的人一起学习，这个过程非常有意思。

另一方面，那时候我母亲得了癌症，我当时心想医学如果借助计算机技术一定会找到更多新的方法和新的应用场景。作为普通民众，我觉得这对身边人，对社会非常有意义。作为研究人员，这个研究方向会非常有前景。

微软亚洲研究院的医学影像数据来自哪些地方？与哪些机构有合作？

主要还是来自于公开数据集，首先这类公开数据标注经过很多人审核。其次，你要发表结果的话，同一类数据集上大家才有可比性。

在某些特定领域，我们与浙江大学前副校长来茂德团队合作探索病理切片分析，来校长在大肠癌方向有着很多积淀。大肠之外也有研究肺癌等国内常见的几个方向。除此之外，生活习惯和饮食健康也所有探究。

微软亚洲研究院在布局常见的方向之外，还在探索哪些挑战性特别大的方向？

我们现在做病理切片的一大原因，就是因为病理切片分析极具挑战性。

首先病理切片单个数据很大，一张图最大可达40万×40万像素，面对这么大的数据该怎么分析？要怎么才能把这个系统应用得很好？这是很有趣的问题。如此大的图像，单是传输就已是一项很大的挑战，在此基础上还进行分析，计算量会非常巨大。好在微软亚洲研究院也有很多同事是系统方面的专家，研究高速运算，基于此，我们可以通过整合研究院不同团队的专长来做这件事。

这个过程当中微软亚洲研究院各个技术部门之间如何打配合？

各部门之间的合作其实蛮多。2015年我们视觉计算组发明的ResNet大家都很熟悉了，它就是一个特别好的图像特征提取方法，有了它之后，我们就在考虑如何用ResNet提取医学影像特征。微软亚洲研究院已经在做一些通过看一张图然后对它进行标注的技术，当机器可以给一张图自动标注的话，这就表明机器在一定程度上理解这张图，不仅知道里面有哪些物体，同时也知道里面物体及场景之间的关系。这属于更高层次的理解。

回到肺结节上，通常情况我们只是去判断某块小区域是不是肺结节。其实有时候通过分析肺本身以及人体的构造，也可以得出其他有用信息，而这些肺结节之外的信息，往往对诊断起到非常重要的作用。

目前大部分系统并没有有效利用到这些“其他”信息，但影像科医生与机器不同，他们在读片时，肯定会对这些信息有宏观的认知。所以我也经常在讲，人工看一张图片时，他不会只看一小部分，而是会形成一个整体的认知去判断。

所以，无论是一张普通海景照片中船和海的关系，还是医学影像中肺结节和其他组织信息的关联度，很多方面是相通的。我们希望把对常规图像的认知和理解，迁移到医学影像中，这是一项非常重要的工作。

如果还要判断其他组织信息，那么在对众多非目标对象的分割上，是否有产生更多更复杂的新问题？

确实如此，我再举个例子，正常人的心脏在左边，因此做内脏分割时，会有这样的预知。但是也不排除少数人心脏长在右边的可能性，类似这种情况容易让机器产生误判和混淆，因此需要有更高层面的的知识理解。

但总体而言，现在在做的机器学习研究，无论是检测、识别还是分割也罢，很多地方都是相通的。

除了影像和语音语义之外，微软还有哪些医疗人工智能方面的研究？

我们在大数据处理上探索也非常多。

负责管理微软全球研究院的Eric Horvitz，他既是医学博士，也是哲学博士。Eric Horvitz做了很多非常有趣的研究，通过用户在互联网上的搜索词，来判断你是否有一些疾病和症状。

那么这个研究的最终形态是以一个什么样的终端功能或者服务去呈现？

我们有一项服务叫微软Health，就是用一些功能，来提供insight，这些insight一方面给用户看，一方面提供给医生参考。比如通过系统收集到很多人的血糖、血压甚至睡眠和运动量数据后，存储起来进行长期的追踪和分析。基于此，把这些信息全部整合起来后更好地帮助医生、帮助用户自身。我们也与美国匹斯堡大学医学中心UPMC合作，探讨用AI挖掘有效健康信息。

一方面我们在做很多基础研究，另外一方面，微软也希望寻找更多合作伙伴，探讨可以着陆的场景。

“长期”大概是多久？

取决于场景本身。我们与盖茨基金会的合作中，在非洲用机器来判断一个人是否有得疟疾，同时得出病症的严重程度。在国内大家谈机器与医生的对比，但非洲这些地方连医院医生都没有，相对来讲，有一个工具给病人诊断，已经是一个很大的医疗进步。这个例子，我相信在未来短期三五年之内，会有着很大的帮助，现在有些产品已经在一些相对落后的国家试用。

但在比较发展的国家，医生已经有比较成熟、习惯的工作方式，供应商的系统要进入到医院，需要想清楚整个环节才有办法帮助到医生。因为多种客观因素，会致使过渡时间更长。当然了，如果找好场景的话，最快两三年之内就可以安全着陆。

您觉得哪几个场景前景相比而言会比较明朗？

目前市场上很多企业在做诊断，其实我觉得可以往前探一步：做好分割。

一个医生在做放射性疗法之前，要先把不同放射性疗法所影响到的这些不同区域标出来，并进行分割。分割工作的人力和时间成本很高，如果现在有一个工具能够自动进行分割，再让医生去确认，需求会比较大。

当一个系统先对影像做标注，医生去看的时候已经有90%完成地很好，没做好的地方医生再去修改，最后一关由医生来把守，这种辅助工具医生也很乐意接受。

谈谈未来微软医疗人工智能的展望？

我们希望能从人一出生开始便了解你的整个健康情况，通过收集身体信息，实时分析你生活和机体哪些地方需要改进，如饮食、睡眠、运动、病痛等等。

我觉得在未来应该会演进为这种形式，每个人都有一个专门属于他的医疗人工智能健康助理。

产品形态是2C的形式吗？

这个倒不见得是2C，更多是2B2C模式，产品在面向终端用户时也要有医生的参与。像美国就有很多家庭医生，可通过家庭医生把系统推向病人。

哪些新的人工智能技术将会对医疗行业带来巨大变革？

其实“如何把不同的信息在不同层次进行整合”这一认知层面的课题，整个行业仍旧存在很多不足，现阶段单是把知识结构化就是一项很复杂的任务。如果解决了上述问题则对技术体系和行业的推动力将非常大。

我们先以机器翻译为例，大部分机器翻译还是单句单句翻，但一段段翻跟一句句翻就很不一样了，它涉及到“理解”。再以图像识别为例，机器识别出图像中有蓝色的天空和蓝色的海和帆船，但如果突然出现图像中的天空为红色，而它过去的训练集中没有对红色天空进行标注，那机器能懂得红色的天空代表是晚霞吗？

因此我们要让机器建立起一个对故事、对世界、对环境的认知能力。

这里的难点在于，它有很多很多参数的变化，你不可能让机器学习把整个世界的种种元素挨个看一遍才能理解。而是应该创建一种新的方法，把不同地方学到的知识给整合起来，从而解释出图像看起来是合理的。

医学影像的解释同样如此，医生在看MRI影像时，基于经验判断某个人是女性，但有一些地方却不像女性（如变性人等）。这时候要有更高层的知识能力、知识架构，也就是用Mental Mode去解释去理解，这会是一个很大的挑战，同时也是一个很大的机会。

当前很多像医院等传统机构对AI处于观望状态，市场还需教育。企业应该如何让各行各业的人更快了解人工智能？

为什么互联网兴起后能迅速影响到各行各业？因为那时候大家即便不懂互联网，但至少有浏览器产品供我们使用，虽然有别于可触摸的实体物品，但我们可以看到互联网产品的界面，也可在上面进行操作和交互，这才使得人们对互联网的认知建立的如此之快。

人工智能普及进度慢，一大原因就是没有一些典型的终端产品让大家直接感受。要想教育一个市场，最好的方式就是让他们去体验AI的能力。

您在微软亚洲研究院任职18年，谈谈这里留住您最大的一个原因是什么？

在这18年里，我最大感触是微软亚洲研究院为很多优秀的研究员创建了能够长期钻研细分领域课题的极佳环境。在微软亚洲研究院这样的基础研究机构里，好比在MIT、斯坦福，我们在长时间探索各式各样的有趣题目。

近两年量子计算很火，但很多人所有不知，我们研究院从十几年前便开始做量子计算了。除此之外，也有美国的同事在探索用DNA来存储信息，人体中一个DNA大概有4GB内存，你想想，一个细胞大小的体积便能存储4GB的内容，密度远高于我们用的SD卡。

像这种看得很远的方向，只有在研究院才有机会去接触，这对任何一位研究者都极具吸引力。盖茨早在26年前便建立微软研究院，并且在同期启动三大研究组：自然语言处理组、语音组、计算机视觉组。这些研究在当时来看，离落地非常遥远。但微软今天能够站在人工智能最顶端，不是因为我们体量多大，也不是我们人才够多，而在于研究院和热爱研究的这一批批人早已为此准备26年之久。

智慧医疗，需要的不只是大数据

本月初，由微软亚洲研究院和中文信息学会语言与知识计算专业委员会联合主办，成都市青羊区人民政府提供支持的 “知识图谱与智慧医疗（成都）论坛” 在成都举行。论坛共分为“知识图谱与智慧医疗学术论坛”、“智慧医疗产业与市场论坛”和“行业专家座谈”三个环节，分别邀请了人工智能学术专家、临床医学专家、智慧医疗行业专家、投资机构及政府相关职能部门进行深入交流。

此次论坛从学术研究、政府政策和医疗产业多方面着重探讨了知识图谱和人工智能在医疗领域应用的构想、资源、技术、方案、策略以及待研究的问题和挑战，以此促成医学界、学术届和产业界之间的学术交流，探索未来在医疗领域大规模应用人工智能的合作模式。本文节选了本次论坛部分内容与大家进行分享。想了解论坛全部内容请点击阅读原文，或直接访问网址：http://www.msra.cn/zh-cn/research/healthcare/chengdu-healthcare-forum/

从精准医学大数据到智能医疗

在上午的“知识图谱与智慧医疗学术论坛”上，来自复旦大学生物医学研究院的刘雷教授带来了题为“从精准医学大数据到智能医疗”的主题演讲。

科学家们已经逐步发现，针对遗传学和基因的研究能够更好地指导我们的医疗发展：对不同个体使用不同药物和采取不同的治疗方法很可能产生不同的结果，那么，如何确保为每一个病人找到最优的治疗方案、针对病人的个性化特征来决定治疗方案？这些问题的答案很可能就写在每个人的基因里。

精准医学指的是基于大样本研究获得疾病分子机制的知识体系，依据组学数据和患者的个体特征，借助现代遗传学、分子影像学、生物信息学和临床医学等知识来实现疾病的精准预防、精准诊断和精准治疗，因人而异确定治疗方案和药物的用法用量，从而达到提高医疗的有效性、减少治疗方案副作用的目标。刘雷教授以“美国精准医学计划”作为开场，介绍了国内外主要的“精准医学”研究方案。毫无疑问，精准医学集成了现代医学科技发展的知识与技术体系，体现了医学科学的发展趋势，也代表了临床实践的发展方向。

从上图可以看出，精准医学的实现主要分为四个阶段，目前每一阶段都还有很长的路要走。而针对目标3，知识图谱技术可以很好地解决精准医疗大数据的资源整合、存储、利用与共享平台建设，即疾病研究精准医学知识库构建。

建立知识库在精准医学研究中的重要性不言而喻，这恰恰也是现阶段研究热点所在。而在大数据的背景下，知识库的建立在技术上仍然面临多重难点。例如，如何将不同层次的知识（包括分子层面、药物、临床体征、疾病以及环境等这些不同层次）进行整合，或者是基础概念的整合，又或是概念之间关系的整合等。

作为总结，刘雷教授表示，如今我们看到计算机技术在医疗上的应用越来越广泛，而这背后始终坚持的是从数据到信息再到知识的“中心法则”，正因如此，计算机技术才能造福更多人。

知识挖掘对分级诊疗的智能辅助

在下午的智慧医疗产业与市场论坛环节，来自微软亚洲研究院数据挖掘与企业智能化组的研究员纪蕾与大家分享了“知识挖掘对分级诊疗的智能辅助”问题。相关内容在《培养一个人类医生至少需要八年，那么人工智能呢？》中也有介绍。

目前，微软亚洲研究院已经与国内多家医院和医疗机构合作进行试点，基于微软提供的Azure云服务，为医生打造人工智能医生助手，帮助提高基层医生的工作能力、提升工作效率。现阶段，该项目由微软亚洲研究院提供算法和解决方案，对接医院需求，医生与研究员共同从事临床试验。研究员们为每个医生搭建了属于他们自己的人工智能医生助手，医生助手会以微信服务号等多种不同的形式协助医生，并且这一协助将贯穿在治疗前、治疗中和治疗后的整个就医体验中。

那么，这样一个人工智能的医生助手都能做些什么呢？其中包括知识库辅助学习（帮助基层医生培训）、知识库辅助问诊（辅助基层医生临床）、常识型问题自动回复和自动随访（包括人文关怀和异常提醒）等功能。

不久前，微软亚洲研究院数据挖掘与企业智能化组发布了Microsoft Concept Graph和Microsoft Concept Tagging模型，力图从大数据中挖掘知识，用于帮助机器更好地理解人类交流并且进行语义计算。在这项研究的基础上，微软亚洲研究院的研究组利用知识挖掘的API针对医疗数据，包括海量的医学文献、匿名诊疗记录等进行数据挖掘，建立医疗知识库，使得不同的医疗问题都有对应的专业解答。与此同时，研究员们还针对互联网搜索数据建立了用户搜索意图的知识库。例如在病人提出“糖尿病不应该吃什么？”和“糖尿病的饮食”这类问题的时候，知识库能准确将这类问题映射到“糖尿病应遵循的饮食习惯”上来。通过结合医疗知识库和用户意图的知识库，两者可以互相学习、形成闭环。

在整个系统流程中，从知识库建立，到实体识别与链接和知识计算，虽然研究面临着诸多技术挑战，但研究员们仍希望，这样一套人工智能医生助手能够真正帮助医生提高效率、改善医患关系，让人们获得更好的诊疗体验。

知识图谱与智慧医疗

活动最后的“行业专家座谈”环节，由微软亚洲研究院数据挖掘与企业智能化组资深研究经理闫峻主持，四位嘉宾参与，嘉宾分别是武汉大学俞思伟教授、哈尔滨工业大学汤步洲教授、大数医达邓侃博士和万方数据程煜华博士，这些嘉宾从自己的专业背景出发分享了他们对知识图谱与智慧医疗的见解。

知识图谱是如何推动智慧医疗发展的呢？这背后有着算法层面、数据层面和应用层面的多重原因。从算法层面来说，深层神经网络技术不仅在图像和语音识别领域有着显著的帮助，用在自然语言处理等文本分析问题上也有同样让人欣喜的表现，因此基于深层神经网络技术的知识图谱在数据挖掘的质量上也有着不断的提高。其次是数据，数据对知识图谱的构建至关重要，海量的数据能让知识图谱积累更多的知识，从而构建更完整的知识图谱。最后从应用层面来说，近年来随着人工智能技术的发展，聊天机器人（chatbot）这种人机交互方式日益普及，让研究者们看到了更多知识图谱应用的空间。只要拥有各种垂直领域的知识，聊天机器人就能更好地帮助人们完成某些具体的任务。因此，知识图谱与医疗垂直信息的结合，让人们有机会一窥智慧医疗的身影。

除了知识图谱本身，智慧医疗还有很大的发展空间，而计算机与医疗的结合，同样还有着丰富的无限可能。

智慧医疗狭义的定义是CDSS （clinical decision support systems），通过输入病情描述，包括症状和化验指标等，输出诊断结果。输出的诊断结果分为两个不同的阶段，首先是根据有限的结果给出可能的疾病判断，第二步是删选掉不太靠谱的疾病，进一步提高诊断准确性，从而解决下一步的路径的问题，例如还需要做什么化验和检查等。而从在线预约挂号，到智能分诊等种种就医过程的改善，则都可以被视为广义的智慧医疗——为人们提供更多更便捷的医疗服务。此外还涉及到医疗的信息化问题。因为即使到今天为止，医生也很难将自己看过的所有病人的记录进行整理。而对病人来说，也鲜有完整的从出生到现在的诊疗记录。由于这些信息上的局限，医生在科研方面也备受限制。从这些角度来讲，智慧医疗还有很长的路要走。知识图谱只是一小步，前面还有很多步等着计算机技术携手医疗一起前进。

培养一个人类医生至少需要八年，那么人工智能呢？

来源：微软研究院AI头条

一位普通患者的非典型住院之旅

去年，微软亚洲研究院的资深研究员闫峻在北京一家医院做了一场外科手术，手术前后，他在医院住了十天。但当他躺在病床上，想安安静静看上几本书，或者干脆好好补个长觉时，却不断被各种嘈杂的声音打扰。如果你也曾在医院待过一两天，你几乎不会错过这样的场景：忙不过来的医生和不断追问的家属，手忙脚乱。

闫峻躺在病床上，研究者的好奇心让他试图用技术的眼光寻找原因。闫峻分析：“医生资源十分有限，他没有办法将他的知识表达给所有的患者，而由于信息不对称的存在，患者是安全感不够的。患者需要得到医生的专业解释和帮助，这样心里才会有底。”

“提高生产力”这个概念几乎对于每一个微软员工都熟捻于心。当这位微软亚洲研究院的研究员结束了他十天的医院之旅，走出医院时，一个利用已有的人工智能技术帮助医院医生提高生产力的计划在他的脑海里也逐渐萌芽。

知识挖掘与人工智能

闫峻是微软亚洲研究院数据挖掘与企业智能化组的负责人，今年是他在研究院工作的第10个年头。早在2003年，闫峻在北大读博士的第二年开始就以实习生的身份加入了微软亚洲研究院，彼时亚洲研究院刚成立五年，国内互联网和计算机技术发展迅猛。闫峻在博士期间的研究方向是模式识别，其实就是现在广义的机器学习。

近几年，人工智能俨然成为了计算机领域最火热的研究方向，这背后离不开机器学习、大数据和云计算等的共同作用。社会上关于人工智能的讨论始终不绝于耳，人工智能威胁论、人工智能奇点论等等。但无论媒体如何鼓吹，人工智能领域的研究专家基本上都会给你同样的答案：真正的人工智能离我们还很遥远。

目前，人工智能已经能够在一些如图像识别、语音识别、实时翻译等特定的任务上表现优异，但在更深层次的思考、总结、联想、创造等等方面的进展十分有限。此前计算机战胜人类顶级围棋棋手加强了研究者们用机器学习构建计算机智能的信心，诚然，机器学习目前也被视为是通往人工智能一条近路之一。

事实上，知识的挖掘和知识的表述是人工智能里最基础的问题。我们怎么衡量一个人是“智能”的？一方面，我们会说这个人的脑子很灵活，反应很快。另一方面我们会说这个人有很多经验，懂很多知识。对应到人工智能的研究上来，也就是我们需要人工智能本身拥有很多的背景知识，也需要他有很强的推理能力、理解能力和判断能力。目前，闫峻所在的数据挖掘与企业智能化组主要的研究方向便主要聚焦于知识的挖掘，表示与计算，具体来说就是研究如何从不同的数据来源里挖掘出知识，帮助人工智能的其他算法在具体的场景中完成一些特定的任务。

这一次，闫峻想借用自己的研究成果，为医生培养他们自己的人工智能助手，辅助医生完成一些他们无暇顾及的任务，并为患者提供更多的人文关怀。最终的目的是希望这个人工智能医生助手兼学徒有一天能够顺利出师，能像一个真正的医生一样耐心细致的回答病人的疑惑，协助病人的康复，缓解目前的医疗资源紧缺的局面。

培养一个人类医生至少需要八年，那么人工智能呢？

闫峻在病假后的第一次午饭时，就和研究院的同事们聊起了这次住院经历。让他意外的是，几乎每一个同事——甚至比他年纪小很多的90后年轻研究员都表达了强烈的同感，他们的父母或者亲人都或多或少的经历过同样的事情。在那天的午饭上，数据挖掘与企业智能化组的研究员们提出了一个创造性的想法：为医生构建一个人工智能医生助手！

对于人工智能医生助手而言，技术上最关键的一环就是让计算机学会一些必要的医学知识。这恰恰是闫峻博士所在的数据挖掘与企业智能化组所专攻的。闫峻习惯将机器学习知识的过程与人类学习知识的方式相类比，将这个过程分为四个阶段。“就像指导你的孩子一样学知识。” 闫峻形容道。

第一个阶段是人类婴儿出生到上学之前的这个阶段。这个阶段孩子还没有很强的读写和分析问题的能力，更多地是从他的父母或者身边的环境中学习一般性的知识(common sense knowledge)，例如糖是甜的，天是蓝的。这种让计算机学会一般性的知识是较为基础的研究工作，机器会从不同的数据源里面学到一些基本的事实和一些基本的关系。与之对应的，不久前数据挖掘与企业智能化组还发布的Microsoft Concept Graph和Microsoft Concept Tagging模型就试图让计算机掌握部分常识。

第二个阶段则是小孩进入学校开始读书直至大学毕业的阶段。这个过程其实人们主要的学习方式是读书，学习书本上的知识。人们在读书的过程中会不断地分析、总结、归纳，将一些知识进行整合和关联，形成系统性的知识体系，我们称之为知识图谱（knowledge graph）。因此在这个阶段，让机器拥有阅读能力是一个非常重要的课题。研究员们让计算机阅读了大量医学学生的必学书目，让计算机从这些文本中获取作为医生助手最基础的医学知识作为储备，并为下一步进医院“实习”做好准备。

第三阶段则是研究生阶段，你会有一个导师，而你学习的方式已经不再是被动的接受书本知识，而是主动地从他人——你的导师那里学习知识了。这种学习方式中师生间有很多互动，学生会主动询问老师解决办法，从机器学习的角度来理解就是“主动学习”。到了这个阶段，研究员们就将这位人工智能助手送到医院的具体某个科室，选择一位医生作为它的“师傅”。进行简单的“拜师仪式”之后，机器人将成为某位医生的学徒。对于机器学徒不懂得问题，会在聚类总结后向导师主动询问来获取知识。

除了主动提问，跟人类的拜师学艺没有什么区别，计算机向师傅学习的最便捷的方式，就是从医生的匿名诊疗记录入手。这里暗藏着医生的经验知识，在医疗信息化的今天，每一位医生看过的病人信息都会以电子化的形式记录下来，包括病人的症状，各项检查结果以及医生的治疗方案。通过对病例的通读与学习之后，这位虚拟学徒便会对这个科室有一个大体的认识，包括常见症状以及诊疗方案等。但这并不意味着这位人工智能助手可以成功出师了，它还需要最后一个阶段的学习。

最后一个阶段人们通常称之为“增强学习”。很显然，知识的更迭日新月异，人们在走出象牙塔之后发现还需要不断地学习此时的学习更多地会依赖于自己经验的积累以及不断的试错。此前AlphaGo所采用的增强学习就是源自这类思想，它会不断尝试各种下法，观察不同的决策带来的可能性，并以此进行经验总结，从而指导他与真人下棋时的决策。在这个阶段，研究员们才让这位“助手”在监督无风险情况下有选择地与患者进行接触。搜集反馈，提升自己的经验和能力。所有的知识学习阶段都是在“终身学习“ 的框架下不断迭代的进行。

“培养一个医生至少需要八年，但是计算机几乎不眠不休、不吃不喝，并且过目不忘，所以这个学习过程毫无疑问可以大大缩短。” 闫峻博士虽然没有给出一个具体的时长，因为这个很大程度上与人工智能医生所处的科室关系很大，但可以确信的是，培养一个人工智能虚拟医生助手的成本远远低于培养一个真正人类的医生助手。

做些医生做不到的事情

那么，人工智能医生助手究竟能帮医生和病患们做些什么呢？

目前，这项关于人工智能医生助手的医疗项目已经与多家医院和医疗机构合作进行试点，由微软亚洲研究院提供算法和解决方案，对接医院需求，医生与研究员一起从事临床实验。研究员们为每个医生各自搭建了属于他们的人工智能助手。这位医生助手会以微信服务号等多种不同的形式协助医生，并贯穿在治疗前、治疗中和治疗后的整个就医体验中。

其实在许多疾病的治疗，特别是外科手术中，大部分患者遇到的问题是很类似的，机器人可以记忆并理解这些常见的问题，辅助医生事先向患者提问，搜集患者的有用信息，并给出初步的诊疗方案供医生参考，甚至能让患者在与医生见面之前提前做好必备的检查，这样就能大大缩短病人实际面见医生的时间和流程，在有限的时间里，直接切入关键问题。

除了治疗前的提前沟通和治疗途中的有问必答之外，人工智能助手还能做些医生很难细致的面面俱到的事，例如患者随访，收集医疗大数据，增进对病患的人文关怀。

“在和医生合作的过程中，我们发现医生看病的过程跟机器学习也十分相似。” 闫峻博士说。患者介绍病情即提供了机器学习算法的特征维度，接下来，医生根据患者的病情提供治疗方案，即进行预测，这很像训练机器学习的一个算法模型。但最重要的是，医生还需要了解这个治疗方案是否合适、患者有无并发症等问题，如果没有这一反馈，就无法得知医生的预测结果是否成功、没有机器学习需要的重要的数据标注，也就很难用此数据提高整体医疗水平。

“这其实就是一个患者随访的过程。” 闫峻说道。

闫峻在这次与医院的合作过程中认识了不少医生朋友。他了解到，每位医生每年的患者量非常巨大，对每一位患者都进行长期跟踪随访几乎是不可能的，“有的医生平均一年可能做上千台手术”。从学术科研的角度来看，真实有效随访的医疗大数据量很少，影响医疗水平的提高；而从患者的角度来说，由于离开医院后很难得到后续的提醒和关怀，也影响整体的就医感受。

微软亚洲研究院的研究员们也很快为这个问题提供了解决方案。研究员为医生们在各自的人工智能医生助手提供了一个后台，医生能在机器人的后台上设置一些规则、随访问题，例如治疗效果如何、是否有并发症等。在患者给出回复后，计算机便会通过自然语言处理技术来理解患者的回答，并将其变成知识库中的一部分，用来做数据分析。当患者有不理想的治疗结果反馈时，机器人也会及时地将这一信息通知医生。这样医生就能第一时间联系病人进行进一步的治疗，杜绝潜在的风险。特别是对于外地来省会医院等治疗的病人，由于路途遥远，这种自动化定期随访将方便他们与医生构建长期联系的机制。

“这个医疗项目本质上是提升医生和患者之间的沟通效率，让两者能够相互信赖。” 闫峻博士总结道。通过人工智能医生助手，患者在就诊前就可以事先和机器人做一些简单的沟通，大概了解可能的治疗方案，什么时间去医院比较合适，在本地治疗还是需要去更高级的医院。患者能够通过这种前期沟通的方式一定程度上消除这种信息的不对等，患者在治疗过程中有任何疑惑也能得到及时的回答。在治疗之后，患者还能得到医院的长期关怀，研究员们还为这个机器人加入了一些很人性化的功能，例如提醒病人什么时候需要吃药，吃药的剂量；或者在患者生日和特殊节日时，发送祝福，祝愿患者身体健康等。这些对于计算机而言十分简单的任务，对于工作繁重的医生来说却几乎不可能面面俱到的完成。而从医院的角度来看，也可以收集真实的医疗大数据，帮助医院提升整体的医疗水平和科研水平。

最大的困难是没有困难

困难重重。这个词可能是很多人第一次接触到这个项目时的想法。但出人意料的是，闫峻博士却不觉得这个项目有什么“最大的困难”。

对于学术界的人来说，如果想做这样一个项目，最大的困难可能来源于对资金的支持。而对于工业界的人来说，你很难说服自己的老板去做一个和整个公司的商业目标不是完全契合的项目。但这两种困难，对于微软亚洲研究院这样一个十几年如一日深耕计算机基础科研的机构来说，是几乎不存在的。

“我觉得在这里做研究最好的事情是我们没有太多的后顾之忧，也没有什么资金的压力。你只需要证明你做的这件事情本身是有价值的，那就没有人会阻拦你。如果说困难，困难都是研究上面的具体问题，例如数据量太大导致训练算法的过程耗时太久等等。但这种问题是每一个做研究的人都会碰到的。”

类似于人工智能医生助手这类的研究项目在微软还有很多。帮助视觉障碍患者重新“看见”周围世界的Seeing AI项目，帮助渐冻症患者用眼睛驾驶轮椅的Eye Gaze Wheelchair项目，用机器学习技术寻找艾滋病毒的核心蛋白计划，利用计算机视觉和机器学习识别癌症病理切片……正是因为有这么多心怀善意与正能量的酷炫极客们正在用技术来改善身边每一个人的计算体验，这个世界才会越来越美好。

目前，这个人工智能医疗助手项目还处于试验的早期阶段，相关的技术还在根据试验的结果不断完善。至于下一步的计划，闫峻博士表示：“希望能将这项技术真正应用到临床上，让每一个医疗环节都能多一份信赖。”

与此相关，为了更好的了解医生和患者的实际需求，也为了有更多的人工智能技术能够服务于中国的医疗健康问题，微软亚洲研究院与中文信息学会语言与知识计算专业委员会联合组织了知识图谱与智慧医疗论坛，于今日在成都展开讨论。期待专家学者们能够为医疗信息化、精准医疗等问题提供更高效，更贴近民生的解决方案！

文本型医疗大数据，拿来就可用？

来源：微软研究院AI头条

编者按

本文作者是微软亚洲研究院数据挖掘与企业智能化组资深研究员闫峻。此前在微软研究院AI头条上我们也分享过他们组的研究，分别是让计算机掌握常识：微软发布Microsoft Concept Graph和Microsoft Concept Tagging模型和培养一个人类医生至少需要八年，那么人工智能呢？闫峻博士在本文中解读了一些在对外合作交流中经常被问起的关于医疗大数据的问题。

文本型医疗大数据，拿来就可用？

闫峻

数据挖掘与企业智能化

微软亚洲研究院

我们的很多研究工作都是基于大数据的，现在所做的健康医疗领域研究也要基于大规模医疗文本数据的处理。但是否有了大量的确定领域文本数据，就可以直接拿来进行挖掘，建模，并利用数据来创造价值了呢？如果发现问题没那么简单，我们要做些什么工作才能让这些大数据真正创造价值呢？为了尝试搞清楚这些问题，我们先来看看人们对文本型医疗大数据理解上的一些常见误区。

大数据与可计算大数据

我们现在触手可及的文本型健康医疗数据很多，能够获取的数据规模也都很大，但这是否就意味着这些数据可以供研究机构或商业机构做大数据分析，让数据产生更大价值了呢？在使用这些数据之前，让我们先区分一下大数据与可计算大数据的区别。很多大数据科学家口中所说的大数据，往往指的是可计算的大数据。举个例子，某科室门诊病历数量巨大，我们希望从患者主诉和医生诊断及最终的治疗效果中建模出更有效的治疗方案。然而，当我们看到真实数据后会发现，大部分数据是整段的文本描述，计算机根本无从下手进行预测分析，甚至连一些基本的统计工作都无法进行，那么这样的数据就是不可计算的。如果我们可以把文本数据转换为数据库表、关系图，甚至数值型向量，计算机就可以读懂数据，进行我们想要的分析。例如根据某项疾病统计患者的年龄分布，根据每一项症状和检查指标，推荐可能有效的药品等。要把自然语言的描述转换为计算机可以计算的数据，需要依赖自然语言处理中的很多基础技术，比如句子的分词，实体识别，实体的归一化和链接等。临床电子病历的后结构化就是基于这些技术手段将大量不可计算数据转换为可统计、可计算数据的一个实际应用场景。所以拿到一份数据，我们需要先看看是否可用于计算；如果不是，就要做些功课了。

数据大与大数据

大家都期望从大数据中挖掘出潜在的价值，但是否数据量大了就是大数据，就一定有巨大价值呢？在进行大数据计算之前，我们还要区分一下数据大与大数据的区别。数据量大是我们谈及大数据的前提，但如果数据是有偏的和局部的，其价值将大打折扣。尽管工程上讲数据量大了，问题就是大数据问题，但从应用角度看，光凭数据量已经不能从本质上定义是否是大数据问题。我们理想的大数据指的是能够代表现实世界真实数据分布的数据。换句话说，如果大量数据代表了现实世界的真实情况，我们从中学习到的任何结论和数学模型都将具有实际意义，就可以用来预测未来和指导实践。反之，如果数据本身很偏，无论量有多大，得到的结论和模型都会很局限，甚至不能推广运用，那么其价值的折扣率就会很高。举个例子：某科室积累了大量门诊病历，数据已经很好结构化可用于计算，但所有数据都是本科室医生在过去几年针对某些疾病的积累，治疗手段渐渐趋同，我们从中建模出能打破瓶颈的新诊疗方案的可能性就很低了。下图用直观的方式来解释这个问题：外边的大圈代表真实的数据分布，当然不得不承认这个大圈对于大部分实际应用都是未知的。假设我们获得了大量数据，以里边小圈表示，明显小圈在整体数据分布中是偏向于某个局部的，那么我们的各种大数据计算所得的结果就会或者被局限到小圈以内，或者通过机器学习算法扩展到用虚线表示的那个小圈，距离真实数据分布的结论和模型还差得远，这就导致了我们大数据分析得到的结论不能代表现实世界的真实情况。既然如此，如何保证数据量大就是真正大数据问题呢？现实一点说，对很多应用来说根本无法保证，但我们可以尽可能逼近。如何逼近？对这个具体领域就是获取尽可能多的多源同类数据，如针对同一病种获取采用不同治疗方案的不同医院的数据。这里边有很多现实的挑战，首先是数据共享的挑战，这个太难了，但我们已经看到在开放领域的诸多努力，如开放知识图谱项目（OpenKG）；从技术的角度看，问题是不同数据来源对知识的表达方式暂时还没有大家都在执行的统一标准，于是数据的融合成了大问题。这里边的挑战很多，大家都知道不同医院的医生在写病历过程中对同一实体的描述方式很可能不同，即使在同一家医院，医生也不能保证用同一名称表达同一个症状。要实现数据的融合，最起码的一个要解决的问题就是同一实体，同一短语，甚至同一句话的语义扩展表达以及最终归一化的问题，可以是符号的扩展，也可以是向量的表达，但一定要有办法才行。

真大数据与伪大数据

如果我们有了可计算的大量数据，也尽人力之所能地尝试逼近了真实数据分布，总可以做大数据分析来解决问题了吧？当然可以解决一部分问题，如很多相关性分析工作，数据聚类工作，但对于很多现实的机器学习问题，尤其是有监督学习问题，我们再要区分一下真大数据和伪大数据。什么是伪大数据？就是看起来很大，实际上很小的数据。沿用前边的例子，我们希望从门诊病历中根据患者信息，医生治疗方案以及治疗效果做疗效的预测模型，数据量可能很大；但当我们做模型训练时发现我们实际上需要有标注的样本才能做机器学习，这里的标注就是疗效。比如一种方案针对某患者A治疗后症状有所减轻，针对另一患者B治疗完全无效，而第三名患者C在治疗后完全康复等等。当我们看了很多数据，会发现尽管总体样本量很大，很多实际问题中有标注的样本量很小，甚至有可能这些有标注的样本量已经少到让整个问题退化成小数据问题或者偏到单纯的数据大问题了。这就是伪大数据，看起来很大，有用部分很小。很多人会说我们可以用半监督学习还有增强学习。当然可用，但当前大部分半监督学习方法的能力也就是从上图的小圈学到稍大一点的虚线圈，增强学习要看我们的应用场景是否允许在现实环境中不断尝试并获得反馈，毕竟医疗人命关天。那该怎么办？答案是主动学习。啥意思? 就是要有人的参与，让我们的大数据以尽可能大的比例有用。换句话说，让机器不懂就问人呗。就操作层面，出现了两个问题：第一，人为什么要参与？第二，人要花多大成本参与？第一个问题需要应用场景支撑，让参与者在应用中获得好处。毕竟人是懒惰的，没有好处不能强求他人的参与，所以要有落地的项目才能驱动人的参与。这就部分解释了为什么医学大数据研究在没用应用场景情况下的纯研究会比较困难。针对第二个问题，如果要求每条数据都要有人的参与才有用，我们获取有用大数据的成本就会超出我们的想象了。所以要对人提关键问题，让人参与的结果可以泛化到尽可能多的数据中去。实际一点，至少做个聚类分析或者分类吧，把那些距离已知知识比较远但细节类似的情况通过人的一次参与尽可能多的标注解决。

从大数据到大数据的价值

我们利用技术手段，人际关系和实际项目获得了可计算的、尽可能无偏的、尽可能有用的大数据了。这是真的大数据了？可以从数据中收获价值了吗？其实，这才刚开始，数据中会有各种各样的问题，如噪声的问题、不平衡的问题、特征缺失的问题等等，这些总有算法和实际的应用场景解决。好，假设都解决了，获取数据的价值还需要建立模型，也就是我们的统计分析、知识推理、机器学习，包括深度学习模型。但是针对医疗的大数据还有一些特殊性值得我们注意。举几个例子，有很多应用场景如诊断问题，需要结论的可解释性或部分可解释性，那么我们的很多黑箱算法，如深度学习就遇到挑战了。当然可以用知识推理，但问题又来了，知识图谱建立的各种挑战和知识图谱普遍碎片化的现状让我们的推理工作障碍重重。现实就是如此，但有什么办法尽量做得好一点？可以把符号推理与统计学习结合起来，让碎片化知识图谱的知识推理和深度学习的决策模型结合起来，我们称之为Local Knowledge Powered Global Learning。如何结合？方法很多，学术界也很关注，但不是现在的主题，暂时放放。最后，说明一下，大数据的类型很多，普遍认为有很多应用场景直接使用大量文本数据就可以用了：比如搜索，找相关的文章去读；比如自动问答，找到能回答问题的一段话就可以。但仔细想想，我们真的逃开了上面列出的技术问题吗？假设我们想要寻找一个罕见疾病的可能病因或方案，有大量的医疗文献可供查找，我们是否要从问题和文献中识别目标实体，是否要做语义的扩展用来匹配，是否要尽可能保证文献覆盖率，是否需要相关性的训练数据？仔细想想，在这些场景中其实就是把上边提到的一些功课放在另外一个流程中去做了，至少部分的做了，所以说到底还是做了。

作者简介

闫峻博士，微软亚洲研究院资深研究员。他的研究兴趣包括人工智能中的知识挖掘，基于知识的机器学习，文本处理技术，信息检索，互联网广告等并更加关注医疗健康领域的人工智能研究。至今为止，他的数十项研究成果被应用到微软的不同技术产品中，获取技术专利数十项，发表高质量学术论文70余篇。他是很多高质量学术会议的程序委员会成员及资深程序委员会成员, 并且是很多高质量期刊的审稿人。

人工智能赛博物理操作系统

AI-CPS OS

“人工智能赛博物理操作系统”（新一代技术+商业操作系统“AI-CPS OS”：云计算+大数据+物联网+区块链+人工智能）分支用来的今天，企业领导者必须了解如何将“技术”全面渗入整个公司、产品等“商业”场景中，利用AI-CPS OS形成数字化+智能化力量，实现行业的重新布局、企业的重新构建和自我的焕然新生。

AI-CPS OS的真正价值并不来自构成技术或功能，而是要以一种传递独特竞争优势的方式将自动化+信息化、智造+产品+服务和数据+分析一体化，这种整合方式能够释放新的业务和运营模式。如果不能实现跨功能的更大规模融合，没有颠覆现状的意愿，这些将不可能实现。

领导者无法依靠某种单一战略方法来应对多维度的数字化变革。面对新一代技术+商业操作系统AI-CPS OS颠覆性的数字化+智能化力量，领导者必须在行业、企业与个人这三个层面都保持领先地位：

重新行业布局：你的世界观要怎样改变才算足够？你必须对行业典范进行怎样的反思？
重新构建企业：你的企业需要做出什么样的变化？你准备如何重新定义你的公司？
重新打造自己：你需要成为怎样的人？要重塑自己并在数字化+智能化时代保有领先地位，你必须如何去做？

AI-CPS OS是数字化智能化创新平台，设计思路是将大数据、物联网、区块链和人工智能等无缝整合在云端，可以帮助企业将创新成果融入自身业务体系，实现各个前沿技术在云端的优势协同。AI-CPS OS形成的数字化+智能化力量与行业、企业及个人三个层面的交叉，形成了领导力模式，使数字化融入到领导者所在企业与领导方式的核心位置：

精细：这种力量能够使人在更加真实、细致的层面观察与感知现实世界和数字化世界正在发生的一切，进而理解和更加精细地进行产品个性化控制、微观业务场景事件和结果控制。
智能：模型随着时间（数据）的变化而变化，整个系统就具备了智能（自学习）的能力。
高效：企业需要建立实时或者准实时的数据采集传输、模型预测和响应决策能力，这样智能就从批量性、阶段性的行为变成一个可以实时触达的行为。
不确定性：数字化变更颠覆和改变了领导者曾经仰仗的思维方式、结构和实践经验，其结果就是形成了复合不确定性这种颠覆性力量。主要的不确定性蕴含于三个领域：技术、文化、制度。
边界模糊：数字世界与现实世界的不断融合成CPS不仅让人们所知行业的核心产品、经济学定理和可能性都产生了变化，还模糊了不同行业间的界限。这种效应正在向生态系统、企业、客户、产品快速蔓延。

AI-CPS OS形成的数字化+智能化力量通过三个方式激发经济增长：

创造虚拟劳动力，承担需要适应性和敏捷性的复杂任务，即“智能自动化”，以区别于传统的自动化解决方案；
对现有劳动力和实物资产进行有利的补充和提升，提高资本效率；
人工智能的普及，将推动多行业的相关创新，开辟崭新的经济增长空间。

给决策制定者和商业领袖的建议：

超越自动化，开启新创新模式：利用具有自主学习和自我控制能力的动态机器智能，为企业创造新商机；
迎接新一代信息技术，迎接人工智能：无缝整合人类智慧与机器智能，重新
评估未来的知识和技能类型；
制定道德规范：切实为人工智能生态系统制定道德准则，并在智能机器的开
发过程中确定更加明晰的标准和最佳实践；
重视再分配效应：对人工智能可能带来的冲击做好准备，制定战略帮助面临
较高失业风险的人群；
开发数字化+智能化企业所需新能力：员工团队需要积极掌握判断、沟通及想象力和创造力等人类所特有的重要能力。对于中国企业来说，创造兼具包容性和多样性的文化也非常重要。

子曰：“君子和而不同，小人同而不和。” 《论语·子路》云计算、大数据、物联网、区块链和人工智能，像君子一般融合，一起体现科技就是生产力。

如果说上一次哥伦布地理大发现，拓展的是人类的物理空间。那么这一次地理大发现，拓展的就是人们的数字空间。在数学空间，建立新的商业文明，从而发现新的创富模式，为人类社会带来新的财富空间。云计算，大数据、物联网和区块链，是进入这个数字空间的船，而人工智能就是那船上的帆，哥伦布之帆！

新一代技术+商业的人工智能赛博物理操作系统AI-CPS OS作为新一轮产业变革的核心驱动力，将进一步释放历次科技革命和产业变革积蓄的巨大能量，并创造新的强大引擎。重构生产、分配、交换、消费等经济活动各环节，形成从宏观到微观各领域的智能化新需求，催生新技术、新产品、新产业、新业态、新模式。引发经济结构重大变革，深刻改变人类生产生活方式和思维模式，实现社会生产力的整体跃升。