全球协作，微软人工智能技术助力智能医疗服务升级

2017 年 5 月 12 日 微软研究院AI头条

正在美国西雅图举行的2017 微软Build 开发者大会上，微软发布了一系列全新人工智能技术和服务，切实体现了微软普及人工智能（Democratizing AI），将人工智能带给每个人的愿景和行动力。微软CEO 萨提亚·纳德拉表示，在如今这个拥有近乎于无限计算能力、并且数据呈指数级增长的环境下，微软专注于予力每一位开发者，帮助他们开发应用，让他们享受到人工智能带来的机遇，从而适应新的智能云及智能边缘计算时代。

无需作秀，创业企业Airdoc就切身体会到了微软人工智能平台的好处。

Airdoc是一家专注于以深度学习提升医学诊疗效率的成长型企业，以平台、算法、数据积累打造人工智能应用，帮助医生提高诊断效率和准确率。历经数年的积累，目前Airdoc在放射影像、肿瘤、皮肤科、B超及眼科等领域都获得了突破并拥有实际的落地应用。例如，针对糖尿病并发症——糖尿病性视网膜眼底病变（DR），Airdoc可以协助医生快速完成视网膜病变的筛查及分析，解决了传统手段在DR早期确诊率低的困境，从而有效地防止病患视觉的损失以及失明。

提供基于深度神经网络和机器学习的高实时性算法服务，是Airdoc服务背后的核心竞争力。然而，已在众多医疗机构部署了深度学习算法的Airdoc还面临大规模医疗数据和实时并发的需求，但市面已有的深度学习系统框架的性能已经很难满足Airdoc在训练和生产环境的高实时性需求。因此，当Airdoc创始人张大磊得知微软推出了微软认知工具包的时候，立刻兴奋起来。“抱着试试看的心情”，张大磊给微软开发者体验部门发了电子邮件，询问相关情况。

微软认知工具包（Microsoft Cognitive Toolkit，曾用名为深度学习工具包CNTK，Computational Network Toolkit），是微软研究院推出的一个用于深度学习的系统，能够基于CPU 和 GPU高效、跨平台地处理大规模、可投入应用的任务，并可同时支持 Windows 和 Linux 系统。事实上，2016年微软实现了对话语音识别技术超越人类专业水平的突破，背后的功臣就是微软认知工具包。此外，包括人工智能助理小娜（Cortana）和混合现实全息眼镜HoloLens等微软智能产品中的语音识别功能也都是基于微软认知工具包实现的。

为了让更多开发者能够轻松开发出各种有趣的人工智能应用，微软已经将微软认知工具包开源，并于近期发布了具有更强性能表现和学习能力的2.0版本。跟其它开源软件相比，微软认知工具包最突出的优势在于它高效的计算性能，尤其在大规模、分布式的机器学习方面有着卓越的表现，在加速完成学习任务的同时还可以保证模型的准确性。

正是因为微软认知工具包的强大功能，使得Airdoc希望进行相关部署，以实现在多机多卡的分布式训练环境下，提升原有系统的整体性能。但Airdoc的应用服务此前是基于Caffe平台的ResNext和GoogLeNet模型所构建的，因此系统的迁移工作成了一大难题。而且面对大量的医疗数据，向微软认知工具包的迁移不仅需要平稳、迅速地进行，还需要确保相关工具的准确度。

在接到Airdoc需求的第一时间，微软即刻行动，迅速成立了一支由微软开发者体验部门技术人员、微软亚洲研究院研究员与在美国总部的微软认知工具包团队共同组成的虚拟技术支持小组，开启了与Airdoc的紧密合作。在微软北京办公室一间30平米的会议室里，平台迁移技术支持小组的成员们交流了技术设想，并对每一个细节都进行了充分的讨论。另一边，位于美国总部的团队也通过Skype for Business远程参与。

双方技术人员在微软办公室进行平台迁移

微软开发者体验部门首席平台技术顾问王启霄表示：“自从与Airdoc创始人张大磊第一次接触之后，微软与Airdoc双方的技术团队就开启了‘同吃住’般密切的交流。我们希望成为最了解Airdoc技术的团队，只有这样才能更好地探索解决问题的方法，并尽我们所能提供最佳的解决方案。”

若要实现向微软认知工具包的平稳迁移，就必须要保证：第一，迁移后的算法模型在真实病患数据上跑出来的结果与原先模型完全一致；第二，计算效率不能降低。只有保证这两个前提，迁移才算成功。对这项“时间紧，任务重”的工作，微软的研究员和工程师们都投入了巨大的积极与热情。

第一天，在微软开发者体验部门详细了解了Airdoc的原有模型结构以及训练和评估两个方面的模型数据之后，微软亚洲研究院的研究员迅速针对模型编写出了可满足需求的转化器（Converter），用于模型过渡，同时基于真实数据进行训练。经过多轮的评估比较，研究员们欣喜地发现，迁移完全可行，这也让大家对结果充满了信心。

第二天，基于前一天的对比结果，在美国微软认知工具包团队的支持下，微软亚洲研究院的研究员针对新模型的代码进行了调整，并且与Airdoc合作将微软认知工具包的代码库进行了重建和整合。一切都在有条不紊地推进。

第三天，微软亚洲研究院的研究员相应地将转化器进行了更新，并在当晚得出了一个令人振奋的结果：基于微软认知工具包模型运行出来的数据结果与此前Caffe平台模型的运行结果完全一致！

第四天，迁移工作全面结束，结果不仅达成了预期目标，更是超过了所有人的设想：运行数据的准确率与原有模型完全一致，且在微软认知工具包上的GoogLeNet模型运行效率远远高于Caffe平台；整体模型的运行效率提升了30%-40%。

“我一直相信微软，相信微软的技术。微软技术平台的可靠性、先进性毋庸置疑。兼容性和开放性更是为我们创造了更多可能。这次合作，仅仅用了不到四天的时间就实现了无缝衔接，太震撼了！”Airdoc创始人张大磊表示， “不过其中最让我感动的，是微软研究员和技术人员的科研热情、协作精神。没想到一封电子邮件，就开启了双方如此真心诚意的紧密合作。”

Build大会期间，Airdoc创始人张大磊（右）与同事在微软研究院

“普及人工智能”现已成为微软各个部门的共识。从微软研究院到微软产品技术部门，从北京到西雅图，从云计算平台到开发工具，人工智能正在成为微软上下统一的目标，整个微软正在全力推动实现这一愿景。

“‘一个微软’是我们秉持的公司理念，无论身在哪个时区，哪个部门，我们的员工都将团结协作，持续为个人用户、技术开发人员和组织机构提供值得信赖的技术、服务和产品。”微软全球资深副总裁、微软亚太研发集团主席兼微软亚洲研究院院长洪小文表示。

你也许还想看：

感谢你关注“微软研究院AI头条”，我们期待你的留言和投稿，共建交流平台。来稿请寄：msraai@microsoft.com。微软小冰进驻微软研究院微信啦！快去主页和她聊聊天吧。

登录查看更多

相关内容

微软

关注 8

微软（英文名称：Microsoft；中文名称：微软公司或美国微软公司）始建于1975年，是一家美国跨国科技公司，也是世界PC（Personal Computer，个人计算机）软件开发的先导，由比尔·盖茨与保罗·艾伦创办于1975年，公司总部设立在华盛顿州的雷德蒙德（Redmond，邻近西雅图）。以研发、制造、授权和提供广泛的电脑软件服务业务为主。

深度神经网络实时物联网图像处理，241页pdf

专知会员服务

78+阅读 · 2020年3月15日

【德勤】中国人工智能产业白皮书，68页pdf

专知会员服务

310+阅读 · 2019年12月23日

2019中国硬科技发展白皮书 193页

专知会员服务

86+阅读 · 2019年12月13日

【大数据白皮书 2019】中国信息通信研究院

专知会员服务

138+阅读 · 2019年12月12日