开眼|英特尔举行中国研究院开放日，揭秘数据时代的科技引擎

2017 年 11 月 30 日 机器人大讲堂

“英特尔中国研究院开放日”今天在北京举行，英特尔中国研究院院长宋继强率领团队集体亮相，共同分享了英特尔中国研究院的整体定位、研究方向和创新机制，并展示了在人工智能、机器人、5G、虚拟现实等一系列前瞻科技领域的最新研究成果。

作为英特尔英特尔研究院在海外设立的三个“地区性的研究机构”之一，英特尔中国研究院（Intel Labs China, ILC）目前主要聚焦于研究与未来自主系统相关的关键技术，包括人工智能算法、自主系统平台和智能基础设施三大部分。

英特尔中国研究院院长宋继强表示：“英特尔中国研究院致力于打造世界一流的工业研究院，通过突破性的成果打造英特尔的创新引擎，保持英特尔的技术领先性。它不仅着眼于未来革命性的科技研究，还承载着将研究成果转化至全球及中国本土创新产品的使命。我们既要作务实的探险家，又要作大胆的实践者。面向未来，我们将始终秉承英特尔50年来推动摩尔定律的精神来加速推动创新，推动产业和社会向前发展，让科技的进步普惠每一位世界公民。”

英特尔中国研究院院长宋继强介绍研究院定位及最新成果

英特尔中国研究院代表介绍研究院主要研究方向

与视觉理解相关的人工智能算法：让机器更懂你

该研究方向主要包括人脸识别技术、情绪识别、场景理解等技术以及深度神经网络压缩技术。基于先进的人工智能算法，英特尔中国研究院开发了视觉内容理解和视觉内容创建能力，能够创造前所未有的体验。前瞻性的视觉理解、视觉认知主要涉及三个方面：人脸分析和情感识别；针对视觉识别高效的视觉压缩；视觉、语言和知识融合。在此次开放日活动中，英特尔中国研究院的专家重点介绍了三个方面的最新技术进展。

1.人脸分析及情感识别技术

在人脸分析和情感识别方面，英特尔中国研究院很早便拥有最先进的算法，并且在EmotiW比赛（自然环境下的情感识别比赛）中获得冠军，该算法的速度是第二名团队的200倍，可以应用于无人驾驶的场景当中。基于英特尔实时人像风格迁移系统，英特尔中国研究院将多种艺术人像风格实时迁移到静态的目标图像以及动态的目标视频中。该项技术可以广泛地应用于AR/VR、在线直播、影视、多媒体社交等领域。

此外，英特尔中国研究院基于机器学习和深度学习算法开发了英特尔3D人脸面部表情捕捉技术。英特尔研究员们从数十万人脸图片数据中，训练出多个人脸识别模型，用于对视频图像进行智能分析与3D建模，不仅可以检测与识别人脸，还能精准重建3D人脸，并实时跟踪面部表情变化，将预先设计好的特效素材附着在3D人脸上并叠加到视频中，从而实现逼真炫酷的脸部特效。

2.深度神经网络压缩技术

当前，深度学习领域目前面临的一大挑战是，主流DNNs都是计算和存储密集型的，这导致在边缘和嵌入式设备的部署面临巨大的挑战。为此，英特尔中国研究院提出了从动态网络手术DNS、渐进网络量化INQ到MLQ多尺度编码量化的低精度深度压缩解决方案。通过这“三部曲”，可以获得百倍DNN模型无损压缩性能。根据AlexNet测试结果，该项简洁的解决方案能够超越主流深度压缩方案至少一倍，在2/4-bit精度下达到超过100倍的网络压缩。

3.多模态图像视频解析

近年来，如何自动生成视频描述引起了研究人员的广泛兴趣。人们希望计算机在看到一段视频的时候，可以根据视频的内容“讲故事”。但是，视频描述模型的训练通常需要大量复杂的并且带有一定主观性的人工标注。而在目前的数据集构建过程中，标注人员会在看过一段视频之后，用一句话描述视频的内容。但是，一段视频通常会发生几个不同的事件，而由于标注人员具有一定主观性，人们既不知道其描述的是哪个事件，也不知道其所描述的事件对应不同帧上的哪个区域。

为此，英特尔中国研究院率先提出了弱监督视频密集描述生成的方法，不需要训练数据对视频中的不同事件和对应区域进行分别标注，而仅仅使用标注员对视频的一句话描述，就可以自动产生多角度的视频描述，并且从中挑选出最具代表性的描述语句。这样，计算机就不用人“手把手教”，而是可以做到“举一反三”。

自主系统：创造机器人的“英雄”时代

自主系统是与人工智能相关的一个研究方向。英特尔中国研究院的目标是推出一套基于CPU+FPGA异构计算的自主智能机器人开发平台，帮助研究人员基于此平台进行开发。之所以引入异构平台，是因为机器人研究需要同时引入时间和空间计算模型。CPU作为时间计算模型的完美代表，指令按时间顺序一条一条执行，可以实现灵活多变的控制；加速器则更像一种空间计算模型，利用空间的并行从而一次性完成大量数据处理，使复杂的计算得到加速处理。

基于这一目标，HERO智能机器人开放平台（Heterogeneous Extensible Robot Open Platform）应运而生。它是英特尔中国研究院专为智能机器人（包括服务机器人、医疗机器人、自动驾驶汽车等）打造的一套低功耗、高性能、体积小的异构系统平台方案。在此方案中，CPU作为控制中心，与FPGA和其它专用加速器芯片（如Movidius的VPU）搭配，能够提供高效的性能。整套HERO硬件系统采用了英特尔酷睿™系列CPU，搭载英特尔Arria 10 GX系列1150型FPGA作为异构加速器，能够实时处理大量数据并运行多种智能算法。

在本次开放日活动上，英特尔中国研究院宣布围绕HERO平台推出全新的合作伙伴计划。围绕该项计划，英特尔中国研究院致力于携手业界的平台级、应用级和生态级合作伙伴，通过研发合作、学术创新和行业示范，共同打造一套完整、高效和开放的平台，不断扩展应用场景，加速技术和产品的落地。

智能基础设施：加速通信和计算的融合

该项研究主要面向保障未来大规模智能联网设备顺利工作的支撑技术，包括无线通信技术和智能存储技术。前者研究在网络接入端的MIMO技术和移动边缘计算技术；后者研究使用英特尔最新的3D存储技术和FPGA构建的智能化方案来提供高吞吐量、低延迟、有增值服务潜力的技术。

在本次开放日活动中，英特尔介绍了如何面向5G下一代通信网络，借助通信与计算的融合打造高质量的VR体验。当前，为了满足高质量虚拟现实体验的需求，当下的高清体验需要实现25-40倍的分辨率提升。为此，英特尔希望通过计算和网络的融合，以端到端方式实现网络扩容，从而打造远程沉浸式的互动体验。

英特尔演示了超高分辨率全景视频采集系统，它主要适用于无线VR设备，用户可以身临其境地观赏全景视频，或者参与VR游戏互动。它使用了ISP总线同步相机快门，通过分布式构架处理采样图像，同时利用光流法拼接全景视频，并插值立体信息。该系统同时采用英特尔核心GPU高性能压缩图像，通过无线传输将主机渲染输出到远程终端，并利用OFFLOAD技术降低显示延迟。有了这些技术，电视观众即使在家里也能感受到奥运会前排座席的观赛体验，或者选择场馆内不同的观赛角度。

此次活动展出了一系列最具前瞻性的研究项目和成果，充分彰显了英特尔在引领并定义未来科技之路的过程中砥砺前行的创新精神与实践成果。此次展出的关键技术，源于英特尔中国研究院目前的三大主攻方向，即人工智能算法、自主系统平台和智能基础设施。这些创新成果在充分诠释未来无限可能性的同时，又让大家领略到了科技性感和充满温度的一面。

机械手抓取操控系统

该平台包含了Eagle Shoal机械手、机械臂、以及感知硬件技术和软硬件集成的一整套方案，主要用于机器人抓取操控的相关研究。Eagle Shoal 机械手由英特尔中国研究院自主研发原型，包含8个主动自由度，16个力传感器，能够满足日常生活中遇到的大部分抓取需求，有效降低抓取操控研究领域所需的机械手硬件成本。

Eagle Shoal现在已是英特尔中国研究院的“小明星”。今年，它在湖南卫视的《我是未来》节目中，与皮影戏大师秦礼刚先生同台表演《武松打虎》，演绎科技使传统文化焕发新生。此外，它在今年的IROS机器人抓取与操作大赛中获得第三名，是参赛团队中唯一的灵巧手。

“机器人英雄荟”-——HERO平台

HERO平台，顾名思义，它打造了“机器人英雄荟”。它采用了英特尔®酷睿™系列CPU，并搭载英特尔®Arria® 10 GX系列FPGA作为异构加速器，“用武之地”非常广泛，尤其是在智能机器人方面。基于HERO平台，英特尔中国研究院开发了多种基于FPGA加速的机器人算法：

定位与导航：利用FPGA的超强计算力，即使采用低成本的激光雷达，也能为机器人提供稳定的定位与导航能力。

高精度运动规划：双臂机器人可以通过图形界面设置双臂的目标位置实现运动路径规划与执行。

雷达感知：通过雷达感知扩展机器人的视野，睿宝能够发现身后的人，也可以在光线暗淡或有遮挡的情况下感受到人。

自主避障：持续运动中的机器人凡遇到障碍即转向。

此外，该平台基于英特尔®SGX技术构建了机器人的物理和信息安全系统，针对攸关物理安全的算法模块和IO通道提供芯片级安全保障。

最“懂”你的AI机器人-——睿宝

想象有一天，你身边的机器人伙伴能够快速识别你的脸，能够清晰分辨出你的声音，还能聪明猜透你的心… 这一切要如何实现？

通过基于置信度的多模态融合技术, 配合摄像头和麦克风等多个传感器，英特尔中国研究院自主研发的睿宝机器人能够在线自主学习，采集和标注每个用户在不同时间、地点和场景下的数据。利用个性化知识图谱，通过多模态交互，睿宝还能构建针对每个用户的知识图谱，支持个性化交互。

这些技术都可以广泛应用于家用服务机器人、智能家居等需要与用户互动、提供个性化服务、情感陪伴等场景。

无线3D VR全景视频采集播放系统

无线3D VR视频和游戏系统包括超高分辨率全景视频采集合成和无线VR传输，在5G时代通信与计算融合的助力下，采用边缘计算加速端到端的海量数据的可靠传输，实现远程沉浸式互动，用户可以身临其境地观赏全景视频，或者参与移动端VR游戏互动。

它使用了ISP总线同步相机快门，通过分布式构架加速全景图像拼接和压缩，利用光流算法去除鬼影效应，并能在任意角度插值生成3D立体信息。该系统同时采用英特尔核心GPU处理和压缩图像，通过无线传输将主机渲染输出到远程移动VR终端，并利用无线OFFLOAD技术降低移动到显示延迟和抖动。

实时人像风格迁移

你相信吗？凭借一个摄像头，就能够实时在镜头中看到具备不同艺术风格的面部特效。基于业界顶尖的深度神经网络人像风格迁移系统，英特尔中国研究院将多种艺术人像风格实时迁移到静态的目标图像以及动态的目标视频中。不仅限于目前的成果，随后该技术还可以广泛普及在AR/VR、在线直播、影视、多媒体社交等更多领域。

实时3D面部表情捕捉与特效渲染

前不久，著名艺人、时尚偶像、唱作歌手李宇春推出她的首支人工智能MV——《今天雨，可是我们在一起》。这首MV成为了科技赋能音乐和娱乐的跨界创新范例，搭载的技术就是来自英特尔中国研究院的3D人脸面部表情捕捉技术。基于机器学习和深度学习算法，英特尔的研究员们从数十万人脸图片数据中，训练出多个人脸识别模型，用于对视频图像进行智能分析与3D建模，不仅可以检测与识别人脸，还能精准重建3D人脸，并实时跟踪面部表情变化，将预先设计好的特效素材附着在3D人脸上，叠加到视频中，从而实现逼真炫酷的脸部特效。