Gartner：2018人工智能技术成熟度曲线

会员服务 ·

Gartner：2018人工智能技术成熟度曲线

2018 年 8 月 17 日 物联网智库

来源：三思派

翻译：孟海华

物联网智库整理发布

转载请注明来源和出处

------ 【导读】 ------

人工智能被广为关注，但是一些想法恐难达到预期。本成熟度曲线将追踪AI基本趋势和未来创新，以确定人工智能技术发展的范围、状态、价值和风险。

从曲线上消失的技术

2018年，以下几个技术已经从曲线上消失：

➧ 1、虚拟客户助理

➧ 2、认知专家顾问

➧ 3、3级和4级自动驾驶

➧ 4、深层强化学习

➧ 5、智能应用程序

➧ 6、信息技术操作人工智能平台

2018曲线五个阶段的关键技术

（一）上升阶段

1.人工智能管理

用预测模型和算法，指导人工智能的应用和使用，优化决策权的分配，确保组织对风险的问责和投资决策过程的掌控。不论是何种人工智能，数据源要真实可信。为了避免片面的信息，要求汇聚新的、不同的，甚至是矛盾的数据与您已经使用的数据相结合，以尽量减少人工智能带来的偏见的风险。

2.通用人工智能

通用人工智能也被称为“强人工智能”。目前的人工智能看起来具有人类一样的学习、推理和适应能力，但它们缺乏常识、智能和广泛的自我维护和复制手段。在人工智能方面取得的实际进展仅限于弱人工智能。如今的人工智能技术无法被证明具有相当于人类智能的能力(对于证明此类智能的测试，缺乏共识本身就是一个问题)。在某种程度上，有可能制造出一台接近人类认知能力的机器，但我们很可能要等几十年才能完成必要的研究和工程。

前沿人工智能技术正在推动目前被认为是“惊人的创新”，包括深度学习工具和相关的自然语言处理能力，这些创新正在做我们以前认为技术做不到的事情。然而，它们通常只是刚刚从实验室出现的研究工具，而且随着时间的推移，我们对工程原理没有完全的理解，反而了解它们的局限性，针对性制定可行的研发指导策略。随着这种好奇心热度逐渐消退，人们会慢慢开始感到厌烦。

特殊用途的人工智能将对商业和个人生活产生巨大的破坏性影响。但是在技术出现重大突破之前，应该忽略任何供应商关于他们的产品具有通用人工智能这一说法，往往是程序员制造的幻觉。在未来10年内，通用人工智能不太可能出现。当它最终出现时，它很可能是许多特殊用途人工智能技术结合在一起的结果。

3.人工智能开发工具包

人工智能(AI)开发工具包是指抽象数据平台、框架和分析库的应用程序和软件开发工具包(SDK)，能够交付软件工程师启用的人工智能应用程序等。它们涵盖：云为基础的人工智能的服务；用于虚拟助理(例如苹果Siri、Amazon Alexa和Google助手)的工具包，设备开发工具包；以及AI服务SDK。软件工程师使用它们，并将AI集成到新的或现有的应用程序中。

在过去的18到24个月中，厂商一直在积极地提供面向开发人员的AI工具包和SDK。有代表性的产品包括：基于云的人工智能云服务平台(例如，Google Automl、AwsSagaker和Azure ML studio)，用于虚拟助手的工具包(例如，Amazon Alexa技能工具包、Apple Sirikit、百度Dueros开放平台、Google对话框流和Cortana设备Sdk)设备开发工具包(例如microsoft vision AI)、SDK(例如，苹果的coreml和Google ML工具包)。

在所有类别中，供应商提供的产品都需要不同的部署考虑，并具有不同的特性覆盖范围差异，但我们预计，与原生PaaS平台相比，基于云的AIaas平台将降低数据科学的复杂性，从而更有利于开发人员采用。但是在数据准备、特征甄别、模型选择和培训、超参数优化和模型部署阶段各供应商之间差异很大。

AI Developer工具包支持如图像识别(包括人脸和地标)、文本分析和图像标记。开发人员还可以在模型运行时部署自定义模型并可选择地更新云服务中的模型。设备开发工具包将定制硬件设备与API和SDK放在一起，以鼓励平台开发人员采用。随着平台支持被纳入更广泛的市场产品，直接平台供应商工具包产品将减少。

全球对人工智能的需求是巨大的，其增长速度远远超过了有经验的数据科学家单打独斗的速度。随着数据产品的不断成熟，通过轻量级运行框架的扩展，实现对以边缘或以设备为中心的AI模型的支持。软件工程师和数据科学家的努力提高了用户对更广泛的、基于供应商的云平台产品的吸引力和粘性，包括平台即服务(PaaS)。

4.知识图谱

知识图谱由信息知识编码为由节点和链接边组成的网络图中的数据，而不是由行和列组成的表。专业供应商正在向新市场提供基于图形的产品，知名供应商正在其平台和产品中提供这种技术。

使用自然语言处理(NLP)和相关的文本分析技术，知识图谱非常适合存储从非结构化资源分析中提取的数据。它们还能够存储结构化数据，包括隐式提供结构和内容的元数据，编码支持各种用例的处理的信息。

应用程序领导者应该使用知识图谱将不同的概念连接起来，用缺失的信息丰富他们的数据。通过图表分析，可以自动发现和利用数字资产、数据源、过程交互产生的动态关系等。

5.神经形态硬件

神经形态硬件包括从概念上受神经生物学体系结构启发的半导体器件。神经形态处理器采用非von-Neumann体系结构，并实现与传统处理器截然不同的执行模型。它们的特点是处理元素简单，但互连性很高。

神经形态系统处于非常早期的原型阶段。IBM已经向劳伦斯·利弗莫尔国家实验室提供了一个基于True North的系统。神经芯片的尖峰神经元自适应处理器技术和惠普企业的实验室产品是一些早期产品，英特尔的“Loihi”芯片凭借更高程度的连接性，解决了更广泛的人工智能工作负载。高通(Qualcomm)是神经形态处理器的早期代表。

神经形态硬件的部署主要障碍有：GPU比神经形态芯片更容易访问和编程；神经形态硬件编程需要新的工具和培训方法；互连的复杂性对半导体制造商创造可行的神经形态设备提出了挑战。目前，神经形态硬件还没有走上深度神经网络(DNNs)的主流道路，但随着编程技术的突破，这种情况可能会发生变化。

神经形态计算体系结构可以为深层神经网络提供极端的性能，因为它们的工作功率非常低，并且可能比今天部署的基于GPU的DNNs系统可以更快地进行训练。此外，神经形态体系结构还可以为图形分析提供支持。今天的大多数神经形态体系结构没有被主流采用。然而，这些体系结构在未来五年内将变得成熟，并将融合新的机会。

设备还可能在边缘执行较低级别的DNN，从而减少带宽和中央处理限制。我们正处于一个极其快速的演化周期中，这是由全新的硬件设计、实用的DNN算法和用于训练的系统的大数据支持。神经形态设备有可能将DNN的触角进一步推向网络的边缘。

6.人工智能（AI）相关咨询与系统服务

这是人工智能自动化服务的一个值得关注的方向，用于帮助客户构思用例、设计业务或优化IT流程、选择技术、管理数据、构建和培训模型、部署解决方案、评估和减轻风险以及调整人才组合以成功地形成智能解决方案，涉及一项或多项先进技术，如机器学习、深度学习和自然语言处理等。这种服务可以应用在预测，比如通过使用数据挖掘和模式识别的学习系统，提供洞察、检测异常、提供个性化、预测可能发生的事件；还可以应用在智能搜索，面向结构化和非结构化数据，在合同等文本中提取需要注意的相关关键条款，减少要读取的文本数量，并使员工能够将时间集中在相关条款上。

7.人环众包

人类基于算法的自动化来解决问题或执行任务，其实人类和智能之间是互补的，因为人类的数据输入方面改进了数据管理解决方案，从而进一步推进了人工智能。人环众包一是在规模上达到数据的基本要求；二是将群体贡献集聚为一个有意义的结果。谷歌、Facebook、亚马逊、微软、IBM、Ebay、百度和许多其他公司经常采用这一方法。在过去一年，采用已大大加快，主要是针对机器学习需求的数据标签和培训数据的质量。

尽管市场潜力很大，但人环众包还面临许多障碍，包括对其好处的认识不足，以及对质量、安全的担忧。随着整个人工智能市场的成熟，应用快速增长。在提高机器学习模型的准确性方面，人环众包是可行的(也可能是最可靠的)解决方案。从事人工智能和机器学习的公司应该使用人工循环众包作为人工智能解决方案的推动者。与内部或传统外包能力相比，这种方法产生了更多的流动成本和更广泛的问题解决、模型培训、分类和验证能力。

当机器学习算法达到其精度极限时，人类可以进一步提高输出(如内容调整、文本中的细节检测验证或信息检索和搜索结果的验证)。

人环众包是不可缺少的。这种方法将极大地有利于分析团队将人类智能应用于非结构化文本、图像、音频和视频数据，用于人工智能、机器学习和信息质量，以及那些正在寻找一次解决方案或稀有技能的人，例如数据科学。这些任务可以包括对算法、元数据提取、校对、图像识别、内容创建等方面的培训数据的调整、分类，数据收集、产品分类、精炼产品描述、文本翻译、创建房地产的照片和音频转录等。

8.自然语言生成

自然语言生成(NLG)自动生成对数据洞察力的自然语言描述。在分析语境中，叙事是动态变化的，用户与数据交互以解释关键发现或图表的含义。NLG将自然语言处理与机器学习和人工智能相结合，动态地识别数据（趋势、关系、相关性）中最相关的含义。

文本分析侧重于从文本数据中获得分析结论，而NLG则通过将分析输出与动态选择的描述相结合来合成文本内容。虽然NLG仍处于初步采用阶段，但它正在有效地减少重复分析的时间和成本，例如业务和监管报告、金融服务部门的收益报告、政府部门的福利报表和天气预报以及广告部门的个性化信息。

9.聊天机器人

聊天机器人是一种独立的会话接口，它使用应用程序、消息平台、社交网络或聊天解决方案进行会话。聊天机器人的复杂程度各不相同，从简单的、基于决策树的营销策略，到构建功能丰富的平台作为支撑。聊天机器人可以是基于文本的，也可以是基于语音的，也可以是两者的结合。

社交媒体、服务台、人力资源或商业领域的聊天机器人，如企业软件前端和自助服务，都在快速增长。尽管如此，绝大多数聊天机器人都是简单的，依赖于决策树中的脚本响应。与聊天机器人相关的是虚拟代理，它们的范围和复杂性更广，需要更多的基础设施和人员来维护，并且是为与其更长期的关系而设计的。单个交互之外的用户，将与数百个聊天机器人进行交互，但很少有虚拟代理。聊天机器人是人工智能的代表，它将影响到今天人类交流的所有领域。客户服务是一个典型的领域，聊天机器人已经在其中产生影响，并潜力巨大。

（二）顶部位置

10.人工智能平台即服务

云人工智能和机器学习平台服务统称为AI Platform as a Service(PaaS)，它们提供AI模型构建工具、API和相关中间件，使运行在预先构建的基础设施上的机器学习模型的构建、培训、部署和使用成为云服务。这些服务涵盖视觉、语音和任何类型的通用数据分类和预测模型。

随着领先的云服务提供商，包括亚马逊(Amazon)、谷歌(Google)、IBM和微软(Microsoft)，都在争取成为客户选择的平台。在过去几年里，利用云服务的人工智能应用在市场上继续获得数据科学家和开发人员的支持和接受。AI PaaS产品主要集中在机器学习、自然语言处理和计算机视觉这三个关键领域。

人工智能云方法正开始影响数据科学和机器学习平台市场，特别是随着组织试验和构建AI原型，具有AI优化芯片和大量专用的存储数据，使云成为组织构建和部署AI应用程序的理想环境，而不需要传统的现场采购的风险、成本和延迟。此外，云还提供了打包的API和工具，使开发人员更容易将AI功能集成到应用程序中。

AI PAAS产品集中于机器学习、自然语言处理和计算机视觉这三个关键的AI组合服务：一是机器学习(ML)，AI云服务提供商提供的打包ML服务统一了端到端ML工作流；二是自然语言处理(NLP)，使用经过预先训练的NLP系统为各种用例创建基于云的聊天机器人；三是计算机视觉（CV），能够应用面部检测、识别和分析来解锁新的基于图像的数据来源。上述与云服务的结合，将在短期内加速数字商业技术平台服务的扩展和衍生。

11.深度神经网络专用芯片

深度神经网络(DNN)专用芯片是一种特殊用途的处理器，它加速了系统的计算速度。深层神经网络(DNNs)是指检测和分类输入数据中的特征统计模型，如声音和图像，或者文本(如句子)。在DNN系统中有两个阶段：在训练阶段，DNN遍历大型数据集并将其提取为一个小的DNN参数集；在推断阶段，DNN使用此参数集对输入进行分类，例如图像、语音或文本。今天，绝大多数训练和推理任务使用GPU+DNN专用芯片，在加速神经网络时比CPU或GPU具有更高的性能和更低的功耗。

谷歌已经在规模上部署了DNN专用芯片，称为张量处理单元（TPU1，TPU2，TPU3），提供语音和图像识别等业务推断。TPU2和TPU3还加快了数据培训过程，这是以前委托给GPU的一项任务。其他专用芯片正在问世，Graphcore开发了一款自定义处理器，为基于DNN的应用程序提供了极高的性能。营销资料显示，与GPU相比，它们的性能提高了近一倍。英特尔还在根据2016年从Neurana系统获得新技术，开发一款名为“Lakecrest”的专用集成电路代码，名为“LakeCrest”。DNN 专用芯片在性能和能源消耗方面的好处是显著的，DNN专用芯片的广泛使用还需要神经网络体系结构的标准化和对不同DNN框架的支持。

12.智能机器人

智能机器人是在物理世界中自主工作的机电主体，在短时间内从人工指导的训练和演示中学习，或通过其在工作上的监督经验来学习解决问题。智能机器人可以用语音、语言与人类互动，由于先进的感官能力，甚至可能与人类一起工作。

与工业机器人相比，智能机器人迄今被采用的数量要少得多。在过去的12个月里，我们看到一些成熟的机器人供应商扩大了产品线，新公司进入了智能机器人市场(尤其是来自中国)。新技术提供者和新技术开放，进入壁垒略有下降。

过去几年，由于几家主要供应商的努力，智能机器人正在备受关注：亚马逊机器人部门(前称Kiva系统)在亚马逊仓库中部署了智能机器人。谷歌收购了多家机器人技术公司。2018年初，LG推出了一系列用于酒店、机场和超市的智能机器人，这是一系列用于商业用途的智能机器人。美国的多家酒店和新加坡的两家香格里拉酒店现在都使用智能机器人提供客房服务。

轻型制造、分销、零售、招待所和医疗保健设施的用户应将智能机器人视为其人力资源的替代品和补充，启动旨在评估产品能力和量化效益的试点项目。我们需要检查当前可部署智能机器人的业务和材料处理流程，同时考虑重新设计流程，为大规模部署提供3至5年的路线图。智能机器人将对各种以资产为中心、以产品为中心和以服务为中心的工业产生最初的业务影响。它们以更高的可靠性、更低的成本、更高的安全性和更高的生产率替代这些行业中的劳动者。典型和潜在的用例包括：医用材料处理、处方配药、病人保健、直接物料处理、库存补充、制成品搬运、产品采摘包装、电子商务订单履行、包裹递送、购物协助、客户关怀、保安。

13.会话用户界面

用户和机器的会话交互主要发生在用户的口语或书面自然语言中。通常是非正式的和双向的，这些交互从简单的话语到非常复杂的交互，以及随后的高度复杂的交互。作为设计模型，CUI依赖于通过应用程序及相关服务、会话平台来实现。

近几年来，CUI呈爆炸式增长，聊天机器人、消息平台和虚拟助理，尤其是Amazon Echo和Google Home等家用扬声器，都促成了会话用户界面的增长。

14.智能应用

智能应用是采用嵌入式或集成人工智能技术，以智能自动化和改进的决策支持取代人工活动。人工智能已经成为下一个主要战场，在未来几年里，每个应用程序和服务都将在一定程度上整合人工智能。企业应用供应商开始在他们的产品中嵌入人工智能技术，并引入人工智能平台功能，从ERP到CRM到HCM，再到劳动力生产率应用。AI具有组织变革的潜力，是数字业务的核心。后台企业应用程序是这种转换工作的一个重要组成部分，因为它们提供了数字基础，大多数努力都是在此基础上进行的。在许多熟悉的应用程序类别的背景下，AI将不引人注目地运行，同时产生全新的应用程序。

15.数字伦理

数字伦理包括进行电子互动的价值体系和道德原则，以及人、企业、政府和事物之间数据的使用和共享。数字伦理的范围很广，包括安全、网络犯罪、隐私、社会互动、治理、自由意志等经济社会的方方面面。由于最近媒体的负面宣传，公众讨论的上升，人们对数据隐私保护等法规意识的增强，数字伦理跃升到通胀预期的顶峰。当前的主题，如“人工智能”、“假新闻”和“数字社会”，都是引发人们对数字伦理讨论爆发的导火索。

16.图形分析

图形分析是一组分析技术，允许探索组织、人员和事务等感兴趣的实体之间的关系。图形分析由确定跨数据点之间的“连通性”的模型组成，以创建数据节点、集群及其分界点。节点被显式或隐式连接，指示影响级别、交互频率或概率。

图形分析技术正稳步攀升到通胀预期的顶峰，越来越多的人采用图表分析，主要是因为需要在大量的指数级异构数据中找到洞察力，以及对分析的需求。一旦开发和训练了高度复杂的模型，由于扩展的能力、计算能力，输出就更容易存储,采用了图形数据库，为图形的存储、操作和分析提供了一个理想的框架。

在许多图形数据库中存储和处理数据的独特方法，加上对与特定于图形的知识相关的新技能的需求，可能会限制使用的增长。例如，资源描述框架(RDF)、SPARQL协议和RDF查询语言(SPARQL)的知识和经验，以及新出现的语言(如apache tinkerop或最近开源的密码)。

数据和分析领导者应该评估将图形分析纳入他们的分析组合和策略的机会。这将使他们能够解决不太适合传统基于SQL的查询和可视化的高价值用例(例如计算和可视化最短路径，或者网络中两个节点或实体之间的关系和影响)。他们还应该考虑使用图表分析来增强模式分析,用户可以直接与图形元素交互以发现洞察力，并且分析结果和输出也可以被存储以在图形数据库中重复使用。

图分析构成理想分析框架的业务情况包括：路径优化、市场篮子分析、欺诈检测、社会网络分析、CRM优化、位置智能、供应链监控、负载均衡等特殊形式的劳动力分析，如企业社会图和数字工作场所图、最近、频度等。

在执法调查、流行病学、基因组研究、洗钱检测等方面，图形分析在评估风险以分析欺诈、路径优化、聚类、孤立点检测、马尔可夫链、离散事件模拟等方面都是非常有效的。用于揭露欺诈和腐败的引擎也可用于在组织内识别风险，并以积极主动的方式回答责任问题。最近的一个识别关系网的例子是国际调查记者联合会。相比之下，图分析是一种新的“透镜”，用于探索跨多结构数据的直接关系和间接关系。

图形分析处理是其他许多先进技术的核心技术，例如虚拟个人助理、智能顾问和其他智能机器。图形分析可以扩展数据发现功能在现代商业智能和分析平台中的潜在价值。一旦完成了图形处理，它就可以扩展数据发现功能在现代商业智能和分析平台中的潜在价值。可视化-使用大小、颜色、形状和方向-来表示关系和节点属性。

17.目标分析

目标分析指的是一组分析能力，这些分析能力指定了满足预先定义的目标的首选行动方针。最常见的说明性分析方法是优化方法(例如线性规划)，它是预测分析和规则、启发式和决策分析方法(如影响图)。规定性分析与描述性分析、诊断分析和预测分析不同，因为输出是一种推荐的(有时是自动化的)操作。

尽管优化和决策分析的概念已经存在了几十年，但随着人们对数据科学、更好的算法、基于成本效益的云计算能力和可用数据的更多认识和研究，更好的方法逐渐得以应用，常见案例如客户处理、贷款审批、索赔分类，以及许多优化的问题，如供应链或网络优化和调度。目标分析也可以是规划过程的业务差异因素，无论是财务规划、生产计划还是分销计划，辅助用户探索多种方案并比较推荐的行动方案。

18.深度神经网络(深度学习)

深神经网络是一种大规模的神经网络，通常有许多处理层，它们使计算机能够处理比以前复杂得多的数据，如视频、图像、语音和文本数据，从而支持人工智能的最新进展。互联网巨头在各自的业务范围内部署基于DNN的系统，例如亚马逊Alexa的语音到文本功能、Google的搜索能力、图像识别和自动驾驶汽车以及Facebook的脸识别技术。

建立和培训系统并不容易，甚至是很困难的。要取得持续的好结果，你就需要大量的标签数据、数据科学方面的专业知识和专用硬件。大多数企业都很难获得足够的标记数据来支持他们的创新。此外，数据科学专家是稀缺的，因为IT和互联网巨头积极高薪雇佣，一般企业很难获得这方面优秀的人才。另外，计算资源优化和升级换代，也需要大量的资本支出。

最广泛应用的是卷积神经网络(CNNs)和递归神经网络(RNNs), CNN用于图像分类和文本语音。有关DNNS的炒作程度与去年没有太大差别。这些技术可以帮助他们解决以前难以解决的分类问题，特别是与图像、视频和语音有关的问题。在图像、语音和面部分类系统以及培训和数据方面投入了大量资源。

DNNS对所有行业都具有变革和破坏的潜力，想利用DNNS首当其冲的挑战是确定要解决的业务问题，并确保有足够的专家和相当好的数据集。在检测欺诈、确定质量、预测需求和其他涉及序列的分类问题(例如，使用视频、音频或时间序列分析)方面，DNNS显示出比以往先进的算法更高的准确性。

19.支持VPA的无线扬声器

支持云的远场语音捕获设备，将用户连接到虚拟个人助理(VPA)服务，如Alexa、Google助理、Siri、Cortana、微信等。随着2017年启用屏幕的VPA扬声器的出现，多模式交互被引入VPA体验。尽管VPA提供的对话体验仍远不完美，但消费者对VPA音箱的采纳程度高于预期。

20.机器学习

机器学习是利用能够从数据中提取知识和模式的数学模型来解决业务问题。有三个主要的子学科与所提供的观察类型有关：有监督学习，其中观察包含输入/输出对(也称为“标记数据”)；无监督学习(省略标签)；强化学习(在某种情况下，评估情况有多好或有多坏)。

机器学习仍然是技术中最热门的概念之一，因为它对企业有着广泛的影响。机器学习持续大规模增长和采用的驱动因素是数据量的不断增长和传统工程方法无法处理的复杂性。

越来越多的组织正在探索用于机器学习的用例，许多组织已经处于试验学习的初始阶段。大多数组织仍然在尝试他们的机器学习方法，找到执行机器学习项目所需的相关角色和技能是像这样的组织所面临的挑战。数据的数量和来源增加，系统的复杂性也会增加，在这种情况下，传统的软件工程方法会产生较低的效果。在未来，许多行业的进步离不开机器学习。

机器学习算法的选择也受到算法是否能够解释的疑问。组建一个(虚拟)团队，对机器学习用例进行排序，并建立最佳评估模型，将最有价值的用例推进到生产。数据是机器学习的“燃料”。数据是各个组织独特的竞争优势，高质量数据是机器学习成功的关键。虽然基本的机器学习算法的选择是相当有限的，但是算法变化的数量和可用的数据源是巨大的。机器学习推动了大量业务和相关问题的改进和新解决方案的产生。

21.自然语言处理

自然语言处理(NLP)提供了人类和系统之间一种直接的交流形式，即NLP包括旨在解析、解释(有时甚至生成)人类语言的计算语言技术。NLP技术处理自然语言的语用(上下文)、语义(意义)、语法(语法)和词汇(词)方面。语音部分通常留给语音处理技术，这些技术本质上是信号处理系统。

随着功能的提高，以及基于会话代理和自动机器翻译的新用例等，企业NLP的使用也在增加。现有的基于语法和语义的方法越来越多地被深度神经网络(DNNs)方法所取代。

人类语言是复杂的，虽然NLP解决方案已经取得了进展，但仍有许多微妙和细微之处需要人工干预才能进行适当的解释。DNNs是实验性和脆弱的，理解推理上下文和综合能力，也不是完全令人满意的。许多NLP解决方案需要专家来确保语法和模型的持续准确性。

NLP为企业提供了改善运营和服务的重要机会。对于许多企业来说，NLP最强大和最直接的用例与改进的客户服务(影响成本、服务水平、客户满意和销售)和员工支持(包括使他们在工作中更聪明、更有效)有关。企业想加速其NLP实现，应开发新的功能模块来实现一些特定的技能。考虑到数据科学技术在NLP应用中的越来越多地使用，提高数据科学家人才的技能可能也是必要的。

最后，NLP解决方案提供基于知识的整合、内容映射、搜索增强和文本摘要的能力将有所不同。因此，企业研发者在做出重大决定之前，应该测试和验证这些解决方案的有效性。如果企业投资于专门的语法，则应该注意这些解决方案在供应商之间是兼容的。

22.机器人应用自动化软件

机器人应用自动化软件是用户界面识别技术和工作流执行技术的结合，它可以模拟人类使用屏幕和键盘来驱动应用程序和执行基于系统的工作，也是为了使应用程序自动化而设计的。

机器人应用自动化软件是一种“胶水”类型的技术，它允许您将系统粘合在一起。为了完成比自动化工作更复杂的活动，您需要能够读取手写或结构、非结构化数据或由聊天机器人或机器学习活动执行的处理活动。

23.虚拟助理

虚拟助理(VAS)帮助用户或企业完成一组以前只能由人类完成的任务。VAS使用人工智能和机器学习(如自然语言处理、预测模型、个性化服务)来帮助人们并自动完成任务。VAS倾听和观察行为，构建和维护数据模型，并预测和推荐操作。可以在多个用例中部署操作，包括虚拟个人助理、虚拟客户助理和虚拟员工助理。VAS应用领域越来越多地被会话接口所主导，如苹果的Siri、谷歌助理、微软的Cortana、IPsoft的Ameliia、Amazon的Alexa和IBM的沃森助手等。

24.认知计算

认知计算是一种技术，能够提高人类在广泛的认知任务中的性能。这些系统具有交互性、迭代性，能够回忆起以前的交互；它们也是上下文相关的，能够适应信息和目标的变化。我们认识到“认知计算”是当今市场上供应商过度使用的一个推广术语，我们不相信这些系统是真正的认知能力，他们只是模仿、扩展人类的认知能力而已。认知计算迅速攀升至膨胀预期的顶峰，这是因为在最新一代人工智能市场上，主要销售商普遍推广和炒作这一术语。

（三）下滑阶段

25.FPGA加速器

FPGA加速器是一种基于服务器的可重构计算加速器，通过使可编程硬件级应用处理加速，可以提供极高的性能。FPGA加速器具有大量的可编程逻辑块、可重构互连和存储子系统，可以配置这些子系统来加速特定的算法功能。FPGA处理器可以从主系统处理器中卸载任务。FPGA不是用常见的应用语言编程的，而是配置了一种与典型程序员不同的电路设计语言“VHDL”，“VHDL”是大多数软件工程师难以学习的语言，这使FPGA编程的难度加大。在数据中心，FPGA可以用于对大量数据应用一致处理操作，例如高频交易(HFT)等。微软正在利用FPGAs进行搜索分析，而Edico基因组公司基于FPGA的Dragen生物IT平台可以实现高性能的基因组测序工作流程。

FPGA通常使用硬件编程语言(如RTL和VHDL)进行配置，使用起来非常复杂，这阻碍了广泛的采用。然而，主要的FPGA供应商(英特尔和Xilinx)正致力于通过库和工具集来解决这一问题，从而使FPGA能够使用以软件为中心的编程模型进行配置。在新的框架(如OpenCL)的帮助下，采用FPGA也变得更容易了。OpenCL降低了使用FPGA所需的时间和技能。新兴的工作负载，如深度学习(推理)正在激发人们对FPGAs的兴趣。英特尔将FPGAs与主流服务器CPU集成在一起，以Amazon Web服务(AWS)的FPGA为代表的开发平台变得更容易访问，也推动了FPGAs被数据中心的采用。

今天，数据中心的FPGA最大的增长机会是应用在深度学习的推理部分。考虑到软件生态系统的进化性质，FPGA加速器可以在相当小的能量消耗轨迹中实现戏剧性的性能改进，确定使用FPGA可以产生有影响意义的应用程序，评估用于数据中心服务器部署(基于FPGA的PCIe外接程序)的硬件的可用性，或者使用与处理器集成FPGA的服务器。

利用基于云的FPGA服务加速开发。FPGA非常适合于人工智能工作负载，因为它们在低精度(8位和16位)处理能力方面非常出色。但是可编程性仍然是一项重大挑战，限制了FPGA的广泛应用。企业应该评估基于FPGA的解决方案，用于基因组测序、实时交易、视频处理和深度学习(推理)。领导者可以通过使用基于云的基础设施来提供FPGA。

26.计算机视觉

计算机视觉(Computer Vision，简称CV)是一种涉及到采集、处理和分析真实世界中的图像和视频，使机器能够从物理世界中提取有意义的上下文信息的过程，包括机器视觉、光学字符识别、图像识别、模式识别、人脸识别、边缘检测和运动检测等许多不同而重要的CV技术领域。

建立解决视觉问题的算法和模型已经存在了半个多世纪，深层次神经网络、大量数据的可用性和大规模并行处理器的出现为计算机视觉领域的发展注入了新的活力，支持有监督和无监督的学习、识别、分类、预测和操作。在30年前，对象分类是一项困难的手工任务。过去八年来，ImageNet挑战的结果最好地证明了这一领域目前的进展。误算率下降了30%。

计算机视觉的发展得益于：

(1)DNNS的技术成熟，和相关的人工智能技术的成熟；

(2)CVS广泛适用于机器人、自动车辆、无人驾驶飞机、增强现实和虚拟现实等众多领域；

(3)大多数企业在如何处理所收集的所有图像、视频数据以及如何自动处理这些图像数据方面面临挑战，人们积极克服这些困难和挑战；

(4)计算机视觉是物联网(物联网)的一个特殊的用例和自然扩展，它是扩展和扩展物联网(物联网)范围的外部传感器。

视觉是对其他传感器数据的极好补充，例如地理定位、惯性和音频。因此，它也增强了人类与数字和物理世界互动的能力。这激发了人们对这一学科的广泛兴趣，如自动车辆、机器人、无人驾驶飞机、增强混合和虚拟现实-安全、生物识别等等。

27.预测分析

预测分析是一种高级分析方法，它通过检验数据或内容来回答以下问题：“将发生什么？”或者更准确地说，“什么可能发生？”，作为人工智能的应用，预测分析多数采用回归分析、多元统计、模式匹配、预测建模等技术。

28.自动驾驶

自主或自动驾驶车辆可以在不受人为干预的情况下，利用激光雷达、相机、GPS和地图数据等多种车载传感和定位技术，结合基于人工智能的决策能力，对某一特定地点或某一特定地点进行导航和驾驶。目前，无人驾驶汽车正成为人们关注的焦点。

过去一年，出现了一些进入幻灭低谷的迹象。2018年初，发生了几起与自动车辆有关的事故，包括一个行人的死亡。一些机构之前宣称的无人驾驶里程碑在没有兑现承诺的情况下悄然而逝，实际上当初是不切实际和夸大其词。

人工智能(AI)是实现自动车辆的关键技术，自动车辆机器学习算法的发展也在加快。实现自动车辆的主要挑战仍然集中在降低技术和工业化成本上，但也越来越多地包括监管、法律和社会考虑，例如操作许可、责任、保险和人与人之间的相互作用的影响。

自主车辆技术不仅在智能移动和物流领域，而且在航运、采矿、农业、工业、安全和军事行动方面都具有破坏性潜力。传感、定位、成像、制导、测绘和通信技术的不断进步，再加上人工智能算法和高性能计算能力，使自动驾驶汽车更加接近现实。然而，2018年，复杂性和成本挑战仍然很大，这影响了可靠性和可负担性要求。

自动驾驶技术的采用仍将在三个不同阶段发展：辅助驾驶、半自主和完全无人驾驶车辆。每一阶段都需要越来越多的技术成熟度和可靠性，这些技术成熟度和可靠性依赖于企业的干预，汽车公司、服务提供商、政府和技术供应商（例如，软件、硬件、传感器、地图数据和网络提供商）应在联合研究和投资方面进行合作，以推进所需的技术，并就自动驾驶的立法框架开展工作。

此外，教育公众了解自动驾驶汽车的好处是至关重要的。自动驾驶汽车将对一些工作产生破坏性影响，如公共汽车、出租车和卡车司机。自动驾驶汽车进入移动计算系统，为消费和创建数字内容提供了理想的平台，包括基于位置的服务、以车辆为中心的信息和通信技术。自动驾驶汽车也是移动创新和新的运输服务的一部分，有可能破坏既定的商业模式。例如，自动驾驶汽车最终将带来新的产品，通过让无人驾驶汽车在需要时接送乘客，从而突出按需提供的服务。自动驾驶汽车将带来重大的社会效益，包括减少事故、受伤和死亡，以及改善交通管理，这可能会影响其他社会经济趋势。例如，如果人们可以在驾驶自动驾驶汽车时利用旅行时间工作或娱乐，住在市中心附近接近工作地点就不那么关键了，这可能会减缓城市化进程。

29.商用无人机

商用无人驾驶飞行器是指小型直升机、固定翼飞机、多旋翼机和混合飞机，在飞机上没有人类飞行员。它们要么由地面上的人类飞行员远程控制，要么装备用于自主导航。与军事同行不同，它们被用于商业目的。

2018年，商业无人机进入幻灭的低谷。在技术意义上，这种无人机是相对成熟的并且能够进行越来越复杂的任务。然而，它们的采用往往受到限制阻碍，特别是在无人驾驶飞机超视距、人员上方或在限制空域，例如靠近机场的情况下，这些都是在大多数国家受到严格管制的行动类型。此外，垂直专业化的端到端无人机解决方案(包括设备、支持软件和飞行操作)的高昂成本阻碍了终端用户的大规模使用。高德纳预计，商业无人机将在两年内接近萎缩极限，前提是监管条件和某些技术要素不按预期改善的话。特别是，自主飞行将对市场起到提振作用，但它们的启用既需要监管改革，也需要技术进步。总的来说，企业无人机计划应该有短期和长期目标。美国的低空授权和通知能力(LAANC)倡议加速在限制空域飞行的豁免批准，就是这样的例子之一。今天，领先用户包括航空摄影，测绘和测量，体积测量，和远程检查。采用者还应该考虑到如何以最好的方式利用捕获的数据。

最重要的是，商用无人机可以提高诸如测量员、检查员、司机和摄影师等角色的能力，这些人传统上是在可能不安全的情况下执行劳动密集型任务的。因此，无人机通过减少或重新部署人员数量来提高生产率，同时能够实时获取数据并提高雇员的安全。例如，商业无人机可以特别增加农业、建筑、应急服务、采掘业等行业的价值。在大多数垂直领域，商用无人机的价值在于减少运营开支和提高安全性，但在电影摄影等行业也有创收的机会。

30.增强现实

增强现实(AR)是以文本、图形、音频和其他虚拟增强的形式实时使用信息，与现实世界的对象集成在一起，并使用头挂式显示或投影图形覆盖来呈现。正是这种“真实世界”元素将AR与虚拟现实区分开来。AR旨在增强用户与环境的交互，而不是将它们与环境分离开来。

31.知识管理工具

使用知识管理(KM)工具创建、修改和访问IT知识库。KM工具通常链接到支持自助服务的门户，以便最终用户能够自己访问相关的知识资产。这些产品由他们联合、存储和访问有关IT和非IT服务的信息的能力来定义。KM工具可以作为独立的选项或更广泛的IT服务管理工具的集成组件。KM为许多IT组织在IT体系中优化、驱动效率和实现规模经济提供了未开发的强大潜力。

（四）爬坡阶段

32.虚拟现实

虚拟现实（VR）提供了一种计算机生成的3D环境，环绕用户并以自然方式响应个人的动作，通常通过沉浸式头盔显示器（HMDS）。手势识别或手持式控制器提供手和身体跟踪，触觉（或触敏）反馈可以被合并。基于房间的系统在大范围内移动时可以提供3D体验，或者可以与多个参与者一起使用。身临其境的虚拟现实应用比其他图形模拟更先进。

（五）进入佳境

33.GPU加速器

GPU是为图形和可视化工作而设计的高度并行浮点处理器。在过去的十年中，NVIDIA和其他企业一起努力为GPU增加了可编程能力，使应用程序能够访问深度的、快速的浮点资源。GPU还有非常高带宽的存储子系统。对于许多高度并行、重复、计算密集型的应用程序来说，这些功能提供了显著的性能改进。

GPU密集型应用，包括应用到分子动力学、计算流体力学、金融建模和地理空间技术。编程GPU可能是很有挑战性的，因为执行顺序和代码优化是至关重要的。我们预计Dnn技术将在来自大型云提供商的开放框架的支持下迅速成熟，这些框架包括TensorFlow、TORCH、Caffe、apache mxnet和microsoft认知工具。GPU加速计算可以为高性能计算(HPC)和DNN培训中高度并行的计算密集型工作提供极端性能。完成的速度很高。云GPU将图形计算处理从现场转移到云上。高性能计算和深度学习对于许多数字业务策略是必不可少的，由于工作量的快速增长，基于CPU的传统企业生态系统是不够的。利用成熟的GPU技术来选择HPC应用程序和深入学习基础设施。可编程性的挑战已经通过Cuda.I这样的架构支撑，在GPU中得到了很大程度的解决。

34.集成学习

集成学习技术是一种机器学习算法，其中建立了一组预测模型，并将其输出组合成整个群体的单一输出。这种方法在很大程度上借鉴了“群体智慧”原则，其中意见或模型输出的多样化是关键。集成技术的采用继续稳步增长。所有主要的数据科学供应商都提供这种技术作为其组合的一部分。集成学习已经成为数据科学家和公民数据科学家广泛使用的一种方法。

几乎所有的预测分析用例和机器学习任务都能从集成技术的应用中获益，应用技术的成功案例继续提高了集成学习提高预测精度的声誉，集成方法经常被应用于分析比赛，如KDD杯和Kaggle竞赛，并且表现得很好。

35.语音识别

语音识别技术是将人类语音转换为文本进行进一步的处理。过去三年里，语音识别的性能迅速提高。IBM、微软(Microsoft)、谷歌(Google)、亚马逊(Amazon)和百度(Baidu)等在2016-2017年间都表现出了快速的技术进步，声称自己的表现与人类的转录能力相当。

2018年，谷歌通过提供多种机器学习模型来适应不同的用例环境(例如电话、语音命令、视频)，并改进标点符号以提高转录的可读性，从而改进了云语音到文本API的性能。

伴随着算法的进步，语音到文本的应用受到硬件进步的推动，对话代理(如聊天机器人和虚拟助手)的采用，使得企业和消费者在智能手机、游戏机等虚拟个人助理扬声器上采用语音交互。语音对文本技术的应用也在不断增长，用于连接智能家居和汽车领域，以及在边缘设备上运行的嵌入式解决方案，而无需云支撑新的使用场景。