指导单位、专家顾问及编写人员
+
顾 问
潘云鹤 中国工程院院士
指导单位
工业和信息化部信息化和软件服务业司
指导委员会
谢少锋 工信部信软司司长
李冠宇 工信部信软司副司长
徐晓兰 中国电子学会副理事长兼秘书长
张宏图 中国电子学会总部党委书记兼副秘书长
商 超 工信部信软司软件处处长
傅永宝 工信部信软司软件处调研员
专家委员会(排名不分先后,按姓氏笔画排序)
王士进 科大讯飞研究院副院长
韦 青 微软中国公司首席技术官
宋 波 国安瑞(北京)科技有限公司总经理
刘志坚 京东金融总法律顾问
吴甘沙 驭势科技联合创始人兼CEO
季向阳 清华大学自动化系教授
陈丽娟 阿里巴巴人工智能实验室负责人
梁家恩 云知声信息技术有限公司董事长兼CTO
崔 岩 中德人工智能研究院院长
蔡雄山 腾讯研究院法律研究中心副主任
编写单位
中国电子学会
编写人员
李 颋 周岷峰 马 良 凌 霞
李 岩 张雅妮 许华磊 张 婵
张 力 陈濛萌 樊江洋 朱 毅
李俊平 阎德利 谢中业 陈 岩
编制概要
+
自1956年概念得以确立以来,人工智能发展至今已逾60年,随着所处信息环境和数据基础的深刻变革,开始迈进新一轮发展阶段,呈现出大数据、跨媒体、群体性、自主化、人机融合的发展新特征,从学术牵引式发展迅速转变为需求牵引式发展,相比历史上的任何时刻,都要更加接近于人类智能,既能为进一步掌握城市发展、生态保护、经济管理、金融风险等宏观系统提供指导,也能为设计制造、健康医疗、交通管理、能源节约等微观领域提供解决方案。我国正值工业化、城镇化、信息化、农业现代化的攻坚阶段,迫切需要加快推动人工智能在国民经济社会各行业、各领域的创新应用,促进产业提质增效,改善人民生活水平,切实解决经济运行的重大结构性失衡。针对于此,有必要研究编制新一代人工智能发展白皮书,明确人工智能在新时期、新形势下的技术框架、关键环节、应用前景,为推动人工智能关键技术进步和产业化应用推广提供措施建议,进一步推动我国智能相关的前沿新兴产业持续健康快速发展,有力支撑我国信息化和工业化深度融合迈上新台阶。
一是明确新一代人工智能的主要发展方向,系统归纳其主要驱动因素及最具典型意义的特征。
二是研究新一代人工智能的技术框架,梳理技术演进轨迹,提出基础性、通用性技术体系。
三是探索新一代人工智能的产业边界,划分产业类别和应用场景,研判相关的投融资特征及趋势。
四是提出促进新一代人工智能及相关技术及产业发展的可行性措施建议,为相关行业主管部门提供决策参考,为行业健康有序发展提供指导依据。
一是研究学习国内外相关战略政策文件,充分借鉴参考国内外主要研究动态和成果。主要包括:美国白宫发布的《为人工智能的未来做好准备》、《国家人工智能研究与发展战略规划》;英国下议院科学和技术委员会发布的《机器人和人工智能》、英国政府科学办公室发布的《人工智能对未来决策的机会和影响》,以及英国政府在2017年1月宣布的《现代工业战略》和3月公布的《数字战略》;日本政府制定的《人工智能产业化路线图》;我国出台的《国务院关于积极推进“互联网+”行动的指导意见》和《“十三五”国家战略性新兴产业发展规划》中关于人工智能的部分。同时,针对欧盟的“人脑项目”、德国的“智慧数据项目”、日本的“超智能社会”和“高级综合智能平台计划”进行了学习了解。
二是访谈国内知名专家学者,围绕新一代人工智能的内涵、外延及特征趋势展开充分研讨。新一代人工智能既有创新性又有继承性,与过往所谈论的人工智能既有联系又有区别,在研究内容上既要有突破又要有充分吸收和借鉴。通过与国内人工智能相关领域的知名院士、高校学者、行业专家的座谈交流,尤其是围绕中国工程院潘云鹤院士《人工智能迈向2.0》一文进行的深入学习研讨,为白皮书的编制奠定了系统的理论基础。
三是调研国内外知名人工智能企业,汇集整理和分析来自实践应用的典型案例。高度重视人工智能领域的具体产品、服务及解决方案提供方式,走进国内外一批在技术或产业方面具备领先水平和特色优势的人工智能企业展开深度调研,并邀请部分企业的技术或战略负责人共同参与了白皮书的编制工作。
1、研究主题充分考虑了与国家规划的互动和呼应
人工智能的概念从诞生之日开始计算,已经超过60年,并非横空出世的新兴事物。只不过受近年来算法模式持续优化、数据信息海量增长、运算力大幅提升的影响和带动,表现出了不同以往的发展水平和特征。本白皮书一开始研究主题名为“人工智能2.0”,目前已更改为“新一代人工智能”,是为了呼应院士研究文章、部委领导讲话,以及即将出台的国家级规划,重点针对人工智能的新趋势、新特征、新模式展开研究,并非是要提出一个全新的研究对象。
2、研究范围聚焦技术和产业发展
在人工智能领域,正孕育着堪与相对论、量子理论、计算机、互联网相提并论的重大创新、变革及突破。人工智能历史性地站在了时代的风口,将对人类经济社会发展带来智能化浪潮的颠覆性猛烈冲击。研究人工智能,就要研究其在人类生产生活中的详细地位和作用,涉及到方方面面,包括了道德、法律、伦理、文化等领域。本白皮书的编制,主要是为了给相关行业主管部门和企业提供决策参考依据,集中在技术和产业两大层面展开研究,暂未涉及其他方面。
3、研究内容仍有待进一步丰富完善
当前,各类研究咨询机构纷纷推出围绕人工智能主题的相关报告,各自观点既有一致性,也存在部分不同意见。本白皮书的主要观点和内容仅代表编制组在目前对人工智能的研判和思考,欢迎各方专家学者和企业代表提出宝贵意见,共同推动白皮书的及时更新和纠偏。同时,随着人工智能技术的进步、产业的发展、模式的变革,白皮书的内容将得到进一步丰富完善。
+
图1 人工智能发展历程示意图
资料来源:中国电子学会整理
1、第一次浪潮:人工智能诞生并快速发展,但技术瓶颈难以突破
符号主义盛行,人工智能快速发展。1956年到1974年是人工智能发展的第一个黄金时期。科学家将符号方法引入统计方法中进行语义处理,出现了基于知识的方法,人机交互开始成为可能。科学家发明了多种具有重大影响的算法,如深度学习模型的雏形贝尔曼公式。除在算法和方法论方面取得了新进展,科学家们还制作出具有初步智能的机器。如能证明应用题的机器STUDENT(1964),可以实现简单人机对话的机器ELIZA(1966)。人工智能发展速度迅猛,以至于研究者普遍认为人工智能代替人类只是时间问题。
模型存在局限,人工智能步入低谷。1974年到1980年。人工智能的瓶颈逐渐显现,逻辑证明器、感知器、增强学习只能完成指定的工作,对于超出范围的任务则无法应对,智能水平较为低级,局限性较为突出。造成这种局限的原因主要体现在两个方面:一是人工智能所基于的数学模型和数学手段被发现具有一定的缺陷;二是很多计算的复杂度呈指数级增长,依据现有算法无法完成计算任务。先天的缺陷是人工智能在早期发展过程中遇到的瓶颈,研发机构对人工智能的热情逐渐冷却,对人工智能的资助也相应被缩减或取消,人工智能第一次步入低谷。
2、第二次浪潮:模型突破带动初步产业化,但推广应用存在成本障
数学模型实现重大突破,专家系统得以应用。进入20世纪80年代,人工智能再次回到了公众的视野当中。人工智能相关的数学模型取得了一系列重大发明成果,其中包括著名的多层神经网络(1986)和BP反向传播算法(1986)等,这进一步催生了能与人类下象棋的高度智能机器(1989)。其它成果包括通过人工智能网络来实现能自动识别信封上邮政编码的机器,精度可达99%以上,已经超过普通人的水平。与此同时,卡耐基·梅隆大学为DEC公司制造出了专家系统(1980),这个专家系统可帮助DEC公司每年节约4000万美元左右的费用,特别是在决策方面能提供有价值的内容。受此鼓励,很多国家包括日本、美国都再次投入巨资开发所谓第5代计算机(1982),当时叫做人工智能计算机。
成本高且难维护,人工智能再次步入低谷。为推动人工智能的发展,研究者设计了LISP语言,并针对该语言研制了Lisp计算机。该机型指令执行效率比通用型计算机更高,但价格昂贵且难以维护,始终难以大范围推广普及。与此同时,在1987年到1993年间,苹果和IBM公司开始推广第一代台式机,随着性能不断提升和销售价格的不断降低,这些个人电脑逐渐在消费市场上占据了优势,越来越多的计算机走入个人家庭,价格昂贵的Lisp计算机由于古老陈旧且难以维护逐渐被市场淘汰,专家系统逐也渐淡出人们的视野,人工智能硬件市场出现明显萎缩。同时,政府经费开始下降,人工智能又一次步入低谷。
3、第三次浪潮:信息时代催生新一代人工智能,但未来发展存在诸多隐忧
新兴技术快速涌现,人工智能发展进入新阶段。随着互联网的普及、传感器的泛在、大数据的涌现、电子商务的发展、信息社区的兴起,数据和知识在人类社会、物理空间和信息空间之间交叉融合、相互作用,人工智能发展所处信息环境和数据基础发生了巨大而深刻的变化,这些变化构成了驱动人工智能走向新阶段的外在动力。与此同时,人工智能的目标和理念出现重要调整,科学基础和实现载体取得新的突破,类脑计算、深度学习、强化学习等一系列的技术萌芽也预示着内在动力的成长,人工智能的发展已经进入一个新的阶段。
人工智能水平快速提升,人类面临潜在隐患。得益于数据量的快速增长、计算能力的大幅提升以及机器学习算法的持续优化,新一代人工智能在某些给定任务中已经展现出达到或超越人类的工作能力,并逐渐从专用型智能向通用型智能过渡,有望发展为抽象型智能。随着应用范围的不断拓展,人工智能与人类生产生活联系的愈发紧密,一方面给人们带来诸多便利,另一方面也产生了一些潜在问题:一是加速机器换人,结构性失业可能更为严重;二是隐私保护成为难点,数据拥有权、隐私权、许可权等界定存在困难。
当前,随着移动互联网、大数据、云计算等新一代信息技术的加速迭代演进,人类社会与物理世界的二元结构正在进阶到人类社会、信息空间和物理世界的三元结构,人与人、机器与机器、人与机器的交流互动愈加频繁。人工智能发展所处的信息环境和数据基础发生了深刻变化,愈加海量化的数据,持续提升的运算力,不断优化的算法模型,结合多种场景的新应用已构成相对完整的闭环,成为推动新一代人工智能发展的四大要素。
图2 新一代人工智能主要驱动因素示意图
资料来源:中国电子学会整理
1、人机物互联互通成趋势,数据量呈现爆炸性增长
近年来,得益于互联网、社交媒体、移动设备和传感器的大量普及,全球产生并存储的数据量急剧增加,为通过深度学习的方法来训练人工智能提供了良好的土壤。目前,全球数据总量每年都以倍增的速度增长,预计到2020年将达到44万亿GB,中国产生的数据量将占全球数据总量的近20%。海量的数据将为人工智能算法模型提供源源不断的素材,人工智能正从监督式学习向无监督学习演进升级,从各行业、各领域的海量数据中积累经验、发现规律、持续提升。
2、数据处理技术加速演进,运算能力实现大幅提升
人工智能领域富集了海量数据,传统的数据处理技术难以满足高强度、高频次的处理需求。人工智能芯片的出现加速了深层神经网络的训练迭代速度,让大规模的数据处理效率显著提升,极大地促进了人工智能行业的发展。目前,出现了GPU、NPU、FPGA和各种各样的AI-PU专用芯片。相比传统的CPU只能同时做一两个加减法运算,NPU等专用芯片多采用“数据驱动并行计算”的架构,特别擅长处理视频、图像类的海量多媒体数据。在具有更高线性代数运算效率的同时,只产生比CPU更低的功耗。
3、深度学习研究成果卓著,带动算法模型持续优化
2006年,加拿大多伦多大学教授杰弗里·辛顿提出了深度学习的概念,极大地发展了人工神经网络算法,提高了机器自学习的能力,例如谷歌大脑团队在2012年通过使用深度学习技术,成功让电脑从视频中“认出”了猫。随着算法模型的重要性进一步凸显,全球科技巨头纷纷加大了这方面的布局力度和投入,通过成立实验室,开源算法框架,打造生态体系等方式推动算法模型的优化和创新。目前,深度学习等算法已经广泛应用在自然语言处理、语音处理以及计算机视觉等领域,并在某些特定领域取得了突破性进展,从有监督式学习演化为半监督式、无监督式学习。
4、资本与技术深度耦合,助推行业应用快速兴起
当前,在技术突破和应用需求的双重驱动下,人工智能技术已走出实验室,加速向产业各个领域渗透,产业化水平大幅提升。在此过程中,资本作为产业发展的加速器发挥了重要的作用,一方面,跨国科技巨头以资本为杠杆,展开投资并购活动,得以不断完善产业链布局,另一方面,各类资本对初创型企业的支持,使得优秀的技术型公司迅速脱颖而出。据美国技术研究公司Venture Scanner的调查报告显示,截至到2017年12月,全球范围内总计2075家与人工智能技术有关公司的融资总额达到65亿美元。同时,美国行业研究公司CB Insight公布了对美国人工智能初创企业的调查结果,这类企业的融资金额约是2012年的10倍。目前,人工智能已在智能机器人、无人机、金融、医疗、安防、驾驶、搜索、教育等领域得到了较为广泛的应用。
在数据、运算能力、算法模型、多元应用的共同驱动下,人工智能的定义正从用计算机模拟人类智能演进到协助引导提升人类智能,通过推动机器、人与网络相互连接融合,更为密切地融入人类生产生活,从辅助性设备和工具进化为协同互动的助手和伙伴。主要特征如下:
图3 新一代人工智能主要发展特征
资料来源:中国电子学会整理
1、大数据成为人工智能持续快速发展的基石
随着新一代信息技术的快速发展,计算能力、数据处理能力和处理速度实现了大幅提升,机器学习算法快速演进,大数据的价值得以展现。与早期基于推理的人工智能不同,新一代人工智能是由大数据驱动的,通过给定的学习框架,不断根据当前设置及环境信息修改、更新参数,具有高度的自主性。例如,在输入30万张人类对弈棋谱并经过3千万次的自我对弈后,人工智能AlphaGo具备了媲美顶尖棋手的棋力。随着智能终端和传感器的快速普及,海量数据快速累积,基于大数据的人工智能也因此获得了持续快速发展的动力来源。
2、文本、图像、语音等信息实现跨媒体交互
当前,计算机图像识别、语音识别和自然语言处理等技术在准确率及效率方面取得了明显进步,并成功应用在无人驾驶、智能搜索等垂直行业。与此同时,随着互联网、智能终端的不断发展,多媒体数据呈现爆炸式增长,并以网络为载体在用户之间实时、动态传播,文本、图像、语音、视频等信息突破了各自属性的局限,实现跨媒体交互,智能化搜索、个性化推荐的需求进一步释放。未来人工智能将逐步向人类智能靠近,模仿人类综合利用视觉、语言、听觉等感知信息,实现识别、推理、设计、创作、预测等功能。
3、基于网络的群体智能技术开始萌芽
随着互联网、云计算等新一代信息技术的快速应用及普及,大数据不断累积,深度学习及强化学习等算法不断优化,人工智能研究的焦点,已从单纯用计算机模拟人类智能,打造具有感知智能及认知智能的单个智能体,向打造多智能体协同的群体智能转变。群体智能充分体现了“通盘考虑、统筹优化”思想,具有去中心化、自愈性强和信息共享高效等优点,相关的群体智能技术已经开始萌芽并成为研究热点。例如,我国研究开发了固定翼无人机智能集群系统,并于2017年6月实现了119架无人机的集群飞行。
4、自主智能系统成为新兴发展方向
在长期以来的人工智能发展历程中,对仿生学的结合和关注始终是其研究的重要方向,如美国军方曾经研制的机器骡以及各国科研机构研制的一系列人形机器人等。但均受技术水平的制约和应用场景的局限,没有在大规模应用推广方面获得显著突破。当前,随着生产制造智能化改造升级的需求日益凸显,通过嵌入智能系统对现有的机械设备进行改造升级成为更加务实的选择,也是中国制造2025、德国工业4.0、美国工业互联网等国家战略的核心举措。在此引导下,自主智能系统正成为人工智能的重要发展及应用方向。例如,沈阳机床以i5智能机床为核心,打造了若干智能工厂,实现了“设备互联、数据互换、过程互动、产业互融”的智能制造模式。
5、人机协同正在催生新型混合智能形态
人类智能在感知、推理、归纳和学习等方面具有机器智能无法比拟的优势,机器智能则在搜索、计算、存储、优化等方面领先于人类智能,两种智能具有很强的互补性。人与计算机协同,互相取长补短将形成一种新的“1+1>2”的增强型智能,也就是混合智能,这种智能是一种双向闭环系统,既包含人,又包含机器组件。其中人可以接受机器的信息,机器也可以读取人的信号,两者相互作用,互相促进。在此背景下,人工智能的根本目标已经演进为提高人类智力活动能力,更智能地陪伴人类完成复杂多变的任务。
第二章 新一代人工智能技术框架
+
与早期人工智能相比,新一代人工智能正在全新信息环境、海量数据基础和持续演进、不断丰富的战略目标的引领下,依托于云计算、大数据两大基础平台和机器学习、模式识别和人机交互三大通用技术,以新型计算架构、通用人工智能和开源生态系统为主要导向,持续搭建和完善技术框架体系,不断逼近技术奇点,深刻变革人类生产生活。
GPU架构具备与深度学习相匹配的并行运算能力。GPU(图形处理器)最初是个人电脑、工作站、游戏机和一些移动设备上运行绘图运算工作的微处理器,可以快速处理图像上的每一个像素点,其海量数据并行运算的能力与深度学习需求非常符合。当前主流的CPU只有4核或者8核,可以模拟出12个处理线程来进行运算,但是普通级别的GPU就包含了成百上千个处理单元,高端的甚至更多,这对于多媒体计算中大量的重复处理过程有着天生的优势。吴恩达教授领导的谷歌大脑研究工作结果表明,12颗英伟达(Nvidia)公司的GPU可以提供相当于2000颗CPU的深度学习性能,为技术的发展带来了实质性飞跃,被广泛应用于全球各大主流深度学习开发机构与研究院所。
2、从单一算法驱动,转变为数据、运算力、算法复合驱动
缺少数据支撑与运算力保证的算法驱动模式难以持续发展。人工智能发展以实现计算智能为重要研究方向,充分利用现代高性能计算机的快速计算和记忆存储能力,设计出神经计算、模糊计算和进化计算等求解算法,解决优化筛选、单点搜索、逻辑推理等实际应用问题。尽管深度学习概念和浅层学习算法已经被提出多年,但是一直进展缓慢,究其原因是缺乏海量的数据积累和与之相匹配的高水平计算能力,无法对算法模型进行持续的改进与优化,只停留在理论研究阶段,距离实际应用存在不小的差距。
数据、运算力和算法复合驱动模式引发人工智能爆发式增长。与早期人工智能相比,新一代人工智能体现出数据、运算力和算法相互融合、优势互补的良好特点。数据方面,人类进入互联网时代后,数据技术高速发展,各类数据资源不断积累,为人工智能的训练学习过程奠定了良好的基础。运算力方面,摩尔定律仍在持续发挥效用,计算系统的硬件性能逐年提升,云计算、并行计算、网格计算等新型计算方式的出现拓展了现代计算机性能,获得更快的计算速度。算法方面,伴随着深度学习技术的不断成熟,运算模型日益优化,智能算法不断更新,提升了模型辨识解析的准确度。
3、从封闭的单机系统,转变为快捷灵活的开源框架
专家系统本地化特性限制了人工智能发展步伐。以往的人工智能专家系统是基于本地化专业知识进行设计开发,以知识库和推理机为中心而展开,推理机设计内容由不同的专家系统应用环境决定,单独设定模型函数与运算机制,一般不具备通用性。同时,知识库是开发者收集录入的专家分析模型与案例的资源集合,只能够在单机系统环境下使用且无法连接网络,升级更新较为不便。
开源框架推动构建人工智能行业解决方案。人工智能系统的开发工具日益成熟,通用性较强且各具特色的开源框架不断涌现,如谷歌的TensorFlow、Facebook的Torchnet、百度的PaddlePaddle等,其共同特点均是基于Linux生态系统,具备分布式深度学习数据库和商业级即插即用功能,能够在GPU上较好地继承Hadoop和Spark架构,广泛支持Python、Java、Scala、R等流行开发语言,与硬件结合生成各种应用场景下的人工智能系统与解决方案。
4、从学术研究探索导向,转变为快速迭代的实践应用导向
学术导向难以满足复杂数据信息背景下的创新需求。随着人工智能的不断发展,分化产生了不同的学术流派,以符号主义、联结主义、进化主义、贝叶斯学派、类推学派等为典型。不同学派按照各自对人工智能领域基本理论、研究方法和技术路线的理解,以学术研究为目的进行探索实践,一定程度上推动了人工智能理论与技术的发展。在如今数据环境改变和信息环境变化的背景下,现实世界结构趋向复杂,单纯依靠课题立项和学术研究无法持续推动人工智能满足当前现实世界的模拟与互动需求,快速变化的应用环境也容易导致理论研究与实际应用相脱节,影响人工智能技术对经济发展和社会进步的积极拉动作用。
快速迭代的实践应用导向加速形成技术发展正循环。目前,人工智能围绕医疗、金融、交通、教育、零售等数据较集中且质量较高的行业的实践需求,在算法模型、图像识别、自然语言处理等方面将持续出现迭代式的技术突破,在深度应用中支撑人工智能实现“数据-技术-产品-用户”的往复正循环,由学术驱动向应用拉动转化。在人工智能技术准备期,由于提供数据支撑较少,技术提升度慢,一旦进入应用期,大量的优质数据有助于分析技术弊端,通过对相关技术进行改进升级,提升了产品的应用水平,用户在得到更好的产品体验后,继续为应用平台创造了更大规模的后台数据,用来进行下一步的技术升级与产品改良,由此进入了大规模应用阶段。在技术快速迭代发展的过程中,数据累积和大规模应用起到了至关重要的作用,能够持续推动人工智能技术实现自我超越。
新一代人工智能技术体系由基础技术平台和通用技术体系构成,其中基础技术平台包括云计算平台与大数据平台,通用技术体系包括机器学习、模式识别与人机交互。在此技术体系的基础上,人工智能技术不断创新发展,应用场景和典型产品不断涌现。
1、云计算:基础的资源整合交互平台
云计算主要共性技术包括虚拟化技术、分布式技术、计算管理技术、云平台技术和云安全技术,具备实现资源快速部署和服务获取、进行动态可伸缩扩展及供给、面向海量信息快速有序化处理、可靠性高、容错能力强等特点,为人工智能的发展提供了资源整合交互的基础平台。尤其与大数据技术结合,为当前受到最多关注的深度学习技术搭建了强大的存储和运算体系架构,促进了神经网络模型训练优化过程,显著提高语音、图片、文本等辨识对象的识别率。
表1 云计算主要共性技术
资料来源:中国电子学会整理
2、大数据:提供丰富的分析、训练与应用资源
大数据主要共性技术包括采集与预处理、存储与管理、计算模式与系统、分析与挖掘、可视化计算及隐私及安全等,具备数据规模不断扩大、种类繁多、产生速度快、处理能力要求高、时效性强、可靠性要求严格、价值大但密度较低等特点,为人工智能提供丰富的数据积累和价值规律,引发分析需求。同时,从跟踪静态数据到结合动态数据,可以推动人工智能根据客观环境变化进行相应的改变和适应,持续提高算法的准确性与可靠性。
表2 大数据主要共性技术
资料来源:中国电子学会整理
3、机器学习:持续引导机器智能水平提升
机器学习指通过数据和算法在机器上训练模型,并利用模型进行分析决策与行为预测的过程。机器学习技术体系主要包括监督学习和无监督学习,目前广泛应用在专家系统、认知模拟、数据挖掘、图像识别、故障诊断、自然语言理解、机器人和博弈等领域。机器学习作为人工智能最为重要的通用技术,未来将持续引导机器获取新的知识与技能,重新组织整合已有知识结构,有效提升机器智能化水平,不断完善机器服务决策能力。
表3 机器学习主要共性技术
资料来源:中国电子学会整理
4、模式识别:从感知环境和行为到基于认知的决策
模式识别是对各类目标信息进行处理分析,进而完成描述、辨认、分类和解释的过程。模式识别技术体系包括决策理论、句法分析和统计模式等,目前广泛应用在语音识别、指纹识别、人脸识别、手势识别、文字识别、遥感和医学诊断等领域。随着理论基础和实际应用研究范围的不断扩大,模式识别技术将与人工神经网络相结合,由目前单纯的环境感知进化为认知决策,同时量子计算技术也将用于未来模式识别研究工作,助力模式识别技术突破与应用领域拓展。
表4 模式识别主要共性技术
资料来源:中国电子学会整理
5、人机交互:支撑实现人机物交叉融合与协同互动
人机交互技术赋予机器通过输出或显示设备对外提供有关信息的能力,同时可以让用户通过输入设备向机器传输反馈信息达到交互目的。人机交互技术体系包括交互设计、可用性分析评估、多通道交互、群件、移动计算等,目前广泛应用在地理空间跟踪、动作识别、触觉交互、眼动跟踪、脑电波识别等领域。随着交互方式的不断丰富以及物联网技术的快速发展,未来肢体识别和生物识别技术将逐渐取代现有的触控和密码系统,人机融合将向人机物交叉融合进化发展,带来信息技术领域的深刻变革。
表5 人机交互主要共性技术
资料来源:中国电子学会整理
1、发达国家基础平台布局完善,国内仍缺乏自主核心技术
国外企业技术领先且大量布局公有云业务领域,大数据业务经验成熟、分工明确且数据开放程度较高。云计算方面,国外云计算企业基础技术相对领先,服务器虚拟化、网络技术(SDN)、存储技术、分布式计算、OS、开发语言和平台等核心技术基本上都掌握在少数国外公司手中,凭借着强大的创新和资本转化能力,有能力支持技术不断推陈出新。同时,国外企业在细分领域都有所布局,形成了完善的产业链配合,提供各种解决方案的集成,可以满足多场景使用要求。大数据方面,国外公司在大数据技术各个领域方面分工明确,有的专注于数据挖掘,有的专注于数据清洗,也有的专注于数据存储与管理。同时,国外从事大数据技术研发的企业有很大一部分是由传统的数据公司转型而来,如IBM、甲骨文(Oracle)、易安信(EMC,2015年10月被戴尔公司收购)等,这类公司在大数据概念兴起之前就早已充分接触数据领域业务,在数据科学领域有较强的研发能力。国外数据保护制度相对完善,数据开放标准成熟,为大数据技术研发提供了良好的外部环境。
国内企业自主核心技术有待提高,数据开放程度偏低且缺乏必要的保护。云计算方面,国内虽然有阿里、华为、新华三、易华录等一批科技公司大力投入研发资源,但核心技术积累依然不足,难以主导产业链发展。大数据方面,国内企业仍处于“跟风”国外企业的发展阶段,在数据服务内核等方面缺乏积淀与经验,未能完全实现从IT领域向DT(数据技术)领域的转型。同时,国内数据应用环境相对封闭,政府公共数据开放程度较低,数据安全保护等级有待提高,数据安全风险评估制度与保障体系有待完善,对大数据技术的升级发展形成了一定的限制因素。
2、发达国家在机器学习和人机交互领域具备先发优势,国内企业存在技术差距与人才短板
国外机构发力机器学习主流开源框架,积极开发人机交互下一代新型技术。机器学习方面,目前较为流行的开源框架基本都为国外公司或机构所开发,例如TensorFlow、Torchnet、Caffe、DMTK、SystemML等,同时注重大数据、云计算等基础支撑信息技术对机器学习研究的促进作用,以及机器学习的应用实践,已进入研发稳定阶段。人机交互方面,国外技术企业基于触控技术、可穿戴设备、物联网和车联网的发展基础,正在积极开发性价比更高的下一代人机交互新型技术,以对现有产品进行升级并降低成本。
国内机器学习基础理论体系尚不成熟,缺乏人机交互专业领域人才培养环境。机器学习方面,尽管国内学者在数据挖掘层面取得了一定的研究成绩,但对于机器学习的底层技术、实现原理及应用方法缺乏足够的重视,导致关键技术环节缺失与重要领域边缘化,不利于在国际主流机器学习技术角逐中展开有效竞争。人机交互方面,研究者需要具备数学、计算机学和心理学等相关背景,复合型较强,相比于国外高校都设立单独的人机交互专业,国内高校开设的专业相对传统,缺乏交叉复合型人才的培养机制,亟需建立人机交互领域技术人才培养的良好环境。
3、国内外模式识别研究水平基本处于同一起跑线,重点聚焦于语音识别与图像识别
国内外研究领域基本一致,围绕前沿技术领域开展持续创新。目前,国内外企业均在围绕模式识别领域的基础理论、图像处理、计算机视觉以及语音信息处理展开集中研究,探索模式识别机理以及有效计算方法,为解决应用实践问题提供关键技术。国外科技公司在模式识别各领域拥有多年的技术积累,深入语音合成、生物认证分析、计算机视觉等前沿技术领域,具备原创性技术突破能力;国内企业在模式识别前沿技术研发方面与国外同行处于并跑状态,除百度、讯飞等行业龙头外,众多初创公司也加入了模式识别研究的技术与应用创新,催生了一批有创意的新型产品。
语音识别和图像识别准确率明显提升,国内企业中文语音识别技术相对领先。国内外企业均致力于提高语音识别和图像识别准确率,谷歌和微软分别表示旗下的语音识别产品技术出错率已降至8%和6.3%,微软研究院开发的图像识别系统在世界著名的图片识别竞赛ImageNet中获得多个类别评比的第一名,为下一步的商业化应用奠定了良好基础。同时,国内企业重点突破中文语音识别技术,搜狗、百度和科大讯飞三家公司各自宣布旗下的中文语音产品识别准确率达到了97%,处于业内领先水平。
第三章 新一代人工智能的产业化应用
+
一般认为,人工智能是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的科学。迄今为止,出现了机器定理证明、机器翻译、专家系统、机器学习、机器人与智能控制等一系列研究成果。随着人工智能理论和技术的日益成熟,应用范围不断扩大,既包括城市发展、生态保护、经济管理、金融风险等宏观层面,也包括工业生产、医疗卫生、交通出行、能源利用等具体领域。专门从事人工智能产品研发、生产及服务的企业迅速成长,真正意义上的人工智能产业正在逐步形成、不断丰富,相应的商业模式也在持续演进和多元化。
目前,对人工智能的认识相对较为统一,但人工智能产业的概念有待进一步明确,对人工智能的核心产业和人工智能带动的相关产业也需要进行有效区分。我们认为,可以将围绕人工智能技术及衍生出的主要应用形成的具有一定需求规模、商业模式较为清晰可行的行业集合,视为人工智能在当前的核心产业,也即本报告所关注的主体。随着潜在需求的逐渐明确和商业模式的日渐成熟,人工智能核心产业的边界与范围将逐步扩展。而通过人工智能核心产业发展所形成的辐射和扩散效应,获得新提升、新增长的国民经济其它行业集合,均可视为人工智能带动的相关产业。
通过梳理从研发到应用所涉及的产业链各个环节,我们进一步将新一代人工智能在当前的核心产业分为基础层、技术层和应用层,结合目前常见应用场景,依据产业链上下游关系,再将其主要划分为既相对独立又相互依存的若干种产品及服务,如下图所示。
图4 新一代人工智能当前核心产业链
资料来源:中国电子学会整理
2017年,全球人工智能核心产业规模已超过370亿美元。其中,我国人工智能核心产业规模已达到56亿美元左右。在下一阶段,得益于技术持续进步和商业模式不断完善,全球人工智能市场需求将进一步快速释放,带动2020年全球人工智能核心产业规模超过1300亿美元,年均增速达到60%;其中,我国人工智能核心产业规模将超过220亿美元,年均增速接近65%。
图5 全球人工智能核心产业规模及年增长率
资料来源:中国电子学会整理
图6 我国人工智能核心产业规模及年增长率
资料来源:中国电子学会整理
基础层主要包括智能传感器、智能芯片、算法模型,其中,智能传感器和智能芯片属于基础硬件,算法模型属于核心软件。随着应用场景的快速铺开,既有的人工智能产业在规模和技术水平方面均与持续增长的市场需求尚有差距,倒逼相关企业及科研院所进一步加强对智能传感器、智能芯片及算法模型的研发及产业化力度。预计到2020年,全球智能传感器、智能芯片、算法模型的产业规模将突破270亿美元,我国智能传感器、智能芯片、算法模型的产业规模将突破44亿美元。
图7 2020年全球及我国人工智能基础层各产业规模占比
资料来源:中国电子学会整理
1、智能传感器:智能转型引领行业发展
智能传感器属于人工智能的神经末梢,是实现人工智能的核心组件,是用于全面感知外界环境的最核心元件,各类传感器的大规模部署和应用是实现人工智能不可或缺的基本条件。随着传统产业智能化改造的逐步推进,以及相关新型智能应用和解决方案的兴起,对智能传感器的需求将进一步提升,预计到2020年全球智能传感器的产业规模将超过54亿美元,其中我国智能传感器的产业规模为11亿美元。
核心技术。智能传感器本质上是利用微处理器实现智能处理功能的传感器,必须能够自主接收、分辨外界信号和指令,并能通过模糊逻辑运算、主动鉴别环境,自动调整和补偿适应环境,以便于大幅减轻数据传输频率和强度,显著提高数据采集效率。目前,智能传感器集成化、小型化的特点愈发突出,更多的功能被集成在一起,控制单元所需的外围接插件和分立元件越来越少,促使其通用性更强,应用范围更宽广,制造成本也进一步下降。同时,原子材料、纳米材料等新材料技术也在智能传感器领域得到日益广泛的应用,使其表现出更为灵敏的物理性能。
主要产品。智能传感器已广泛应用于智能机器人、智能制造系统、智能安防、智能人居、智能医疗等各个领域。例如,在智能机器人领域,智能传感器使机器人具有了视觉、听觉和触觉,可感周边环境,完成各种动作,并与人发生互动,包括触觉传感器、视觉传感器、超声波传感器等。在智能制造系统领域,利用智能传感器可直接测量与产品质量有关的温度、压力、流量等指标,利用深度学习等模型进行计算,推断出产品的质量,包括液位、能耗、速度等传感器。在安防、人居、医疗等与人类生活密切相关的领域,智能传感器也广泛搭载于各类智能终端,包括光线传感器、距离传感器、重力传感器、陀螺仪、心律传感器等。
典型企业。智能传感器市场主要由国外厂商占据,集中度相对较高。由于技术基础深厚,国外厂商通常多点布局,产品种类也较为丰富,较为典型的有霍尼韦尔、美国压电、意法半导体、飞思卡尔。如霍尼韦尔生产的产品包括了压力传感器、温度传感器、湿度传感器等多个产品类型,涉及航空航天、交通运输、医疗等多个领域。美国压电生产的产品涵盖了加速度传感器、压力传感器、扭矩传感器等,并涉及核工业、石化、水力、电力、和车辆等多个不同领域。相比之下,我国厂商经营内容仍较为单一,如高德红外主要生产红外热成像仪,华润半导体主要生产光敏半导体,但其中也出现了华工科技、中航电测等少数企业试水扩大布局范围。人工智能根据客观环境变化进行相应的改变和适应,持续提高算法的准确性与可靠性。
表6 主要智能传感器及生产企业
资料来源:中国电子学会整理
2、智能芯片:初创企业蓄势待发
智能芯片是人工智能的核心,与传统芯片最大的差别在于架构不同,传统的计算机芯片均属于冯·诺依曼体系,智能芯片则仿照大脑的结构设计,试图突破冯·诺依曼体系中必须通过总线交换信息的瓶颈。当前各大科技巨头正积极布局人工智能芯片领域,初创企业纷纷入局,随着市场将进一步打开,预计到2020年全球智能芯片的产业规模将接近135亿美元,其中我国智能芯片的产业规模近25亿美元。
核心技术。深度学习已成为当前主流的人工智能算法,这对于处理器芯片的运算能力和功耗提出了更高要求,目前软件企业采取的主流方案是通过应用GPU和FPGA提高运算效率,与CPU少量的逻辑运算单元相比,GPU就是一个庞大的计算矩阵,具有数以千计的计算核心,可实现10-100倍应用吞吐量,而且支持对深度学习至关重要的并行计算能力,可以比传统处理器更加快速,大大加快了训练过程。同时,一些针对深度学习算法而专门优化和设计的芯片也已经面市,由于是量身定制,运行更为高效。
主要产品。数据和运算是深度学习的基础,可以用于通用基础计算且运算速率更快的GPU迅速成为人工智能计算的主流芯片。2015年以来,英伟达公司的GPU得到广泛应用,并行计算变得更快、更便宜、更有效,最终导致人工智能大爆发。同时,与人工智能更匹配的智能芯片体系架构的研发成为人工智能领域的新风口,已有一些公司针对人工智能推出了专用的人工智能芯片。如IBM的类脑芯片TureNorth及神经突触计算机芯片SyNAPSE、高通的认知计算平台Zeroth、英特尔收购的Nervana、浙江大学与杭州电子科技大学的学者合作研制的类脑芯片“达尔文”,中国科学院计算技术研究所的寒武纪芯片。
典型企业。作为核心和底层基础,智能芯片已经成为各大公司布局的重点领域。目前传统芯片巨头如英特尔、英伟达,大型互联网公司如谷歌、微软已经在该领域发力,这些公司资金实力雄厚,除了自行研发外,通常也采用收购的方式快速建立竞争优势。例如,谷歌继2016年发布第一代TPU 后,于今年谷歌I/O大会上推出了第二代深度学习芯片TPU,英特尔则以167亿美元收购FPGA生产商Altera公司。由于智能芯片刚刚兴起,技术、标准都处于探索阶段,我国芯片厂商换道超车的机会窗口闪现,涌现出了一批优秀的创业型公司,如寒武纪、深鉴科技等。
表7 主要智能芯片及生产企业
资料来源:中国电子学会整理
3、算法模型:通过开源构建生态已是大势所趋
人工智能的算法是让机器自我学习的算法,通常可以分为监督学习和无监督学习。随着行业需求进一步具化,及对分析要求进一步的提升,围绕算法模型的研发及优化活动将越发频繁。当前,算法模型产业已初具规模,预计到2020年全球算法模型产业规模将达到82亿美元,我国算法模型产业规模将突破8亿美元。
核心技术。算法创新是推动本轮人工智能大发展的重要驱动力,深度学习、强化学习等技术的出现使得机器智能的水平大为提升。全球科技巨头纷纷以深度学习为核心在算法领域展开布局,谷歌、微软、IBM、Facebook、百度等相继在图片识别、机器翻译、语音识别、决策助手、生物特征识别等领域实现了创新突破。
主要产品。目前,随着大数据环境的日渐形成,全球算法模型持续取得应用进展,深度学习算法成为推动人工智能发展的焦点,各大公司纷纷推出自己的深度学习框架,如谷歌的TensorFlow,IBM的System ML,Facebook的Torchnet,百度公司的PaddlePaddle。更为重要的是,开源已成为这一领域不可逆的趋势,这些科技巨头正着手推动相关算法的开源化,发起算法生态系统的竞争。与此同时,服务化也是算法领域未来发展的重要方向,一些在算法提供商正将算法包装为服务,针对客户的具体需求提供整体解决方案。
典型企业。目前,在算法模型领域具备优势的企业基本均为知名的科技巨头,正在通过构建联盟关系,扩展战略定位等方式布局人工智能产业。2016年9月,Facebook、亚马逊、谷歌Alphabet、IBM和微软自发聚集在一起,宣布缔结新的人工智能伙伴关系,10月,谷歌公司更是调整战略方向从移动优先转变为人工智能优先。我国科技企业也纷纷落子人工智能,2017年3月,阿里巴巴正式推出“NASA”计划,腾讯成立人工智能实验室,5月,百度公司将战略定位从互联网公司变更为人工智能公司,发展人工智能已经成为科技界的共识。
表8 主要算法模型及相关机构
资料来源:中国电子学会整理
技术层主要包括语音识别、图像视频识别、文本识别等产业,其中语音识别已经延展到了语义识别层面,图像视频识别包括了人脸识别、手势识别、指纹识别等领域,文本识别主要是针对印刷、手写及图像拍摄等各种字符进行辨识。随着全球人工智能基础技术的持续发展与应用领域的不断丰富,人工智能技术层各产业未来将保持快速增长态势。预计到2020年,全球语音识别、图像视频识别、文本识别等人工智能技术层产业规模将达到342亿美元,我国人工智能技术层产业规模将突破66亿美元。
图8 2020年全球及我国人工智能技术层各产业规模占比
资料来源:中国电子学会整理
1、语音识别:正在步入应用拉动的快速增长阶段
语音识别(Speech Recognition,SR)技术是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用及产品。在大数据、移动互联网、云计算以及其他技术的推动下,全球的语音识别产业已经步入应用快速增长期,未来将代入更多实际场景,预计到2020年全球语音识别产业规模将达到236亿美元,国内语音识别产业规模达到44.2亿美元。
核心技术。语音识别的主要目的是让智能设备能够具有和人类一样的听识能力,同时将人类语言所表述的自然语义自动转换为计算机能理解和操作的结构化语义,完成实时的人机交互功能。近年来,语音唤醒技术、声学前端处理技术、声纹识别技术、语义理解技术、对话管理技术等语音识别领域核心技术的蓬勃发展,有助于构建智能语音交互界面系统,提高语音识别的准确率与响应速度,满足垂直领域对自然语义识别和声音指令的应用需求,为用户提供自然、友好和便捷的人机交互体验。
主要产品。伴随着移动互联网技术的发展与智能硬件设备的普及,人类已经不再满足于键盘输入和手写输入等传统人机交互方式,语音识别技术在电子信息、互联网、医疗、教育、办公等各个领域均得到了广泛应用,形成了智能语音输入系统、智能语音助手、智能音箱、车载语音系统、智能语音辅助医疗系统、智能口语评测系统、智能会议系统等产品,可以通过用户的语音指令和谈话内容实现陪伴聊天、文字录入、事务安排、信息查询、身份识别、设备控制、路径导航、会议记录等功能,优化了复杂的工作流程,提供了全新的用户应用体验。
典型企业。语音识别领域具有较高的行业技术壁垒,在全球范围内,只有少数的企业具有竞争实力。目前,Nuance、苹果、三星、微软、谷歌、科大讯飞、云知声、百度、阿里、凌声芯、思必驰等知名企业均重点攻克语音识别技术,推出大量相关产品。Nuance曾经是全球最大的语音识别技术提供商,侧重于为服务提供商提供底层技术解决方案,随着企业战略目标以及商业环境的改变,目前转型为客户端解决方案提供商;苹果公司以Siri语音助手为平台关联iOS系统相关应用与服务,倾向于改善用户的智能手机使用体验和创新商业模式;微软致力于提高语音识别技术的准确率,英语的语音识别转录词错率仅5.9%,达到了专业速录员水平,并将相关技术应用于自身产品“小冰”和“小娜”之中;科大讯飞作为国内智能语音和人工智能产业的领导者,中文语音识别技术已处于世界领先地位,并逐渐建立中文智能语音产业生态;云知声重点构建集机器学习平台、语音认知计算和大数据交互接口三位一体的智能平台,垂直应用领域集中于智能家居和车载系统;阿里人工智能实验室借助“天猫精灵”智能音箱构建基于语音识别的智能人机交互系统,并通过有效接入第三方应用实现生活娱乐功能的进一步拓展。
图9 语音识别主要产品及典型企业
资料来源:中国电子学会整理
2、图像视频识别:在安防监控市场具有巨大增长潜力
图像识别(Image Recognition,IR)技术是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式状态下的目标和对象,包括人脸、手势、指纹等生物特征。视频从工程技术角度可以理解成静态图像的集合,所以视频识别与图像识别的定义和基本原理一致,在识别量和计算量上明显提高。随着人类社会环境感知要求的不断提升和社会安全问题的日益复杂,人脸识别和视频监控作用更加突出,图像视频识别产业未来将迎来爆发式增长,预计到2020年全球图像视频识别产业规模将达到82亿美元,国内图像视频识别产业规模达到15.2亿美元。
核心技术。图像视频识别是通过计算机模拟人类器官和大脑感知辨别外界画面刺激的过程,既要有进入感官的信息,也要有记忆中存储的信息,对存储的信息和接受的信息进行比较加工,完成图像视频的辨识过程。围绕以上特定需求,图像预处理技术、特征提取分类技术、图像匹配算法、相似性对比技术、深度学习技术等构成了图像视频识别的核心技术体系框架,能够对通过计算机输入和照相机及摄像头获取的图片视频进行变换、压缩、增强复原、分割描述等操作,显著提高图像视频识别质量和清晰度,有助于快速准确完成图像视频的响应分析流程。
主要产品。随着工业生产及生活消费领域影像设备的日益普及,每天都会产生海量蕴含丰富价值和信息的图片及视频,单靠人力无法进行分拣处理,需要借助图像视频识别功能进行集中快速获取与解析。目前,智能图片搜索、人脸识别、指纹识别、扫码支付、视觉工业机器人、辅助驾驶等图像视频识别产品正在深刻改变着传统行业,针对种类繁杂、形态多样的图形数据和应用场景,基于系统集成硬件架构和底层算法软件平台定制综合解决方案,面向需求生成图像视频的模型建立与行为识别流程,为用户提供丰富的场景分析功能与环境感知交互体验。
典型企业。近年来,国内外从事图像视频识别的公司显著增加,谷歌、Facebook、微软、旷视科技、图普科技、格灵深瞳等国内外知名企业重点集中在人脸识别、智能安防和智能驾驶等领域进行技术研发与产品设计。国外公司大多进行底层技术研发,同时偏重于整体解决方案的提出,积极建立开源代码生态体系,如谷歌推出Google Lens应用实时识别手机拍摄的物品并提供与之相关的内容,Facebook开源三款智能图片识别软件,鼓励研发者们围绕其图像视频识别技术框架开发各类功能丰富的应用产品;国内企业直接对接细分领域,商业化发展道路较为明确,如旷视科技目前重点研发人脸检测识别技术产品,加强管控卡口综合安检、重点场所管控、小区管控、智慧营区等领域的业务布局,图普科技在阿里云市场提供色情图像和暴恐图像识别的产品和服务,确定准确率超过99.5%,满足了云端用户的安全需求。
表10 图像视频识别主要产品及典型企业
资料来源:中国电子学会整理
3、文本识别:全面进入云端互联时代
文本识别(Text Recognition,TR)技术是指利用计算机自动识别字符,包括文字信息的采集、信息的分析与处理、信息的分类判别等内容。文本识别可以有效提高如征信、文献检索、证件识别等业务的自动化程度,简化工作流程,提高相关行业效率。随着政府、金融、教育、科技等领域需求的进一步上升,文本识别将在工业自动化流程与个人消费领域取得长足发展,预计到2020年全球文本识别产业规模将达到24亿美元,国内文本识别产业规模达到6.6亿美元。
核心技术。文本识别技术目前正由嵌入式设备本地化处理向云端在线处理全面演进发展,过去由鼠标与键盘输入的文本信息,现在则主要由摄像头、麦克风和触摸屏采集获取。在此基础上,以往的文本识别核心技术,如模版匹配技术、字符分割技术、光学字符识别技术(Optical Character Recognition,OCR)、逻辑句法判断技术等需要与应用程序编程接口(API)技术、智能终端算法技术、云计算技术等结合,衍生出面向云端与移动互联网的新型文本识别系统,通过开放的平台与服务为广大的企业及个人用户提供方便快捷的服务。
主要产品。当今信息社会背景下,文本信息不仅体量巨大,表现形式也日趋复杂,包括印刷体、手写体以及通过外接设备输入到计算机系统的字符图形。同时,随着世界不同语言文明地区交流逐渐增多,对实时语言文本翻译系统的需求更加强烈。目前,基于文本识别技术开发的文件扫描、名片识别、身份证信息提取、文本翻译、在线阅卷、公式识别等产品正在金融、安防、教育、外交等领域得到广泛应用,通过不同的授权级别,为企业级用户部署专业的文档管理、移动办公与信息录入基础设施,同时为个人用户提供个性化的人脉建立、信息咨询和远程教育服务。
典型企业。随着文本识别在各类垂直应用领域的应用逐渐普及,国内外企业也结合自身业务和区域发展特色积极展开布局。谷歌、微软、亚马逊等跨国科技巨头在自身产品服务中内嵌文本识别技术,以增强产品使用体验和用户粘度,如谷歌推出的在线翻译系统可提供80种语言之间的即时翻译,并将自身的语音识别技术与文本识别相结合,提高了翻译效率。国内公司在中文文本识别领域也有多年积累,具备良好的技术优势与产业背景,汉王科技、百度、腾讯等均有较为成熟的产品推出,如汉王正在构建以识别云和设备云为核心的文本识别2.0系统。
表11 文本识别主要产品及典型企业
资料来源:中国电子学会整理
应用层主要包括智能机器人、智能金融、智能医疗、智能安防、智能驾驶、智能搜索、智能教育、智能制造系统及智能人居等产业。其中,智能机器人产业规模及增速相对突出;智能金融、智能驾驶、智能教育的用户需求相对明确且市场已步入快速增长阶段;智能安防集中于行业应用和政府采购,市场集中度相对较高;智能搜索、智能人居的产品尚未完善,市场正在逐步培育;智能医疗则涉及审批机制,市场尚未放量。预计到2020年,全球人工智能应用层产业规模将达到672亿美元,其中,智能机器人、智能驾驶、智能教育、智能安防及智能金融的产业规模将超过68%,同时我国人工智能应用层产业规模将突破110亿美元。
图9 2020年全球及我国人工智能应用层各产业规模占比
资料来源:中国电子学会整理
表12 智能机器人主要产品及典型企业
资料来源:中国电子学会整理
2、智能金融
金融行业与整个社会存在巨大的交织网络,每时每刻都能够产生金融交易、客户信息、市场分析、风险控制、投资顾问等多种海量数据。促进人工智能技术与金融行业相融合,在前端可以增强用户的便利性和安全性,在中台支持授信、各类金融交易和金融分析中的决策,在后台用于风险防控和监督。这将大幅改变金融行业现有格局,推动银行、保险、理财、借贷、投资等各类金融服务的个性化、定制化和智能化。受智能客服、金融搜索引擎及身份验证入口级产品的广泛普及和应用,智能金融全球产业规模在2020年会接近52亿美元,我国将达到8亿美元。
核心技术。当前,线上交易引发的隐私泄露及金融诈骗频出,同时随着移动终端和金融机构客户端的普及,提取的用户金融数据逐步丰富,金融机构线上服务能力和用户隐私和交易风控就变得至关重要,语音识别、自然语音处理、计算机视觉、生物特征识别和机器学习等技术得到了广泛应用。语音识别与自然语音处理技术可以为前端服务客户实现批量人性化和个性化的服务;计算机视觉与生物特征识别技术则为金融支付验证提供了保障;机器学习技术一方面通过导入海量金融交易数据,从中分析信用卡数据,识别欺诈交易,并提前预测交易变化趋势,另一方面通过构建金融知识图谱将不同来源的结构化和非结构化的数据整合到一起,建立基于大数据的完整征信授信体系。
主要产品。基于电话、网页在线、微信、短信及APP等多模式多频次的金融信息及服务获取渠道,相对较为成熟并已经逐步推广的产品包括智能客服、金融搜索引擎和身份验证,通过构建知识图谱实现理解答复及信息关联体系、提供远程开户和刷脸支付等便捷方式帮助金融机构节省人力成本。同时,随着用户消费及信贷能力的逐步提升,也涌现出一批征信和风险控制的产品,但受限于数据库的规模和数据源的相对难以获取,目前大部分集中在客观呈现款人、企业间、行业间的信息维度关联方面。此外,金融类或资产管理类公司为持续提供用户理财和升值的资产组合推出了智能投顾产品,可根据历史经验和新的市场信息来预测金融资产的价格波动趋势,以此创建符合风险收益的投资组合。
典型企业。智能客服、身份验证和金融搜索引擎领域创新企业较多,着重于引流扩量。智齿科技、网易七鱼及美国DigitalGenius均着重通过用户体验提升客户量,旷世科技、商汤科技及依图围绕着人脸识别的核心技术进入金融领域,融360、好贷网、资信客聚焦垂直领域打造金融服务的入口。征信及风控领域企业以大数据为壁垒,逐步出现行业龙头。启信宝和美国ZestFinance不断扩容数据基础,形成“平台黑洞”优势,启信宝通过提取100多家官方网站数据产品侧重呈现客观数据整合,ZestFinance则使用谷歌的大数据模型建立信用评分体系。智能投顾多为金融机构专业人才或者投资顾问公司转型而来,美国Wealthfront、弥财、财鲸等主要通过投资ETF组合以达到资产配置,理财魔方、钱景私人理财则专注基金产品的覆盖,雪球和金贝塔等以对量化策略、投资名人的股票组合的跟投为内容展开资讯传递和信息交流。
表13 智能金融主要产品及典型企业
资料来源:中国电子学会整理
3、智能医疗
促使智能机器和设备代替医生完成部分工作,更多地触达用户,只是智能医疗功用的部分体现。运用人工智能技术对医疗案例和经验数据进行深度学习和决策判断,显著提高医疗机构和人员的工作效率并大幅降低医疗成本,才是智能医疗的核心目标。同时,通过人工智能的引导和约束,促使患者自觉自查、加强预防,更早发现和更好管理潜在疾病,也是智能医疗在未来的重要发展方向。
核心技术。医疗水平的提升和医疗设备的完善使得患者就诊过程会产生与日俱增的就诊数据,爆炸式信息增长让医生无法无差错的完成诊断和治疗,同时随着人们健康意识的加强,预防性和精准性治疗同时受到关注。图像识别、语音语义识别、深度学习技术在医疗领域得到广泛应用。图像识别、语音语义识别技术可充分获取患者的饮食习惯、锻炼周期、服药习惯等个人生活习惯信息以对症下药,深度学习技术可通过计算机模拟预测药物活性、安全性和副作用,降低药物研发周期,并辅助医生工作实现更精准诊断和治疗。
主要产品。期待健康长寿的意愿随着人们生活质量的提高持续增强,适用于生活化的身体管理的智能健康管理产品率先成为热点,以数据形式引导个人生活习惯以达到基于精准医学的健康管理。同时,医生为能进行更精准并且效率更高的诊断和治疗,往往会围绕着医疗领域过往沉淀的大量病理案例,不断从预防的角度规避疾病或提前预测药物的可行性,智能影像、智能诊疗等智能医疗产品快速兴起,逐渐取代经验诊断,通过大量的影像数据和诊断数据模拟医疗专家的思维、诊断推理和治疗过程,从而给出更可靠的诊断和治疗方案。
典型企业。智能健康管理多面向消费端客户,创新企业大量涌现,大部分集中在美国。如Next IT、Sense.ly和AiCure均是从日常健康管理切入移动医疗,Welltok则通过可穿戴设进行健康干预。智能诊疗领域取得显著进展,IBM Watson以肿瘤为重心,在慢病管理、精准医疗、体外检测等九大医疗领域中实现突破,美国MedWhat、英国Babylon Health和中国拍医拍、康夫子正在聚焦智能诊疗的单个应用进入该领域。智能影像领域以创新企业为主,围绕影像数据源竞争激烈。美国Butterfly Network和中国推想科技着重打造影像设备,美国Enlitic则重点关注癌症监测,中国Deepcare围绕SaaS模式为行业提供“算法+有效数据”服务。
表14 智能医疗主要产品及典型企业
资料来源:中国电子学会整理
表15 智能安防主要产品及典型企业
资料来源:中国电子学会整理
表16 智能驾驶主要产品及典型企业
资料来源:中国电子学会整理
表17 智能搜索主要产品及典型企业
资料来源:中国电子学会整理
7、智能教育
智能教育侧重启发与引导,关注学生个性化的教育和交互,学生能够获得实时反馈和自动化辅导,家长可以通过更为便捷和成本更低的方式看到孩子实时学习情况,老师能收获更丰富的教学资源、学生个性化学习数据来实现因材施教,学校也能提供高质量的教育,政府则将更容易为所有人提供可负担、更均衡的教育。自动化辅导优先通过搜题的应用取得爆发式增长,预计2020年全球智能教育产业规模可达108亿美元,我国将接近10亿美元。
核心技术。智能教育建立在与学生充分的交互和数据获取的基础上,并在海量的教育数据中,匹配用户的学习需求,最终能够完成辅助教育和评估反馈,语音语义识别、图像识别、知识图谱和深度学习技术应用较多。语音语义识别、图像识别实现了规模化的自动批改和个性化反馈;知识图谱和深度学习技术搜集学生学习数据并完成自动化辅导和答疑,预测学生未来表现,智能化推荐最适合学生的内容,最终高效、显著地提升学习效果。
主要产品。对教师人力资源的过度依赖是教育行业问题根本所在,能够辅助教育过程、提升教师效率,同时激发学生自主学习兴趣的产品,率先得到市场的认可,目前相对成熟的产品有自动化辅导、智能测评和个性化学习。自动化辅导可在两秒内反馈出答案和解题思路,手写的题目的识别正确率也已达到70%以上,大幅提升学生的学习效率。智能测评不仅可以对用户跟读进行语音测评和指导,同时还能通过手写文字识别、机器翻译、作文自动评阅技术实现规模化阅卷的作业测评。个性化学习基于学习行为的数据分析,推荐适合学生水平的学习内容。
典型企业。从事自动化辅导和个性化学习的企业均聚焦单一产品功能和教育区间,目前主要通过融资方式持续补贴用户提升获客能力。美国的Volley 和中国的猿题库、作业帮、学霸君和阿凡题聚焦K12教育的题库辅导和答疑,均推出拍照搜题完成题库答疑或老师答疑,中国郎播网、英语流利说和多邻国等侧重语言辅导,美国Newsela、LightSail等建立阅读数据库个性化提供阅读材料。智能测评企业主要集中在英语科目,如中国科大讯飞以智能语音技术为核心推出智能阅卷系统,批改网和美国LightSide通过数据库匹配完成文本测评。
表18 智能教育主要产品及典型企业
资料来源:中国电子学会整理
表19 智能人居主要产品及典型企业
资料来源:中国电子学会整理
第四章 投融资特征及趋势
+
全球智能化浪潮的兴起,引发人工智能成为创业热点,各类风险投资纷纷占位人工智能各应用领域,跨国科技巨头则围绕自身人工智能战略,通过投资和并购方式布局产业生态,由此带来了人工智能领域融资热度持续增高。截止2017年末,全球人工智能公司已突破2075家,跨越25个子门类,融资金额高达65亿美元。但是,创业企业随着融资到位,助力产品、数据和商业模式的不断完善,已逐步成为细分领域的龙头企业或者独角兽企业,单项目融资金额规模正在逐步增大,同时随着市场集中度的增高,人工智能领域创业成功的几率有所下降,使得融资增速逐渐放缓。预计到2020年,全球人工智能融资金额增速会由2017年的33%下降至20%。
图10全球人工智能企业投融资金额总量(2015-2020年)
资料来源:中国电子学会整理
在移动互联网、O2O等技术和商业模式的推动下,风险投资市场在2015年整体偏好高估值,当年国内人工智能投资总规模高达8.9亿美元。但随着风险投资市场的逐渐成熟,在经过近三年的爆发式投资及对高估值项目的推崇之后,国内风险投资生态系统正在走下融资高峰,逐步回归到正常、健康的投资环境。在经历了2016年的短暂低谷后,2017年国内人工智能投资金额再创新高,达到10.3亿美元。随着投资市场的沉淀,人工智能技术不断突破,商业模式持续创新,逐渐培育出了产品和应用具有相当规模的优质企业和项目。同时,创业企业随着规模增长,持续发展所需金额较大,在后续融资阶段吸收了大部分的风险基金,近期大额投资案例频发,投资热点主要集中在人工智能领域的技术层和应用层,如自然语言处理类的今日头条、智能搜索类的出门问问等,融资额均超过1.5亿美元。
图11 我国人工智能企业投融资金额总量(2015-2020年)
资料来源:中国电子学会整理
深度学习、图像视频识别和文本识别应用范围较广,市场潜力巨大,率先成为资本竞相追逐的对象。深度学习算法成为推动人工智能发展的焦点,相继在图片识别、机器翻译、语音识别、决策助手、生物特征识别等领域实现了创新突破,截止2017年,全球深度学习领域在技术层和应用层的融资总额高达33亿美元。图像视频识别广泛应用于智能工业机器人、智能医疗、智能安防、智能驾驶等领域,全球共计融资总额高达16.6亿美元。文本识别则应用于智能投顾、智能客服、智能搜索、智能教育等领域,全球融资总额超过9.3亿美元。
表20 全球各领域人工智能企业融资额前五名
数据统计时间2010.1.1至2017.12.30
资料来源:中国电子学会整理
人工智能被全球巨头企业视为下一次技术革命的突破点,研发和投资并购同步发力并且侧重点各异。谷歌在研发方面依托人工智能改善搜索功能并开源机器学习系统,在投资方面通过收购Wavii、Moodstocks、SayNow等完成文本识别、图像视频识别、语音识别的技术布局,收购深度学习技术公司DeepMind完善开源平台能力,收购Kaggle扩大在开发者层面和人工智能开源平台方面的优势。苹果则集中在虚拟助手和深度学习平台的创业型小公司,购入Vocal IQ让Siri在虚拟助手领域取得领先,同时也收购了面向开发者和数据科学家的深度学习平台Turi。IBM重点围绕Watson平台的功能完善开展投资并购,收购Blekko丰富和深化Watson认知计算的能力,收购AlchemyAPI加强Watson人工智能与计算服务能力,收购Cognea增强Watson系统对话的能力。微软投资了Agolo和Bonsai公司,分别致力于布局开发先进摘要软件企业和部署智能系统。亚马逊通过收购语音识别公司Yap和语音助理公司Evi,构建了语音操作系统Alexa的雏形,并不断完善Alexa的应用能力,逐步整合智能家居语音控制系统。
表21 全球科技巨头主要收购企业
资料来源:中国电子学会整理
第五章 新一代人工智能中长期技术及产业发展趋势
+
1、既有架构面临挑战,新型人工智能芯片呼之欲出
人工智能芯片由非定制化向定制化方向发展。人工智能推动新一轮计算革命,深度学习需要海量数据并行运算,传统计算架构已无法支撑深度学习的大规模并行计算需求。目前使用的GPU、FPGA(可编程门阵列芯片)均非人工智能定制芯片,存在着一定的局限性,深度学习需要更适应此类算法的新的底层硬件来加速计算过程。目前,谷歌公司已经开发出新型TPU(张量处理器),可以在芯片中节省出更多的操作时间,适用于更复杂和强大的机器学习模型,并且能够进行快速部署;英特尔以167亿美元收购了FPGA厂商Altera后,也在研究CPU+FPGA的异构方案,以达到更好适应人工智能时代的定制化计算的目的。
量子计算引领下一代人工智能芯片发展潮流。对于目前的经典计算机,处理器的计算性能已渐渐远离摩尔定律,在IBM推出5 nm制程工艺之后,CPU中晶体管的数量已很难再实现每两年翻一番的预期。在更小尺寸的工艺条件下,晶体管性能受限于电子特性将变得不再可靠。量子计算将为人工智能带来革命性的发展机遇,量子比特数量会以指数增长的形式快速上升,小型化的量子芯片可以使人工智能前端系统的快速实时处理成为可能。未来,车载智能系统、无人机智能系统等领域或将首先应用量子计算芯片系统。
2、经济社会发展存在迫切需求,专用智能向通用智能升级
人类生产生活方式变革对人工智能提出了新的发展需要。随着科技不断发展和社会结构深入变革,人类面临着生活、生产、资源、环境等方面一系列需要回答的重大问题,现有的认知水平和治理能力面临着前所未有的挑战。在博弈、识别、控制、预测等专业领域以及城市发展、生态保护、经济管理、金融风险等宏观系统方面,迫切需要一种范围广、集成度高、适应力强的通用智慧,提供从辅助性决策工具到专业性解决方案的升级,显著提升人类阅读、管理、重组知识的能力。
通用人工智能具备连接人工智能和人类特征的优势。通用人工智能(Artificial General Intelligence,AGI)具备执行一般智慧行为的能力,可以将人工智能和意识、感性、知识和自觉等人类的特征互相连结,具备减少对领域知识的依赖性、提高处理任务的适用性以及实现机器自主认知的纠偏性等特点。通用智能将具备处理多种类型任务和适应未曾预料情形的能力,其实质进展将真正开启智能化革命的序幕,与现有物理及信息世界高度融合,深刻影响社会经济发展的各个方面。
3、技术平台开源化已成趋势,围绕超级智能生态系统的竞争即将展开
全球主流技术厂商纷纷围绕深度学习开放技术平台。2015年12月,人工智能初创公司Open AI开源其研究成果OpenAI Gym,拉开了全球科技巨头开放各自的深度学习技术平台的序幕,如谷歌和Facebook分别将深度学习平台TensorFlow和Torchnet全面开源,微软开源CNTK,DeepMind 宣布开源深度学习训练平台Labyrinth并改名为DeepMind Lab;国内百度公布了旗下的深度学习平台PaddlePaddle,腾讯公布一站式深度学习平台DI-X等。深度学习技术平台的开源化,一方面能够使平台吸引潜在用户,提高应用潜力,在深度学习领域进行持续创新;另一方面,各科技公司未来将围绕开源平台建立人工智能超级生态系统,进一步整合技术与应用,有效布局人工智能全产业链。
构建超级生态系统成为未来人工智能技术发展与竞争的主流。下一阶段,借助人工智能超级生态系统,科技公司可以将人工智能领域复杂的推理能力应用到之前缺乏机器学习经验的其它领域,更加方便地指导用户使用机器学习训练其商用模型,评估与优化系统潜力,同时利用收集到的数据对用户的下一步行为做出更好的规划与建议,促进应用水平提高。围绕各自的生态系统,科技巨头们将在人工智能技术与产业的战场展开激烈竞争,角逐行业优势,争夺产业主导话语权。
1、人工智能产业仍将保持爆发式增长
全球正在经历科技和产业高度耦合、深度迭加的新一轮变革,创新已由单一领域的离散式突破向跨领域的群体性突破转变,由单一的产品创新向集大成的系统创新转变,信息、生命、材料、制造、能源等领域竞相出现重大突破。其中,人工智能的表现一枝独秀,已历史性地站在了变革的风口,作为下一阶段科技变革浪潮的新引擎,将渗透至各行各业,助力传统行业实现跨越式升级,带来广阔的发展前景与良好的市场机遇。以微软、谷歌、Facebook以及百度、阿里、腾讯等为代表的国内外科技巨头纷纷积极卡位,布局人工智能全产业链,各路资本也竞相角逐人工智能产业潜在增长点,充分展示了对于未来市场的乐观预判。得益于人工智能技术的不断升级以及商业模式的推陈出新,全球人工智能产业需求将进一步放量,2020年全球人工智能产业规模将超过1100亿美元,年均增速达到47.8%,我国人工智能产业规模也将达到180亿美元,年均增速达到56.5%。在产业规模整体爆发式增长的背景下,基础层、技术层和应用层的各细分领域也将保持同步增长态势,尤其以应用层各产业领域的增长表现最为抢眼。
2、我国将成为全球人工智能产业发展的重要推动者
人工智能已受到世界各主要科技强国的广泛关注,成为以新一轮科技革命为基础的国家竞争制高点。欧盟的“人脑计划”、日本的“人工智能/大数据/物联网/网络安全综合项目”以及美国的《国家人工智能研究与发展战略规划》,都将人工智能全面提升到国家战略层面。目前,美国仍然是全球人工智能产业发展的主导者,凭借着数量众多、实力雄厚的科技企业和资源丰富、人才济济的高校与科研机构,美国从人工智能的底层技术到应用市场都拥有无可比拟的巨大优势。我国目前已经是人工智能大国,影响力稳步提升,从2016年起将人工智能领域建设已上升至国家战略层面,相关政策进入全面爆发期。得益于人工智能产业对经济的积极影响和良好的应用市场背景,未来几年内有望持续获得国家大力支持,众多企业、高校及科研机构也将不断加大技术及应用研发投入力度,共同推动我国保持并发展自身竞争优势,深度参与全球人工智能产业合作竞争。
3、智能芯片、智能机器人及智能驾驶等热点应用将持续受到关注
人工智能目前已经跨越了单纯依靠数据获取来实现技术提升与推动应用发展的阶段,传统的API(Application Programming Interface,应用程序编程接口)开放和积木式创新已经无法满足人工智能的技术发展,数据与应用的迭代式螺旋上升发展将推动人工智能应用层产业的跨越式发展。在下一阶段,预期智能芯片、智能机器人及智能驾驶等产业将率先落地,凭借技术的早期积累与资本的持续注入占据相当的市场份额。智能芯片领域将由现有的CPU+GPU与CPU+FPGA异构模式,向新型人工智能专用芯片及量子芯片过渡,颠覆现有芯片产业格局;智能机器人将会应用到越来越多的特定场景之中,实力雄厚的机器人公司或将首先开发出适用于多个商业领域的通用型机器人,轻松适应不同环境;智能驾驶领域也将成为未来科技公司竞争的主战场,绝大部分车辆将达到2至3级驾驶能力(部分自动化和有条件自动化驾驶),而4至5级的驾驶(高度自动化和完全自动化驾驶)将会创造更大的产业发展机遇。
4、“平台+场景应用”主导的新型商业模式即将出现
现有的人工智能技术主要聚焦于为服务商提供解决方案,直接面对消费者端的产品相对较少。未来,随着人工智能产业的深入发展以及市场化机制的不断成熟,平台化趋势会更加突出,将出现若干主导平台加广泛场景应用的竞争格局,催生出更多新型的商业模式。通过海量优质的多维数据结合大规模计算力的投入,以应用场景为接口,人工智能产业将构建起覆盖全产业链生态的商业模式,满足用户复杂多变的实际需求。同时,具备新型芯片、移动智能设备、大型服务器、无人车、机器人等设备研发制造能力的企业也能够结合应用环境,提供高效、低成本的运算能力和服务,与相关行业进行深度整合,从基础设施提供逐渐向产业链下游服务延伸拓展。
5、科技巨头企业的优势地位将受到初创公司的挑战
目前全球人工智能产业的发展实际上是由少数科技巨头公司主导,包括国内的BAT(百度、阿里、腾讯),以及国外的FAMGA(指Facebook、亚马逊、微软、谷歌和苹果,截至2017年7月全球市值最高的五个公司)。凭借着强大的技术和资本垄断能力,科技巨头公司在目前代表着全球人工智能产业发展的最前沿,强势保持人工智能科技创新与产业发展的优势地位。但除科技巨头之外,全世界还有千余家人工智能初创企业,半数以上已经获得投资机构青睐,数量以美国和中国居多。短期来看,科技巨头们虽然在人工智能各领域都已投下棋子,但大多是为企业自身以及企业相关业务进行服务,业务面广却并非无懈可击,初创公司往往聚焦于行业某细分领域并深入探索,与科技巨头在某些领域相比存在一定的比较优势。同时,广阔的市场容量对产业化应用提出了更加层次化的需求,初创企业可以结合自身特点进行选择化竞争,避开与科技巨头的直接较量。
6、行业监管问题迫切需要引起各方重视
任何新兴科技产业从诞生到具体落地,都需要面临技术、商业、法律和政策层面的诸多挑战。在当前人工智能产业正处于蓬勃发展阶段的同时,必须认真考虑到未来行业监管措施的制定与实施。人工智能开发者在收集和使用数据的过程中,需要采取适当的技术手段保护个人隐私安全,防止个人信息的泄露、篡改及损毁;在训练和设计过程中需要具备广泛的包容性,应该充分考虑弱势群体的利益,并对道德与法律的极端情况设置特别的判断规则;在技术或者产品的研发流程中,必须设置行政许可和准入限制,研判如何发放人工智能产品在各细分领域的应用牌照。人工智能行业的监管问题不是单独哪一个群体面临的问题,具有广泛的社会性、系统性与复杂性,需要企业、政府、用户、科技社团等第三方组织共同参与、群策群力,构建促进人工智能产业良好发展的创新应用生态环境。
第六章 推动新一代人工智能发展的措施建议
+
一是依托国家新一代人工智能发展规划制定详细指导意见和行动指南。围绕人工智能技术和产业发展在动能、路径、举措方面的现实要求,按照供给侧结构性改革的总体部署,以催生经济增长新动能,形成结构调整新模式,培育产业升级新业态,塑造国际竞争新优势为导向,以人工智能催生的各类新兴产品、组织业态、产业结构、商业模式为核心,将着力推进人工智能技术及产业发展作为具备一定条件和基础区域的经济社会发展战略规划体系的重要组成,形成科学、可行、持续的工作方案。
二是将与人工智能融合发展作为传统产业变革创新的重要方向。要引导传统产业充分认识到“信息”与“智能”已经成为新的生产要素,与劳动、资本、土地等其他财富创造要素具有同等重要的地位,国民经济社会已经从工业经济时代进入信息经济时代,并且必将步入智能经济时代。围绕着新兴生产要素即将出现从生产工具到基础设施,从产业形态到商业模式的一系列重大变革。要充分借鉴、吸收、消化国外先进企业的既有成功经验,提炼、归纳、总结出符合国内企业基本情况、发展基础和行业特性的人工智能融合创新重点和发展路径,将人工智能作为创造产业新形态、重塑产业新竞争力的重要支撑和关键抓手。
一是推动监管、财税、立法领域的体制机制创新。人工智能与传统产业融合将催生大量新业态、新模式,要推动监管方式适时革新,从有章可循式的细则性管理转向“法无禁止即可为”式的调控性管理,为创新行为预留尽可能充足的发展空间,在财税和立法领域予以一定宽松环境,鼓励新生事物诞生和成长。同时,要积极探索政府、企业、行业协会及中介组织共同参与的多元化协同治理机制。
二是推动相关行政机构的治理组织架构优化调整。根据人工智能产业发展以及与传统产业融合所产生的新现象、新局面,积极应对在研发、生产、销售、服务、管理等领域面临的新问题,以构建与人工智能发展需求相契合的适应性制度为导向,以提升治理效率和有利于调整优化治理措施为着力点,突出治理组织架构变革的动态性和适应性,杜绝多头治理,避免推诿塞则,打破各种“玻璃门”和“弹簧门”。
一是集中力量突破重点领域核心关键技术。以人工智能技术安全可控发展为导向,组织实施人工智能重大技术攻关工程,研究制定云计算、大数据底层技术与机器学习、模式识别、人机交互通用技术的安全可控发展路线图。重点突破算法模型与智能芯片的技术瓶颈,围绕大数据智能、互联网群体智能、跨媒体智能、人机混合智能、自主智能系统等开展前瞻性、基础性研究,制定长期发展战略及分阶段目标,积极探索变革性创新,力争从“跟随式”发展跃升为“引领式”发展。
二是加快推进“双创”平台建设。将具备人工智能发展意愿和基础,规模大、实力强、管理好、素质高的龙头企业作为“双创”的重要主体,充分发挥大企业技术、管理、人才、渠道、资金、市场优势,通过设立产业投资基金、开展供应链金融服务、搭建创业孵化平台和协同创新平台等模式,加速技术成果转化,助推一批人工智能领域的中小企业快速成长。依托行业协会及中介机构设立开放式“双创”平台,促进企业间的资源协同与供需对接。鼓励传统企业和人工智能企业联合搭建基于在线网络的“双创”平台,推动企业发展理念、战略、组织、流程、管理和商业模式创新。
一是抓紧抢占数据开放的战略高地。大力提倡数据思维,加强全社会数据编码应用,有组织有计划地挖掘生产、生活、医疗等领域的数据资源潜在应用价值,并推动数据安全法治化,保护国家数据安全,保护公民数据权益,做好构建全球数字资源平台的前瞻谋划。在充分保护公共安全和个人隐私的前提下,对一些基础性的可公开数据进行开放共享,建成共有数据池,使得更多的人工智能领域中小型创新创业企业能够享受到这些基础资源,促进算法模型和解决方案的优化升级,发掘更多的潜在增长点。
二是探索新型复合型人才的教育培训机制。加大人工智能人才培养力度,选择若干高水平大学,设立人工智能研究与培训中心,加大博士硕士培训规模,加深与机械、设计、医疗、电信、经济、城市规划等相关应用领域合作,加强与计算机科学、神经科学、认知科学、心理学等相关知识体系融合互动。鼓励具备能力的高校及科研机构搭建综合性平台,为相关研究人员提供交叉学科培训和应用交流对接。
一是进一步建设相对宽松的融资环境。鼓励商业银行加大对有能力提供行业解决方案的人工智能企业融资的支持力度,适当降低抵押品等方面的要求。细化对知识产权质押贷款的价值评估标准和操作细则,适当减少创新创业型人工智能领域中小企业在申请知识产权质押贷款时的附加条件。规范发展债券市场,适度降低企业发债门槛。积极稳妥推进股票发行注册制改革,加快多层次股权市场建设,降低创业板准入门槛,力争加快建立战略新兴产业板,完善人工智能与传统产业融合催生的新技术、新业态、新模式主导下的创新型企业融资体系。
二是研究设立人工智能与传统产业融合创新发展专项基金。发挥政府资金的杠杆和乘数效应,引导整合社会资金,探索建立支持人工智能与传统产业融合创新的专项发展基金。在运作模式上采取政府引导、市场运作的模式,尊重市场规律,借鉴国际国内成功的产业发展基金管理运作经验,紧密结合国家重大战略决策,着力于培育发展人工智能与传统产业融合创新催生的大量新技术、新业态、新模式。一方面与地方相关园区基地紧密合作,参股区域性投资基金,逐步形成全国布局;另一方面参股社会资本,引导其科学合理有序地发展人工智能与传统产业融合创新的各项新业务。
一是组织开展前瞻规划研究。围绕新一代人工智能发展特色及内涵外延框架,针对人工智能与传统产业融合创新带来的经济新变革,组织相关领域的协会、联盟和研究机构及时开展前瞻性研究,结合新一代人工智能发展趋势,对正在和将要出现的一大批新技术、新产品、新业态、新模式进行研判,提前规划发展路线图和战略重点,并对财税和立法领域面临的新问题进行专题研讨,提出政府治理模式变革的参考依据,发挥行业指导作用,提供智力支持。
二是打造促进人工智能技术及产业发展的创新服务体系。由行业主管部门牵头,以相关行业协会及联盟为依托,成立国家级的人工智能技术及产业发展促进中心,聘请院士级专家为中心顾问,围绕人工智能发展及与传统产业融合的现状及问题,建立和完善网络化、专业化、社会化的创新服务体系,开展成果转化、产融对接、检验检测、人才培训、专利申报、知识产权保护等服务,打造实体业务与网络平台的融合运行机制,探索以企业为主体的市场化运作模式。
一是持续研究制定具备国际视野的标准规范体系。围绕人工智能当前阶段在具体行业的融合创新和应用推广需求,率先开展关键技术和领域的标准规范研究制定工作,积极参与国际相关标准制定,考虑在中文语音识别等特色优势领域重点推动团体标准的制定、完善和实施。推动提出符合中长期发展趋势的人工智能标准总体布局与框架,建立面向国际的,具有科学性、系统性、前瞻性的人工智能标准规范体系。
二是有效加强多元化国际合作。引导和支持国内人工智能企业与国际人工智能领先企业、知名高校、科研机构的紧密合作,及时追踪研究人工智能领域的国际前沿动态,鼓励国内人工智能企业与国外相关企业和机构在国内联合成立技术研发及产业化中心。积极依托“一带一路”,推动布局人工智能的国际研究基地、研发中心和人员培训。
七、推动新一代人工智能发展的措施建议
+
一是依托国家新一代人工智能发展规划制定详细指导意见和行动指南。围绕人工智能技术和产业发展在动能、路径、举措方面的现实要求,按照供给侧结构性改革的总体部署,以催生经济增长新动能,形成结构调整新模式,培育产业升级新业态,塑造国际竞争新优势为导向,以人工智能催生的各类新兴产品、组织业态、产业结构、商业模式为核心,将着力推进人工智能技术及产业发展作为具备一定条件和基础区域的经济社会发展战略规划体系的重要组成,形成科学、可行、持续的工作方案。
二是将与人工智能融合发展作为传统产业变革创新的重要方向。要引导传统产业充分认识到“信息”与“智能”已经成为新的生产要素,与劳动、资本、土地等其他财富创造要素具有同等重要的地位,国民经济社会已经从工业经济时代进入信息经济时代,并且必将步入智能经济时代。围绕着新兴生产要素即将出现从生产工具到基础设施,从产业形态到商业模式的一系列重大变革。要充分借鉴、吸收、消化国外先进企业的既有成功经验,提炼、归纳、总结出符合国内企业基本情况、发展基础和行业特性的人工智能融合创新重点和发展路径,将人工智能作为创造产业新形态、重塑产业新
竞争力的重要支撑和关键抓手。
一是推动监管、财税、立法领域的体制机制创新。人工智能与传统产业融合将催生大量新业态、新模式,要推动监管方式适时革新,从有章可循式的细则性管理转向“法无禁止即可为”式的调控性管理,为创新行为预留尽可能充足的发展空间,在财税和立法领域予以一定宽松环境,鼓励新生事物诞生和成长。同时,要积极探索政府、企业、行业协会及中介组织共同参与的多元化协同治理机制。
二是推动相关行政机构的治理组织架构优化调整。根据人工智能产业发展以及与传统产业融合所产生的新现象、新局面,积极应对在研发、生产、销售、服务、管理等领域面临的新问题,以构建与人工智能发展需求相契合的适应性制度为导向,以提升治理效率和有利于调整优化治理措施为着力点,突出治理组织架构变革的动态性和适应性,杜绝多头治理,避免推诿塞则,打破各种“玻璃门”和“弹簧门”。
一是集中力量突破重点领域核心关键技术。以人工智能技术安全可控发展为导向,组织实施人工智能重大技术攻关工程,研究制定云计算、大数据底层技术与机器学习、模式识别、人机交互通用技术的安全可控发展路线图。重点突破算法模型与智能芯片的技术瓶颈,围绕大数据智能、互联网群体智能、跨媒体智能、人机混合智能、自主智能系统等开展前瞻性、基础性研究,制定长期发展战略及分阶段目标,积极探索变革性创新,力争从“跟随式”发展跃升为“引领式”发展。
二是加快推进“双创”平台建设。将具备人工智能发展意愿和基础,规模大、实力强、管理好、素质高的龙头企业作为“双创”的重要主体,充分发挥大企业技术、管理、人才、渠道、资金、市场优势,通过设立产业投资基金、开展供应链金融服务、搭建创业孵化平台和协同创新平台等模式,加速技术成果转化,助推一批人工智能领域的中小企业快速成长。依托行业协会及中介机构设立开放式“双创”平台,促进企业间的资源协同与供需对接。鼓励传统企业和人工智能企业联合搭建基于在线网络的“双创”平台,推动企业发展理念、战略、组织、流程、管理和商业模式创新。
一是抓紧抢占数据开放的战略高地。大力提倡数据思维,加强全社会数据编码应用,有组织有计划地挖掘生产、生活、医疗等领域的数据资源潜在应用价值,并推动数据安全法治化,保护国家数据安全,保护公民数据权益,做好构建全球数字资源平台的前瞻谋划。在充分保护公共安全和个人隐私的前提下,对一些基础性的可公开数据进行开放共享,建成共有数据池,使得更多的人工智能领域中小型创新创业企业能够享受到这些基础资源,促进算法模型和解决方案的优化升级,发掘更多的潜在增长点。
二是探索新型复合型人才的教育培训机制。加大人工智能人才培养力度,选择若干高水平大学,设立人工智能研究与培训中心,加大博士硕士培训规模,加深与机械、设计、医疗、电信、经济、城市规划等相关应用领域合作,加强与计算机科学、神经科学、认知科学、心理学等相关知识体系融合互动。鼓励具备能力的高校及科研机构搭建综合性平台,为相关研究人员提供交叉学科培训和应用交流对接。
一是进一步建设相对宽松的融资环境。鼓励商业银行加大对有能力提供行业解决方案的人工智能企业融资的支持力度,适当降低抵押品等方面的要求。细化对知识产权质押贷款的价值评估标准和操作细则,适当减少创新创业型人工智能领域中小企业在申请知识产权质押贷款时的附加条件。规范发展债券市场,适度降低企业发债门槛。积极稳妥推进股票发行注册制改革,加快多层次股权市场建设,降低创业板准入门槛,力争加快建立战略新兴产业板,完善人工智能与传统产业融合催生的新技术、新业态、新模式主导下的创新型企业融资体系。
二是研究设立人工智能与传统产业融合创新发展专项基金。发挥政府资金的杠杆和乘数效应,引导整合社会资金,探索建立支持人工智能与传统产业融合创新的专项发展基金。在运作模式上采取政府引导、市场运作的模式,尊重市场规律,借鉴国际国内成功的产业发展基金管理运作经验,紧密结合国家重大战略决策,着力于培育发展人工智能与传统产业融合创新催生的大量新技术、新业态、新模式。一方面与地方相关园区基地紧密合作,参股区域性投资基金,逐步形成全国布局;另一方面参股社会资本,引导其科学合理有序地发展人工智能与传统产业融合创新的各项新业务。
一是组织开展前瞻规划研究。围绕新一代人工智能发展特色及内涵外延框架,针对人工智能与传统产业融合创新带来的经济新变革,组织相关领域的协会、联盟和研究机构及时开展前瞻性研究,结合新一代人工智能发展趋势,对正在和将要出现的一大批新技术、新产品、新业态、新模式进行研判,提前规划发展路线图和战略重点,并对财税和立法领域面临的新问题进行专题研讨,提出政府治理模式变革的参考依据,发挥行业指导作用,提供智力支持。
二是打造促进人工智能技术及产业发展的创新服务体系。由行业主管部门牵头,以相关行业协会及联盟为依托,成立国家级的人工智能技术及产业发展促进中心,聘请院士级专家为中心顾问,围绕人工智能发展及与传统产业融合的现状及问题,建立和完善网络化、专业化、社会化的创新服务体系,开展成果转化、产融对接、检验检测、人才培训、专利申报、知识产权保护等服务,打造实体业务与网络平台的融合运行机制,探索以企业为主体的市场化运作模式。
一是持续研究制定具备国际视野的标准规范体系。围绕人工智能当前阶段在具体行业的融合创新和应用推广需求,率先开展关键技术和领域的标准规范研究制定工作,积极参与国际相关标准制定,考虑在中文语音识别等特色优势领域重点推动团体标准的制定、完善和实施。推动提出符合中长期发展趋势的人工智能标准总体布局与框架,建立面向国际的,具有科学性、系统性、前瞻性的人工智能标准规范体系。
二是有效加强多元化国际合作。引导和支持国内人工智能企业与国际人工智能领先企业、知名高校、科研机构的紧密合作,及时追踪研究人工智能领域的国际前沿动态,鼓励国内人工智能企业与国外相关企业和机构在国内联合成立技术研发及产业化中心。积极依托“一带一路”,推动布局人工智能的国际研究基地、研发中心和人员培训。
☞来源: CIE智库,中国电子学会
工程院院士 蔡鹤皋丨北航教授 文力丨深醒科技 袁培江丨深之篮 魏建仓
一飞智控丨深醒科技丨发那科丨柔宇科技丨优傲机器人丨宇树科技丨臻迪科技丨iRobot
①工业 缝纫机器人丨无人智能采矿机器人丨中国饺子生产线自动化车间丨MIT 建筑机器人
②服务 索尼机器狗 Aibos丨叠衣机器人 FoldiMate丨日本 骑自行车机器人丨有触觉机械手 LUKE丨达芬奇机器人丨机器人乐队丨空中飞车丨日本护理机器人合集
③特种 丰田人形机器人丨水下机器人 探索号丨俄罗斯人形机器人 FEDOR丨美国重型机械 Guardian GT丨波士顿动Atlas 360度后空翻丨中国四足机器人 Laikago丨北理工 四轮足机器人丨佛罗里达研究院 “机械鸵鸟
④仿生 3D打印 仿生机器人 丨东京大学 流汗人形机器人丨柔性电池丨哈佛 柔软肌肉丨哈佛 折纸机器人丨哈佛 RoboBee
英特尔 宋继强博士 | 中民国际 刘国清丨陈小平教授 |驭势科技 姜岩丨浙大 熊蓉教授|长江学者 孙立宁丨上海大学 无人艇专家团|新松总裁 曲道奎丨北航 王田苗教授|863专家 李铁军教授丨北邮 刘伟教授|清华 邓志东教授丨清华 孙富春教授|天津大学博导 齐俊桐丨哈工大 杜志江教授|长江学者 王树新丨甘中学教授 | 硅谷创客 赵胜
意向合作,文章转载, 均可联系堂博士
商务合作:13810423387(同微信)
内容合作:15611695072(同微信)