来源:e-works 专家:胡志强
著:(德)Martin Hofmann (奥地利)Florian Neukart (德)Thomas Bäck
编译:胡志强(中国汽车工程学会)
数据科学和机器学习对于未来的汽车工业来说,是非常关键的技术,因为这两项技术正在被用于汽车产品、汽车工艺优化和自动学习。在汽车工业研发、采购、物流、制造、市场运营、销售和售后、客户服务等环节,甚至更广泛的领域,工程技术人员正在探索应用人工智能技术的可能性。目前,已经可见的人工智能和数据科学应用案例已经说明这些技术给汽车工业带来的变革指日可待。
一、前言
数据科学和机器学习现在已经与人们的日常生活息息相关,这些技术已经被大量采用,随处可见,如汽车和手机中的语音识别功能、人脸识别、交通信号灯识别等,再如战胜了各国围棋高手的阿尔法狗机器人。在模式识别、研究和学习算法基础上建立的大数据分析技术已经能够洞察我们未知的领域,如各种生产工艺、系统、自然以及人类行为背后的动因,它打开了一扇大门,让我们进入了一个存在无限可能性的新世界。比如现在已经成为热点的无人驾驶汽车,对汽车驾驶者来说,通过汽车导航和巡航系统的帮助实现自动驾驶已经触手可及。
早在2015年底,特斯拉的创始人Elon Musk和丰田汽车几乎同时宣布,将投资十亿美元用于人工智能的研究和开发。在人工智能领域,这不过是冰山一角,但汽车行业未来发展趋势显而易见。工业互联、自动驾驶,以及不断从数据中学习并能做出最优决策的人工智能正在以颠覆性的革命性方式推进,这一趋势对很多工业的发展来说起着至关重要的作用,尤其是汽车工业。对很多国家来说,汽车工业是国民经济的支柱性产业之一。在不久的将来,汽车工业将融入这些新基因,即在数据科学和机器学习的帮助下,开发新的技术,提供新的服务,提升国际竞争力。
数据科学和人工智能技术带来的自动驾驶、智能工厂等汽车工业的愿景能否成为现实还有待时间来印证,但不管怎么样,我们坚信,这些技术的快速发展将引导汽车工业创建全新的产品、流程和服务,其中很多场景我们今天就能憧憬。
二、数据挖掘
人工智能和数据科学将数据应用分析分为四个层级(见图1),从低到高依次为“描述性分析”(发生了什么)、“诊断性分析”(为什么发生)、“预测性分析”(会发生什么)、“优化性分析”(应该怎么做)。高德纳公司之前使用“规范性分析”来表述最高层级,本文用“优化性分析”来替代,这样做的原因是,一项技术可以“描述”很多东西,而在公司内部的实现过程中,目标总是追求在规范性标准或质量标准的基础上做得“更优秀”。“优化”可以通过搜索算法得到支持,例如非线性案例中的“进化算法”和在更少见的线性案例下的运筹学方法。“优化性分析”获得了应用程序专家的支持,他们从数据挖掘过程中获取结果,并使用它们得出关于过程改进的结论。一个很好的例子是基于数据的决策树,程序专家可以运用自己的专业知识来理解和修正,然后以适当的方式实现。应用程序也可以用于优化的目的,当然,人始终会参与其中。中间两个级别也都是基于数据科学的技术,包括数据挖掘和统计,而“描述性分析”本质上是传统的商务智能概念(如数据库、联机分析处理)。
图1 数据分析的4个层级
有时候,数据挖掘需要相关应用程序对多个标准通同时进行优化,这意味着需要采用多标准优化方法,或者说多标准决策支持方法。这些方法用来在矛盾的目标之间找到最好的解决方案。例如成本与质量,或者风险与利润,前后两者经常发生矛盾,再举一个更具有技术性的例子,如车身的重量和车辆安全性能之间的矛盾。
这四个层级构成了一个框架,在这个框架中,可以将一个公司的数据分析能力和潜在收益进行分类。
传统的跨行业数据挖掘标准流程(CRISP-DM)不包括任何优化或决策支持(见图2)。
图2 跨行业数据挖掘标准流程
基于商业理解、数据理解、数据准备、建模和评估等子步骤,CRISP在业务流程中直接给出了的部署结果。在此,本文附加了一个额外的优化步骤,该步骤将包括多个标准优化和决策支持(见图3)。
图3 优化后的跨行业数据挖掘标准流程
值得注意的是,原始的CRISP模型是数据科学家用来进行手工分析数据的迭代方法,这反映在业务理解和数据理解以及数据准备和建模之间的迭代中。然而,在评估步骤中引入相关应用程序专家来评估建模结果也可能导致流程必须从商业理解子步骤重新启动,如果需要合并其他数据的话,有必要执行部分或所有子步骤。
这一迭代流程背后的基本思想已经存在了20年,并且与时俱进,虽然只是部分兼容了大数据的策略,但仍适用于大多数应用。除了使用非线性建模方法(这种方法与通常来自统计建模的广义线性模型不同)和从数据中提取知识外,事实上数据挖掘的基本思想是,模型可以在算法的帮助下从数据中派生出来,而且这种建模过程大部分可以自动运行,因为算法自己能有效工作。
在需要创建大量模型的应用程序中,如基于历史数据对单个车型和市场的销售进行预测,自动建模起着重要的作用。在线数据挖掘的情况同样可以使用自动建模,如预测产品质量。自动建模不仅用于常规生产过程,还可用于某个单独流程发生变化时,例如一个新原料批次使用时。
这种类型的应用需要数据挖掘算法有自动生成数据,然后进行集成和处理的技术能力。此外,为更新模型并使它们作为创建在线应用最佳解决方案的基础,数据挖掘算法必须要能自动建模并自动优化。然后,这一建模和优化过程作为建议将被提供给过程专家参考,或者,尤其是在连续生产过程中,可直接用于控制各个过程。如果传感器系统也被直接集成到生产过程中用于实时收集数据,就会产生了一个自动学习的信息物理系统,这将帮助企业在生产过程中实现工业4.0的愿景。
图4 基于优化分析的工业4.0构架
如图4所示,制造装备的数据通过传感器获得并归集到数据管理系统中,然后依据系统相关变量,如质量、目标值偏差、过程方差等建立预测模型预测系统输出结果。这一构架也可用于更多的机器学习选项,如预测性维护或者异常识别等。数据模型要被持续监测,如果发现过程漂移,则被自动修正。最后,多目标优化系统利用模型连续计算出系统控制的最佳设定值。构架中包含了人类过程专家,他们可以使用该系统推演出解决方案,在解决方案应用于原系统之前,过程专家也能够使用模型对方案进行评估。
为了区别于传统的数据挖掘,现在定义的大数据概念包含了三个基本特征(有时是四个或五个基本特征):量(Volume),即数据多少;速(Velocity),即资料输入、输出的速度;多样性 (Variety),即数据类型繁多而且是异构化的。大数据不再被归类于传统的关系数据库模式。此外还有准确性(Veracity),即数据中隐藏的巨大不确定性;价值密度(Value),即数据及其分析代表的公司业务流程价值。这两个特征通常作为附加特征。所以,区分以前的数据与大数据分析方法并不是只考虑数据量一个特征,而是要考虑其他技术特征,因此要使用新的分析方法,如使用Hadoop和MapReduce软件,并要调整数据分析算法,以使数据能够被保存和处理。此外,“内存数据库”也使得用传统的学习和建模算法对大数据进行存储处理成为可能。
可以看出,建立一个数据分析和建模方法的技术框架时,数据挖掘是大数据技术的一个子系统,而数据统计又是数据挖掘的一个子系统。并非每个应用程序都需要使用数据挖掘或大数据技术。但是,可以看到一个明显的趋势,随着越来越多的数据被采集并与公司的业务流程和诸多部门关联,使用数据挖掘和大数据的必要性显得越来越重要。可喜的是,常规的硬件构架和储存器空间已经足够大,完全可以满足大数据分析和存储的需要。
来源:e-works 专家:胡志强
数据科学和机器学习对于未来的汽车工业来说,是非常关键的技术,因为这两项技术正在被用于汽车产品、汽车工艺优化和自动学习。在汽车工业研发、采购、物流、制造、市场运营、销售和售后、客户服务等环节,甚至更广泛的领域,工程技术人员正在探索应用人工智能技术的可能性。
著:(德)Martin Hofmann (奥地利)Florian Neukart (德)Thomas Bäck
编译:胡志强(中国汽车工程学会)
三、人工智能
国际神经网络协会委员会对人工智能的早期定义是:人工智能是研究如何使计算机去做过去只有人才能做得更好的智能工作。虽然这一观点今天仍然适用,但目前的研究集中在如何让软件去做过去计算机才能做得更好的工作,如大数据分析软件。数据是发展人工智能软件系统的基础,数据技术不仅是收集信息,还包括自主学习、理解并解释信息、自适应行为、规划、推断、解决问题、抽象思维、理解并解释语言和思想。
1.机器学习
一般而言,机器学习算法被分为两类:监督学习和无监督学习,两者区别取决于算法的训练样本是否需要指定一个分类标签。
(1)监督学习算法
除了输入变量之外,监督学习算法还需要已知的解决问题目标值。如为了训练一个机器学习模型来识别交通标志,最好有各种不同配置,如使用照相机拍照、扫描交通标志图像等多种配置作为输入变量。在这一案例中,光照条件、观察角度、污渍等综合在一起会使数据产生噪声或失真。不管怎样,在下雨条件下识别的交通标志目标值的精确度应该与在光照充足条件下保证一样。数据通常人为设定。正确的输入变量及其正确的分类构成一组训练数据。虽然每次训练数据集中只有一个图像,但仍然需要多个输入变量,这有利于机器学习算法在测试中找到相关特性,并利用这些特性进行分类,发现内在逻辑关系。监督学习主要用于预测(回归)和分类,而相应的数据并不局限于特定的格式,机器学习算法具有的能力远远超过处理图像、音频文件、视频、数字数据和文本。分类示例包括对象识别(交通标志、车辆前面障碍物等)、人脸识别、信用风险评估、语音识别和客户流失等,现在能定义出来的只是一小部分。
回归的例子包括在多个变量基础上确定连续数值,有时是成百上千输入变量,如无人驾驶汽车不仅要计算其理想速度、道路和环境条件,还要考虑财务指标,如当考虑国内生产总值是输入变量也随之发生改变,可使用开垦的土地、人口教育水平、工业生产等都是变量,然后再确定潜在的市场份额和推出的新车型。这些问题都是高度复杂的,不能用简单的线性关系来表示。或者,换句话说,就是目前面临的巨大挑战是:必要的专业知识甚至并不存在。
(2)无监督学习算法
无监督学习算法不关注单个目标变量,而是关注数据集的总体特征。无监督的机器学习算法通常用于分组数据集,即识别单个数据点之间的关系,它包含任意数的属性,把具有相同属性的单个数据组成集群。在某些情况下,无监督机器学习算法的输出可以作为监督学习算法的输入。无监督学习的例子有根据消费者的购买行为或人口统计数据分类客户群,或聚类时间序列,以便将数百万来自传感器的时间序列进行分组,而以前这些分组并不明显。
机器学习属于人工智能领域,它能让计算机在没有明确编程的情况下进行学习。机器学习的重点是在提供新数据的同时,开发和改变自己的程序。因此,可以用流程图表示的过程不适合用机器学习,相反,所有需要动态的、不断变化的解决方案,并且不能被限制为静态规则的东西都有可能适合于用机器学习来解决。例如,在下列情况下可使用机器学习:?没有相关的人类专业知识;?人们无法表达他们的专业知识;?解决方案随着时间的推移而改变;④解决方案需要适应特定的情况。
机器学习是数据挖掘的工具,虽然两者都是在数据中寻找模型,但机器学习和数据挖掘不是一回事。机器学习应用程序来提供自己对数据的理解,而不是提取人们能理解的现有数据。机器学习算法软件能够识别数据模型,并根据模型进行动态的调整。例如自动驾驶,或者说拥有计算机视觉软件的摄像机,在有行人出现启动制动系统的训练中,无论行人身材高低、胖瘦,穿的何种衣服,从哪个方向来,汽车都要启动制动系统;而在路边有固定垃圾桶的时候,车辆是不能启动制动系统的。
现实世界往往比机器学习模型复杂得多,这就是为什么大多数情况下要把一个问题细分为多个子问题,然后用相应的机器学习模型来解决这些子问题,然后对这些模型进行集成,以便在结构化或非结构化的环境中实现复杂的任务,自动驾驶汽车就是典型案例。
2.计算机视觉
计算机视觉大多数情况用英文缩写CV表示,是一个涉及领域非常广的研究课题,它起始于生物学、神经科学和心理学,然后又扩展到了计算机科学、数学、物理学等,是一个多领域交叉的学科。理解图像的物理特性非常重要,光具有折射、散射、反射、被吸收等特性,计算机视觉利用了光的特性,二维阵列感光传感器通过测量图像中每个像素的亮度、颜色等信息,来进行尺寸、形状、颜色等判别。目前,计算机视觉关注三个焦点:?在图像、图像序列或视频的基础上重新构建场景,观察场景上的要点;?模拟生物视觉,了解哪些物理过程和生物过程起作用,湿件(指动物脑)如何工作,以及相应地解释和理解工作;?技术研究和开发的重点是高效的算法解决方案,当涉及到计算机视觉软件时,通常只研发与生物有机体的视觉感知有特定关联的解决方案。
以上三个要素相互关联相互影响。如在自动驾驶汽车项目中,关注的焦点是障碍物识别,行人出现在车辆之前时,汽车要启动制动系统,最关键的事情是识别行人作为障碍物。在这个案例中不需要解释整个场景,例如,在汽车行驶的方向上的田野里有一家人在野餐,在障碍物识别中要计算机视觉系统理解这个场景是没有必要的。相比之下,如果周边环境也被作为输入,那么理解场景就非常重要的先决条件,比如开发家用机器人时,家庭成员躺在地板上,机器人只是会避让还远远不够,还要理解该成员可能是出现了医疗紧急情况而不是在地板上睡觉。
生物有机体的视觉系统被认为是一个活跃的过程,传感器控制与动作的成功执行紧密相关,因此,计算机视觉系统并不是被动的,它必须:?通过传感器不断提供数据流;?依据数据流执行动作。
但是,计算机视觉系统的目标并不是要理解图像中的场景,而是要首先从场景中提取有关信息,这意味着它必须对图像中的“感兴趣区域”做出标识,并且在非常短的时间内做出响应,因为场景很有可能随时变化,延迟过久会使操作失去预期的效果。目前,计算机视觉研究有很多不同的方法用于图像目标识别(即寻找在场景的什么位置有什么特征)。
(1)目标检测
目标检测器的镜头在图像上移动,通过比较子图像(窗口内容)和样本的差异确定每个位置的滤波器响应。每个新目标需要单独扫描并确定参数值。装有多种复杂算法的检测器能使用多个学习了大量图像的滤波器并可以同时基于多种尺度进行计算。
(2)分割方法
分割方法通过对图像中不同区域内的像素进行分类获得目标的几何描述。在此基础上,计算出图像固定的特征集,图像即使进行各种变换,例如光条件变化,缩放或旋转,特征集仍然保持相同的性质。特征集可以用于清晰地标识目标或目标类别,典型应用案例是识别交通标志。
(3)对齐方法
对齐方法使用参数目标模型,这一模型已经经过数据训练。算法寻找适应图像最佳特征的参数,如缩放、平移、旋转等,通过交互程序找到近似方案,即图像的特征,如轮廓、角度或其他能与图像特征相匹配的参数方案中的可选特征。
在目标识别中,有必要决定算法是解决目标的二维图形还是三维图形,因为二维图形经常是准确率和可行性之间的折中选择。目前的研究(深度学习)表明,甚至从不同点捕获的两个二维图形上的两个点之间的距离都可以被准确地确定为一个输入。日光条件下有相当好的可见度,利用激光和雷达等设备获取数据可以提高输入精度。当然,一个摄像机也足以生成所需的数据。与三维图形相比,二维图形没有形状、深度或方向等直观的编码信息。深度可以用多种方式获得编码,如使用激光、立体相机(可模仿人类视觉)和结构光方法(例如Kinect技术)。目前,最精深的研究方向是用公式定义拥有几何形状的超二次曲面,它使用任意数量的指数来确定形状,是圆柱体、立方体、圆椎体还是棱锥体。这允许用一小组参数来描述各种不同的基本形状。如果使用立体照相机获取三维图形,则要使用统计方法(如生成立体点云)代替上述方法,因为使用立体照相机获得的数据质量比用激光扫描差很多。
其他计算机视觉研究方向还包括跟踪技术、前后场景理解、监测研究等,不过这些方向目前对汽车工业来说不如前几项那么迫切。
3.推理和决策
这一研究领域被称为“知识表示与推理”,用英文缩写KRR表示,其专注于设计和开发数据结构和推理算法。在需要与物理世界(如人类)进行交互的应用案例中,问题的解决方案通常会通过推理来获得,如生成诊断、规划、处理自然语言、回答问题等。KRR为人工智能达到人类水平奠定了基础。
KRR范畴中的推理是指在没有人为干预或帮助的情况下,找到基于数据的答案,而数据在形式系统中呈现出确切而清晰的语义。自1980以来,人们一直认为数据是简单与复杂结构的混合物。前者具有较低的计算复杂度,并形成大型数据库的研究基础;后者以一种表达能力更强的语言呈现,它需要更少的表达空间,它们对应的是泛化和细粒度信息。
如当智能机器人试图像人一样完成任务时,决策是在两个或多个活动中解决取向问题的推理过程。在不断变化的状态下,要非常频繁地做出决策,即要在瞬息万变的时间里做出决断。非常典型的案例就是自动驾驶汽车需要对实时的交通变化做出反应。
逻辑与组合
数学逻辑是现实世界中许多应用的形式基础,如计算理论、法律体系和相应的论证,以及在研究和发展领域中的理论发展和证据。最初的设想是用逻辑的形式来表示每种类型的知识,并用通用的算法来进行推理,但也遇到了一些挑战,例如并非所有类型的知识都可以简单地表示出来。此外,编写复杂应用程序所需的知识可能会非常复杂,而且要以一种逻辑性的、具有高度表达性的语言来学习这种知识并不容易。再者,使用具有高度表达性的语言来进行推断也不容易。即使这两个挑战都已经克服了,这种情况也无法用计算实现。
目前,关于这个问题的争论有三个。第一个争论是逻辑无法代表许多概念,如空间、类比、形状、不确定性等,因此它不能将人工智能发展到人类的水平。相反的观点认为,逻辑只是众多工具中一种简单的工具。目前,逻辑汇聚了表达性、灵活性和清晰性的优势,其他任何方法或系统都无法替代。第二个争论关注的焦点是:逻辑对于推理来说太慢,因此永远不会在生产系统中发挥作用。相反的观点认为,逻辑有近似推理过程的方法,因此可以在规定的时间限制内完成处理过程,并且逻辑在推理方面正在取得进展。第三个争论的焦点是:基于逻辑原理开发出在现实世界中应用的系统是极其困难的,甚至是不可能的。反对观点主要来自于当前从自然语言文本中学习逻辑原理方法的个人研究。
逻辑原则上有四种不同类型:?命题逻辑;?一阶谓词逻辑;?模态逻辑;④非单调逻辑。
自动决策也是基于逻辑的研究方向。自动决策与运用逻辑和自动化的专家决策过程紧密相关。自动决策要经常考虑周围环境的动态变化,如工厂的运输机器人常常需要避开另一个运输机器人。当然,这也不是必要条件,如当对未来发展没有清晰的计划时,决策不用考虑环境变化,例如需要在特定地点以特定价格租用仓库的决策。决策涉及多个研究领域,如计算机科学、心理学、经济学和所有工程学科。
要实现自动化决策系统的开发,需要回答几个基本问题:?域是动态的还是静态的?动态是指在一定程度上需要做出一系列的决定,静态是指需要做出一个决定或同时做出多个决定;?域是确定性的、非确定性的还是随机的??是优化还是实现目标?④域是全部已知还是部分已知。
就规划和冲突行为而言,逻辑决策问题本质上是非随机的。两者都要求初始状态和中间状态的可用信息是完整的,行为具有完全的确定性,效果已知,并且有特定的目标。这些问题类型通常应用于现实世界中,例如机器人控制、物流、互联网中的复杂行为以及计算机和网络安全。
一般来说,规划议题包括初始的已知情况、特定的目标和一组允许的操作或步骤之间的转换。规划的过程是一系列或一组动作,当执行正确时,执行实体将从初始状态更改为满足目标条件的状态。但在计算上,即使使用简单的问题规范语言,规划也是一个难题。当规划受到有关问题影响时,即使问题很简单,定义域状态的搜索量也是指数级的,搜索不能覆盖到所有状态空间表示。因此,我们的目标是开发出有效的子表示算法,以便通过搜索来实现相关的目标。目前的研究主要集中在开发新的搜索算法和新的动作和状态表示,这将使规划更容易。当多智能体相互作用时,在学习和决策之间找到平衡是至关重要的,为了学习而进行探索,做出决策则可能导致不满意的结果。
在现实中,许多问题是随机的、不确定的。比如如何买一款性价比非常好的汽车这件事,我们常常没有任何头绪。购买决策常常受到很多方面的影响,因此有必要考虑它的风险和不确定性。对于所有意图和目的,在决策时随机域更具挑战性,但他们比近似值的确定域更加灵活。简化掉假设条件使在实践中进行自动化决策成为可能。大量的问题公式化可以用来表示随机域中的多个层面和决策过程,最著名的是决策网络和马尔可夫决策过程。
许多应用程序需要逻辑(非随机)和随机元素的组合,如机器人的控制需要高层次的逻辑规范与低级别的概率传感器模型表示组合。处理自然语言是另一个应用这一假设的领域,因为高层次的逻辑知识需要与低层次的文本和口头信号进行组合。
4.语言和交互
处理语言是人工智能领域的基础之一,它分为两个领域:计算语言学(CL)和自然语言处理(NLP)。两者的不同之处在于,计算语言学研究专注于使用计算机进行语言分析,而自然语言处理包括所有应用研究,如机器翻译、提问与回答(Q&A)、文档汇总、信息提取、命名等。换言之,自然语言处理需要一个特定的任务,并不是研究学科本身。自然语言处理包括:词性标注,自然语言理解,自然语言生成,自动汇总,命名实体识别,解析,语音识别,情绪分析,语言、主题和词分割,参考解析,话语分析,机器翻译,词义消歧,形态学分割,提问和回答,关系提取,句子分割等。
人工智能的核心观点认为,一阶谓词逻辑(一阶谓词演算,FOPC)足以表示语言和知识。本文认为逻辑适用于自然语言的语义。虽然尝试使用逻辑语义作为表示内容的关键在人工智能和语言学领域取得了进展,但在将英语转换成形式逻辑的程序上却收效甚微。迄今为止,心理学界还没有提供证据证明这种转换成逻辑的方式与人们储存和操纵“意义”的方式相一致。因此,将一种语言转换成一阶谓词演算的能力仍然是一个难以捉摸的目标。毫无疑问,自然语言处理应用程序需要在句子表示之间建立逻辑推理,但是,如果这些只是应用程序的一部分,则不清楚它们与对应的自然语言的基本含义有什么关系,因为逻辑结构最初的任务是推理。这和其他因素一起促成了三种不同的立场。
立场一:逻辑推理与句子的意思紧密相连,知道句子的意思等同于认为:推理和逻辑是自然语言处理最好的方法;
立场二:意义存在于逻辑之外,因为许多语义标记或标注被附加到词语上以表达它们的意义,这种注释的形式现在非常普遍。
立场三:一般来说,逻辑和形式系统的谓词似乎与人类语言不同,其术语是实际上出现的词。
将统计和人工智能方法引入自然语言处理领域是最新的发展趋势。一般的策略是学习语言是如何处理的,最好是以类人的方式来处理,尽管这不是一个前提条件。机器学习要基于人工翻译的一个极其庞大的语言库。这通常意味着有必要学习注释是如何分配的,或者如何将词类(单词和标点符号分类成单词类型)、语义标记、标注添加到语言库中,这些都是基于由人类编写的语言库,因此可以保证是正确的。在监督学习情况下,机器学习能够学习部分语音标记与人们在文本中注释过的单词之间的潜在联系,从而使算法也能够注释新的、以前未知的文本。轻监督和无监督学习方式与之相同。当没有人为注释时,所呈现的唯一数据就是语言中的文本,只要该文本与其他语言中的内容相同,或能在没有明确目标的同义词库数据中找到相关文本集,就可使用无监督学习。关于人工智能和语言,信息检索(IR)和信息提取(IE)起着重要作用。信息检索的主要任务是根据内容对文本进行分组,而信息提取则从文本中提取类似的事实元素,或者用来回答关于文本内容的问题,两者之间有很强的相关性。不仅是长文本,单个句子也可以被视为一个文档。这一方法正被用于客户和系统之间的相互交流,如当驾驶者询问车载电脑车主的旅程手册内容,一旦语言输入被转换成文本中的问题,问题的语义内容可被用作在手册中查找答案的基础,然后提取答案并反馈给驾驶者。
5.智能体和行为
在传统的人工智能中,人们主要集中在单个的、孤立的软件系统上,由于预先定义了规则,这些系统表现得相当不灵活。然而,新技术及其应用需要建立人工实体,这些实体的灵活性、适应性和自主性更高,并且可作为多智能体系统中的社会单元。传统人工智能,如“物理符号系统假说”或审议系统认为:行为理论建立了系统决策和动作的方式,在逻辑上一定能够体现在必须执行动作的独立系统中。基于以上规则,系统必须接受这样的描述,在这个世界里,它正在发现自己,包括所需的目标状态,一组动作,以及执行这些动作的先决条件和每个动作的结果列表。事实证明,即使在处理简单问题时,计算复杂性使得任何有时间限制的系统都变得毫无用处,这对符号人工智能产生了巨大的影响,从而导致了反应式架构的发展。这些架构遵循“if-then”规则,将输入直接转换为任务。这样导致的问题是系统学习的是程序而不是陈述性知识,因此他们学习的属性不容易在类似的情况下得到推广。许多人试图将审议和反应系统结合起来,但似乎把重点放在审议系统上或者松散发展的反应系统上都不切实际,两者都侧重也不是最佳选择。
(1)以智能体为中心的新方法
该方法遵循如下原则:
自执行
自执行描述了系统自决策和执行任务的能力,其目标是让系统在自我控制的情况下自主行动。传统的软件执行指定的调用程序,没有其他选择,而智能体基于自己的信仰(Beliefs)、愿望(Desires)和意图(Intentions)做出决定,这一智能体被称为BDI智能体。
自适应
由于不可能预测智能体会遇到的所有情况,这些智能体必须能够灵活地行动。他们必须能够从环境中学习并适应环境。如果不只是自然环境不确定,而且这一智能体也是多极智能体系统的一部分,任务将更加困难。只有非静态和自足的环境BDI智能体才被允许有效使用,如增强学习,其可以用来弥补对世界知识的缺乏。智能体位于一个由一组可能的状态描述的环境中,增强学习中由环境提供奖励(强化)信号对智能体产生动作的好坏做出一种评价,这将导致一系列的状态、动作和奖励,而迫使智能体决定一个奖励最大化的行动过程。
社会化
在一个多实体运行的环境中,如果需要一个共同的目标,智能体必须认清他们的组织和参与者。基于智能体的系统可被用于个性化用户界面,如中间件,也可用于竞赛中,如机器人世界杯。在道路上只有自动驾驶汽车的情况下,智能体的自主性不是唯一不可缺少的组成部分,车辆之间的通信也很重要。车辆之间实现信息交换并作为一个群体运行,车辆互联同样重要。自动驾驶汽车之间的协调将导致交通流量的优化,使得交通阻塞和事故几乎不会发生。
(2)多智能体
在实现多智能体行为的过程中,存在各种各样的方法,主要区别在于设计人员对单个智能体的控制程度。最典型的两个系统是:分布式问题解决系统(DPS)、多智能体系统(MAS)。
DPS系统允许一个设计人员控制域中的每个单独的智能体,从而分布解决多智能体任务。相比之下,MAS系统有多个设计者,每个设计者只能影响他们自己的智能体,不能访问任何其他智能体。在这种情况下,交互协议的设计非常重要。在DPS系统中,智能体共同努力实现一个目标或解决问题,然而在MAS系统中,每个智能体都有单独的动机,希望实现自己的目标并自己的利益最大化。DPS研究的目标是找到解决问题的协作策略,同时使为实现目的所需的通信水平最小化。与此同时,MAS研究者正在研究协调交互,即如何为自执行智能体沟通找到共同的基础,并采取一致的行动。在理想的情况下,道路上只有一种自动驾驶汽车的世界将会是一个DPS世界。然而,目前OEM的竞争意味着MAS世界将会首先成为现实。换句话说,汽车制造商之间的沟通和谈判将占据中心地位(参见纳什均衡)。
(3)多智能体学习
多智能体学习(MAL)最近才被给予一定程度的关注。这一领域的主要问题包括确定应该使用哪些技术以及“多智能体学习”的确切含义。目前的机器学习方法是为了培训单个智能体而开发的,而MAL专注于分布式学习。“分布式”并不一定意味着使用了一个神经网络,而是许多相同的操作运行过程可以被并行化训练,也就是:?一个问题被分解为子问题,单个智能体学习这些子问题以便多智能体利用综合知识来解决主要问题;?许多智能体试图通过相互竞争来独立解决同一问题;?增强学习是在此背景下使用的一种方法。
来源:e-works 专家:胡志强
数据科学和机器学习对于未来的汽车工业来说,是非常关键的技术,因为这两项技术正在被用于汽车产品、汽车工艺优化和自动学习。在汽车工业研发、采购、物流、制造、市场运营、销售和售后、客户服务等环节,甚至更广泛的领域,工程技术人员正在探索应用人工智能技术的可能性。
著:(德)Martin Hofmann (奥地利)Florian Neukart (德)Thomas Bäck
编译:胡志强(中国汽车工程学会)
四、汽车工业中的数据挖掘和人工智能
抽象来说,汽车行业的价值链可以大致描述为多个子流程:?研发;?采购;?物流;④制造;⑤市场营销;⑥销售、零售和售后;⑦连接顾客。流程中每一个领域都非常重要,又非常复杂,因此对这些流程中数据挖掘和人工智能应用的描述仅局限于概述。
1.研发
汽车的研发已经基本上成为了一个虚拟的过程,现在所有汽车制造商都公认汽车研发是具有艺术性的工作。CAD模型和仿真在汽车开发过程的各个阶段都已经被广泛采用。
在汽车研发过程中,很少使用进化策略或遗传算法和相关方法对产品进行优化,即使这些方法在开发过程中非常精确,并经常能产生令人印象深刻的结果。在开发过程中,多标准优化,如车身安全和噪声、NVH需要同时优化,由于计算时间的要求过高仍然很少使用。然而,正是这种方法提供了巨大的潜力,当涉及到多个部门共同设计时,就能更快更有效地达成一致。
在分析和进一步使用仿真结果的过程中,数据挖掘已经被频繁地用于生成“响应面”。在这个应用中,数据挖掘方法(支持向量机和随机森林的从线性模型到高斯过程的全部方法)在相关仿真结果的基础上被用于学习非线性回归模型,该模型作为仿真输入向量的近似表示。由于该模型需要具有良好的插值特性,因此允许对新输入向量模型的预测质量进行评估的交叉验证方法通常被用于训练算法。使用监督学习方法背后的目标常常是用一个快速近似模型代替计算耗时的仿真。此外,这允许在开发过程中更快地执行耗时的调整过程,并提高透明度。
例如在部门间的会议期间,最好能立即评估形成组件的几何变化的可行性,而不是运行复杂的仿真然后等待一两天出结果。
这些应用程序通常集中在特定的开发领域,这是由于仿真数据管理作为数据生成、数据使用和分析之间的中心接口,存在瓶颈。这尤其适用于仿真数据跨多个部门、变型和使用模型系列时,对于持续学习的开发组织来说,实际使用数据是非常必要的。目前的实际情况是,特定部门的仿真数据通常以文件树的形式存储在部门的各自文件系统中,造成了很难使用基于机器学习的方法进行评估。此外,一个单独的仿真数据可能已经非常庞大,因此基于机器学习进行分析迫切需要有效的存储解决方案。
虽然使用单个应用程序进行模拟仿真和建立非线性回归模型已经成为标准,但是其优化分析功能很少被使用。特别是在多学科以及跨部门的机器学习、基于历史数据的学习和跨模型学习等重要问题上,在提高效率方面存在巨大的完全未被开发的潜力。
2.采购
采购流程使用到各种各样的数据,包括供应商、采购价格、折扣、交付可靠性、小时费率、原材料规格和其他变量。因此,计算KPI用于评估和排名供应商,无论如何都不会产生任何问题。数据挖掘方法允许使用可用的数据,例如,生成预测,识别对产品性能标准有最大的影响的重要的供应商特征,或者预测交付的可靠性。在优化分析方面,汽车制造商为了达到最优条件而对某一些具体参数施加影响也很重要。
总的来说,金融业务领域是优化分析应用得非常好的一个领域,因为可用的数据包含关于公司主要成功因素的信息。连续监测是值得一提的控制案例。这种监测是建立在财务和控制数据的基础上的,被不断准备和报告。这些数据也可以用于预测分析,以自动生成未来一周或一月的预测。在优化分析方面,对关键影响参数的分析以及建议的优化操作也可以添加到上述预测中。
目前,这些研究显得离现实还很遥远,但它们确实传达了一种理念,就是在采购、金融和监测方面存在哪些可能。
3.物流
采购物流指从货物采购、运送物资到收货仓库的全过程链。当涉及到商品的采购时,大量的历史价格信息可以用于数据挖掘目的,可以用来产生价格预测,结合交付可靠性数据,能够分析供应商的表现。在装运环节,优化分析可以用来识别和优化关键成本因素。
类似的情况也适用于生产物流,它涉及规划、控制和监测内部运输、处理和存储过程。根据可用数据的粒度可以确定瓶颈,优化库存水平,并最小化所需时间。
分销物流涉及将产品运送到客户的所有方面,包括提供新车和二手车的供应商。由于这里考虑的主要因素是相关的成本和交付的可靠性,因此需要考虑多类型的联运供应链的所有子组件,从铁路到轮船和货车运输,再到诸如货车上的个别车辆的最佳组合等。在二手车物流方面,优化分析可用于在适当的基础上为不同的分销渠道(如拍卖、互联网等)分配车辆,并预测汽车特定转售价值,以最大限度地提高销售收入总额。通用汽车早在2003之前就实施了这种方法,并结合预期的特定车辆销售收入进行了预测。
备件物流,即备件供应和存储。基于数据驱动对备件的数量和库存的预测是数据挖掘的一个重要的潜在应用领域,因为它可以显著地降低存储成本。
数据分析和优化必须与物流过程的仿真相结合,因为对物流的评估和优化需要对物流链的特定方面进行仿真。另一个例子是供应商网络,如果可能的话,在更深入的理解的基础上,数据分析和优化可以用来帮助识别和避免物流链中关键路径的危机。这一点尤其重要,因为供应商在关键路径上交货失败将导致汽车制造商停产。对供应商网络进行仿真不仅可以识别出这种类型的瓶颈,而且还可以对其进行优化。经验表明,因为汽车制造商的采购和物流是不透明的,为了尽可能详细、准确而使仿真能详细映射所有子流程和供应商之间的交互关系,如尝试将二级和三级供应商包括在内的话,将是异常复杂的。
这就是为什么数据驱动建模应该被看作是一种选择。当使用这种方法时,通过数据挖掘方法从供应商网络(供应商、产品、日期、交货期等)和物流(库存水平、交货频率、生产序列)中获得一个模型。然后,该模型可以被用作预测模型,如预测特定零件的交货延迟对生产过程的影响。此外,使用优化分析也可以用于个别案例,如进行最坏情况分析,即确定会延迟交货带来生产停工的零部件供应商。这个例子非常清楚地表明,在场景分析的意义上,优化也可以用来确定一个汽车制造商的最坏情况,然后优化未来的对策。
4.制造
生产过程的每一步都将受益于数据挖掘的持续使用,因此对所有制造工艺参数的持续记录和存储至关重要。由于优化的主要目标通常是提高质量或减少缺陷的发生率,记录出现的缺陷和缺陷类型的数据是必需的,并且必须有可能清晰地将这些数据分配给制造参数。这种方法可以用来实现显著的改进,特别是在新的生产过程中,如使用碳纤维增强复合材料的制造过程。其他潜在的优化领域包括能源消耗和每个时间单元内生产流程的吞吐量。在这一情景中,优化分析可以在线应用,也可以离线。
在离线使用应用程序时,分析要对流程有重要影响的变量进行识别。与此同时,分析程序还要导出影响变量和目标之间的相关性,并且得出了可以改进目标的操作。通常,这种分析侧重于特定的问题或过程中的紧急问题,并且能够非常有效地提供解决方案。但是,它们不适合用于持续的流程优化。如果对结果进行分析、解释和执行需要进行人为干预,那么这些步骤可以由数据科学家或统计学家进行,并需要与制造过程专家进行讨论。
就在线应用而言,这一过程是自动化的,这是非常重要的差异,这导致了数据获取和集成、数据预处理、建模和优化的全新挑战。在这些应用程序中,甚至需要自动地提供流程和质量数据,因为提供的集成数据可以在任何时候用作建模的基础。这一点非常重要,因为在对流程进行更改时,必须执行建模。然后由此产生的预测模型自动用于优化目的,并能够预测的质量,并建议或直接实施行动,甚至进一步,优化相关的目标变量。实现这种具有自动建模和优化技术的优化分析,在技术上是可行的,但对于大多数用户来说,它还遥不可及。
汽车制造过程中优化分析潜在的应用覆盖常规材料和新材料成型技术、车身制造、防腐和喷漆、动力总成制造和总装等,几乎可以应用于所有的子步骤。对所有工艺步骤的综合分析,包括所有可能的影响因素及其对整体质量的影响分析,未来都会变成现实。这类似于对所有子过程数据进行整合的情况。
5.市场营销
营销的重点是尽可能有效地接触到最终消费者,并说服他们成为公司的客户或保留住已有客户。营销活动的成功可以用销售数字来衡量,因此从多个因素中区分出营销效果因素是很重要的,如客户的财务状况。因此,衡量营销活动的成功是一项复杂的工作,因为多种影响因素在其中起着作用。
如果能将优化分析用于市场营销,在好不过,因为这是我们想要的结果,通过市场活动实现用最少的投入(如人力资源、预算等)取得最大销售额的优化目标,那么优化营销组合,优化做事的前后执行顺序都值得考虑。市场预测模型,例如那些由特定的市场营销活动导致在某时间段增长的销售数据模型,仅仅是需要数据挖掘结果的一部分。多维度决策支持在这种情况下也起着决定性作用。
在市场营销中,使用数据挖掘的两个极好的案例是客户流失率和客户忠诚度。在一个饱和的市场,汽车制造商的首要任务是防止客户流失,因此要制定和实施最优的解决方案。这需要很多信息,如客户所属群体特征、客户满意度、客户对车辆的期望、竞争对手的相关数据、车型、价格等。由于某些数据的主观性,例如满意度调查中得到个人满意度,个性化流失率预测和最佳决策,如个性化折扣、加油或现金奖励、大礼包等,总是息息相关又纷繁复杂。
由于要对大数据进行保密处理,不能有个人数据记录,除非客户明确同意给予个人信息获得量身定制的产品,否则分析和优化只能在表示匿名客户子集特征的客户级别上进行。
客户忠诚度与优化这一主题密切相关,如何保持、提升现有客户的忠诚度已经是迫在眉睫的任务。同样,车型升级换代与优化分析也有着千丝万缕的关系,即为现有客户提供更有价值的车型作为他们下一款要购买的产品并获得成功。显然,这些问题是复杂的,需要客户细分、市场营销和相关销售成功的案例信息以促进分析。然而,这些数据大多无用。由于数据的不确定性,因此具有不同程度的失真。
类似的考虑也适用于优化营销组合,包括公平参与的问题。在这种情况下,数据需要长时间收集,以便可以评估并得出结论。对于邮件促销这类个性化营销活动,要评价所选目标组的特性,回报率对于数据分析和相应的活动优化是一个更有可能的目标。
原则上,在市场营销领域也可以找到非常有前景的优化分析应用程序。然而,数据收集和数据保护的复杂性,以及数据采集的部分不准确性,意味着需要对数据收集策略长期进行仔细规划的方法。如果在数据挖掘过程中需要考虑品牌形象等“软”因素,那么这个问题就会变得更加复杂。在这种情况下,所有数据都有一定的不确定性,以及相应的分析(“最重要的品牌形象驱动因素是什么?”“如何改进品牌形象?”)更适合于确定趋势而不是得出定量结论。但是,在优化范围内,有可能确定一个行为是否会产生积极或消极的影响,从而确定允许方向,然后决定行动的方向。
6.销售、零售和售后
这一领域有多种潜在应用和现有应用案例。由于最终客户体现的人的因素起着至关重要的作用,因此客观的数据和主观数据都要考虑;客观数据如销售数据、个人的价格折扣、经销商活动等;主观数据如基于调查的顾客满意度分析或涉及品牌形象、细分率、品牌忠诚度等许多主题的第三方市场研究等。同时,获取和集成各种数据源是进行分析的必要条件,以便最终能够对评价的潜在主观性进行正确分析,这一过程目前在很大程度上取决于进行分析的数据科学家的专业知识。
市场营销与销售结果密切相关。毕竟,最终也是根据销售数字来衡量营销活动的成功程度。市场营销活动和销售的综合分析,包括媒体分布、发布频率、营销活动成本等,可用于优化市场活动的成本和效益,这种情况通常使用基于投资组合的方法。这意味着,最优先考虑的是一系列营销活动及其安排的最佳选择,而不是只关注单一的营销活动。因此,关键问题是多标准决策与优化支持。近年来,由于采用了进化算法和基于组合的优化标准,优化分析在这方面取得了决定性的突破。然而,销售优化分析在汽车行业的应用仍然局限在非常有限的范围内。
同样,客户反馈、维修和制造也有潜在的交互作用,客户满意度可以用来获得软因素,维修可以用来获得硬因素,然后可以与特定车辆的生产数据相结合,并进行分析。用这一方法可以确定在工厂里发现不了或不可预见的影响质量的成因。这使得质量缺陷可以提前预测并可以使用优化分析来减少它们的发生。尽管如此,还需要将来自不同领域的数据,如制造、维修和售后等环节的数据结合起来,以便于分析。
对于二手车来说,剩余价值在公司的车队或租车业务中起着至关重要的作用,因为有相当数量的车辆将作为资产进入相应的资产负债表,并具有相应的残值。如今,汽车制造商通常将这种风险转移到银行或租赁公司,虽然这些公司可能又是汽车制造集团的一部分。数据挖掘和预测分析可以在正确评估资产方面起决定性作用,十年前,美国汽车制造商已经付诸实践了。非线性预测模型可以与公司自己的销售数据一起使用,在车辆水平上生成个性化的、特定于设备的剩余价值预测,这比目前作为市场标准的模型更为准确。这也使得优化分销渠道成为可能,甚至分配远在天边的二手车到附近的汽车拍卖场,以这样的方式最大限度地提高公司全球的销售成功率。
关于更详细的销售技巧,很明显,在购买车辆或将来暂时使用可用车辆时,每个客户的兴趣和偏好是一个重要的考虑因素。更个性化知识,如关于消费者的社会人口学因素,他们的购买行为,甚至他们在汽车制造商网站上的点击行为,以及他们个人的驾驶行为和车辆,被了解得越准确将越有可能满足消费者的需要,为他们提供合适的车辆型号、性能和报价以及提供最佳的金融服务。
7.连接客户
虽然这一术语目前还没有被认可,但它描述了一个未来,客户和他们的车辆都能与最先进的信息技术充分融合在一起。这与营销和销售问题密切相关,如客户忠诚度、个性化用户界面、一般车辆行为以及其他愿景。通过网络互联和使用智能算法,车辆可以对语言命令做出反应,并搜索答案,如可以直接与导航系统通信并更改目的地。车辆之间的通信使人们能够在道路和交通条件下收集和交换信息,这比通过集中式系统获得的信息更为精确和及时。例如路面突然形成了薄冰,它经常是局部的、暂时的,可以很容易被车辆检测到并且以警告的形式传递给其他车辆。
来源:e-works 专家:胡志强
数据科学和机器学习对于未来的汽车工业来说,是非常关键的技术,因为这两项技术正在被用于汽车产品、汽车工艺优化和自动学习。在汽车工业研发、采购、物流、制造、市场运营、销售和售后、客户服务等环节,甚至更广泛的领域,工程技术人员正在探索应用人工智能技术的可能性。
著:(德)Martin Hofmann (奥地利)Florian Neukart (德)Thomas Bäck
编译:胡志强(中国汽车工程学会)
五、愿景
车辆开发已经使用了“模块化系统”,允许在多个模型系列中使用组件。与此同时,开发周期也越来越短。然而,虚拟汽车开发领域尚未看到任何有效的尝试以机器学习的方法来促进自主学习,如在建立历史知识的基础上提取相关知识,或建立适用于多种车型系列的知识,以协助未来的项目发展和更有效的组织。本课题与数据管理,与仿真和优化数据中数据挖掘的复杂性,与界定车辆研发知识的适当表示存在的难题等紧密契合。此外,这种方法受到车辆开发过程的组织框架的限制,车辆开发过程通常只针对正在开发的模型。此外,由于数据的异构性(有数字数据、图像、视频文件等)和数据量(单一仿真便有兆兆字节),“模拟数据中的数据挖掘”问题非常复杂,目前充其量只能试探性地进行一些研究。
由于使用了预测性维护,新的服务正在成为可能。有关个人驾驶行为知识的自动学习,可用于非常准确地预测所需的维修时间间隔。车主可以使用这些信息来及时安排汽车维修预约,车载电脑可以将维修预约时间的安排与车主的工作计划进行匹配,目前实现这一愿景比实现冷库自动对杂货进行盘点更容易。
本地授权维修店利用自动化系统可以实时地安排最佳服务预约,在考虑到员工的可用性的情况下,尽可能均匀地分配工作。
车辆的学习和适应能力实际上有无限的潜力。车辆可以识别和分类驾驶员的驾驶行为,将它们分为特定的驾驶员类型。基于此,车辆本身可以对电子用户界面系统进行调整,换句话说,它们可以提供远远超出单纯的汽车特性的个性化和自适应的驱动程序选项。当消费者购买一辆新车时,该消费者作为驾驶者的相关信息可以转移到一辆新车上,确保消费者在熟悉的环境中立即可以驾驶新车。
1. 实现自动驾驶超级智能体
汽车工业将继续研究自动驾驶汽车,而且越来越多的汽车企业会积极参与其中,“移动客厅”不再是一个令人难以置信的场景。目前发展的重点是完全自动驾驶,理由很充分:在世界大部分地区不允许自动驾驶汽车上路,如果允许的话也是凤毛麟角。这意味着,作为智能体的汽车不能与其他车辆进行通信,由人驾驶的车辆依旧根据驾驶者的观察调整驾驶行为。驾驶者依靠导航系统获得交通拥堵信息和替代路线建议。然而,我们假设现在每辆车都是一个完全智能体,那么将实现两个目标:优化交通流量;预防交通事故。
在这种情况下,智能体之间通过交流和协商,如协调各自行驶线路、速度、交流路况等,将路程时间最小化。不可预见的情况,如天气变化导致的道路损坏和拥堵,虽然不能完全避免,但遭遇的可能性会降到最低。这类信息会被立即传递到周边的所有车辆,然后启动一轮新的优化周期。此外,预测性维护将最大限度地减少车辆的损坏。历史数据被分析和用来预测故障可能发生的时间,智能体在不需要通知车主的情况自动依据车主的工作日历预约维修服务,并自动驾驶车辆到维修店。万一在行驶中遇到事故导致车辆无法继续行驶,智能体将立即通过“故障频道”与相关服务机构或控制中心进行联系,自动驾驶拖车立即出发提供援助,理想情况是再带一辆自动驾驶汽车进行替换。
因此自动驾驶智能体将达到:?自执行,即自动驾驶汽车遵循通往目的地的路线行驶;?自适应,即对无法预见的情况,如道路关闭或出现事故,做出反应;?社会化,即与其他自动驾驶车辆一起实现交通流量优化并避免交通事故。
结合出租车业务,出租车公司也可以组建无人驾驶出租车队,依据以往客户使用出租车的数据预先派遣无人驾驶车辆到达指定地点提前等待客户。另外,也可以依据使用数据来提供特定时间段或特定事件的服务,如球赛、大型会议等。
如果道路也实现了数字化,即沥青路面被载有OLED技术的玻璃路面替代,那么交通的动态管理极有可能实现。从材料工程的角度看,这一方案是可行的:?玻璃表面结构也可以做成防滑方式,即使在雨中也可以防滑;?玻璃路面进行柔性设计,能做到卡车驶于上也坚不可破;?显示屏散发的余热可以用来加热路面,防止冬季路面结冰。
2.实现工厂优化集成
通过使用软件分析客户和维修厂的报告,以及生产现场出现的缺陷数据,就可以自动地分析出特定车型或零部件是否会再次出现缺陷,以便及早发现并消除潜在问题,避免大规模召回。制造缺陷的成因是多方面的,如采用了有质量缺陷的零部件或在生产过程中出现错误等。对一家规模化的汽车制造商来说,每天有上千台车下线,因此搞清楚原因并快速行动是最重要的。假设2017年10月份对客户报告和维修店报告的文本分析表明,从2017年7月起交付的某款车型的一侧泊车灯故障显著增加,“显著”意味从2017年1月到10月该款车的销售呈上升趋势。通过分析故障链和修复链,可以确定造成故障或缺陷成因,或者是否其他车型存在同样问题。如果缺陷是由生产机器人造成的生产中的错误,则可以追溯到是硬件故障还是软件错误,是不正确还是不完整的配置造成的。在最坏的情况下,甚至需要更新控制系统以消除错误。但是,因为打补丁的工作只能在制造商收到并审查问题报告之后才开始,所以不可能立即更新软件。同样,由于多轴机械手可以自由支配的自由度非常高,重新配置机器人是一个高度复杂的任务。简言之,做出这样的修正费时、费力,而且即使在所有理想情况下,都会存在后遗症。
使用人工智能方法可以在多个点优化这一过程。
人工智能研究涉及的领域之一是使系统能够自动从数据中提取和解释知识(见图5),尽管目前这种程度仍然很低。
图5 人工智能知识获取步骤
与数据相比,知识是构成行动的基础,而行动的结果可以反馈到数据中,从而形成新的知识的基础。
如果一个具有学习和理解数据能力的智能体获得了自我行动或其他智能体行动的结果,并能够自由采取行动达到目标,那么该智能体将自执行实现目标。生物智能体,如人或动物,都能在无需其他控制或无需在数据转化为知识这一过程的监督下直接做到这一点。例如,如果在DIY活动中由于角度过大,将一个钉子钉入木板时发生劈裂,我们的大脑会将角度、木材的特性、击锤的力量等知识和经验转化成意识,减少我们范同样错误的几率。
先前讨论的人工智能的特定领域“机器学习”研究的重点是模仿这种行为。使用机器学习软件能够从特定问题域中的数据中学习,并根据过去的事件推断如何解决新事件,这为我们打开了一个通往新世界的大门。机器学习在数据分析领域并不是什么新鲜事,它已经存在了很多年,但现在新的研究是在特定的时间内计算一个拥有兆兆级数据量的高度复杂模型。如果我们把生产厂当为一个追求生产出无缺陷汽车目的的有机体,很明显,赋予这一有机体获得相关数据的能力将有助于有机体自身的发展和改进。
这一过程将经历两个阶段。
(1)数据学习和应用经验
数据学习意味着机器人不能仅仅根据静态编程操作,它也必须能够使用机器学习方法自主地实现定义的学习目标。对于可能发生的任何生产错误,最重要的是机器人要首先学习导致这些错误的操作,而不是基于流程图或工程图进行编程。例如,假设上述泊车灯问题不仅被识别出来,而且其原因也可以追溯到生产中的一个问题,可能是把泊车灯推到插座里的机器人操作过硬。现在所需要的就是确定纠正措施的学习目标。让我们假设其他生产厂的机器人没有发生错误,而且泊车灯被正确安装,我们作为人类能够在视觉上识别和解释正确工作的机器人和不正确机器人之间的区别,那么犯错误的机器人也应该能够以类似的方式学习。这里的区别在于所涉及的感知类型,数字系统在同样的情景下可以比我们看得更多更清楚。
尽管通过软件实现机器学习方法的内部工作方式在学习过程中很少完全透明,甚至对学习系统的开发人员来说也一样,但是由于组件的随机性和复杂性,操作本身应该是透明的,也就是说,不必关心系统是怎么做的,而要关心它做了什么。机器人需要适应其控制系统的信号来重新启动学习过程,其应该是机器人的机械手和执行器正确工作的运动信号,并可以通过现今能达到的精度值来进行定义和测量。这并不需要任何人为干预,因为系统的完整透明性是通过持续地分析生产过程中积累的数据来保证的。在现场缺陷识别和传输过程中,也不需要任何人为分析。基于对维修店和客户报告的语言分析,再加上维修数据,我们已经能很快识别出哪些问题是由生产引起的。将这些数据相应地传递给相关的智能体并允许这些智能体从缺陷中学习并纠正自己。
(2)智慧工厂
如果生产厂需要进行学习,而智能体使用的机器学习方法灵活性不够,可以将工厂作为一个由子系统组成的完整生物有机体,像人一样使用自然语言表达,理解语境,并有能力进行解释。对语境的理解和解释一直是人工智能研究领域的一大挑战。人工智能理论把语境看作是对一种状态的共同解释,包括状态本身和其相关的整体情境。与生产工厂相关的语境包括能用自然语言表达或能用其他方式表达的与生产相关的任何事情。下面的简化场景有助于理解这个概念:让我们假设一家汽车企业管理委员会正在开会对一款汽车的车身做最终设计评审。
“我们决定对下一代车型进行“改款”,请在原车型基础上建立一个模型”,当委员会成员说的时候,一个3D模型就漂浮在参加会议的每个成员佩戴的增强现实眼镜里。
在这种情况下,使用进化算法进行建模是可以想象的,但仅限于可以实际构建的可能的组合。只要所涉及的参数已经减少,所需的计算能力有效,就可以将仿真时间从几小时缩短到几分钟,从而在会议期间对组件或组件组合进行动态变形。
“根据该模型,我决定用26分钟来调整我的机器人的程序。为了组装新汽车底盘,工具x1、y?必须用工具x2、y2在机器人x、y工位进行替换。样车的生产将在6小时 37分钟内完成。”工厂智能体说。
这一场景我们已经在科幻电影《钢铁侠》系列中看到,但其实际上离我们并不遥远。
当然,智慧工厂被上面的案例大大简化了,但它仍然能够清晰揭示工厂未来发展的可能性。为了了解需要做什么,生产工厂必须了解车身是什么,什么是“改款”等,并从模型中理解参数并输出,从而可以将它们转换为生产步骤。转化为生产步骤的过程需要对机器人的个体机器学习组件进行训练,或者根据模型数据对其程序进行编制或改进,这样就可以实现所有的步骤,从切割金属板材到装配和实现车型变脸。虽然这包括了各种各样的方法,从自然语言的理解和语言的生成、规划、优化,自主生成模型等,但它绝对可以实现。
3.实现企业自运行
企业在策划营销活动或响应消费者需求时,必须进行全盘考虑,如监测销售随时间推移是如何变化的;预测市场将如何发展和哪些客户可能会流失;应对金融危机;对灾难或政局的潜在影响迅速做出解读等。今天我们已经能够做到,但需要相应的数据支持。我们对某一个人的数据并不在意,但对能从众多个体数据中提取什么十分关注。例如只要通过分析1600个以上的指标,我们就可以预测市场的某些财务指标将如何移动,并做出应对措施;或者我们可以非常准确的预测哪些客户群体对正在研发的车型感兴趣及其诉求,然后据此策划营销活动。事实上,我们能够完全准确地配置出适合特定消费者群体品味的车型。我们依据获得的知识做出决策,调整生产水平,准备营销计划,推出适合特定消费群体的车型。
准备营销计划是一个静态的过程,即做什么事是确定的,但是怎么做仍然是可变的。一旦能够向其他人解释清楚如何做和为什么做这件事,这些信息就可以提供给算法。例如在“我们”汽车生产厂附近竞争对手又开了一家新生产厂,“我们”可以预测这将导致预期销售量下降,甚至能预测出预期销售量下降的幅度,在这里,“我们”指为这个特定案例中开发的算法。由于这种情况不止一次发生,而且每次都要求几乎相同的输入参数,我们可以使用相同的算法来预测其他地区类似的事件。这使得利用过去的营销活动知识来组织未来的活动成为可能。总之,算法将制定营销计划。
例如,要实现考虑成本效益的同时实现客户利益最大化,算法可以采取内部数据(如销售数据)和外部数据(如股票市场趋势、财务指标)自动生成输出一个“营销计划”。如果企业被允许使用自己的资源并自主行动,那么它就能够自主应对市场波动,补贴脆弱的供应商。任何可能性都存在,这一设想今天已经在技术上构思过。连续监测股票价格,理解和解释新闻,考虑人口结构变化等,这只涉及企业自运行较少的相关领域,其可以综合运用自然语言理解、专家系统和逻辑推理来实现。在人工智能研究领域中,语言和视觉信息经常作为理解事物的基础,因为我们人类也使用语言和视觉刺激进行学习和领悟。
六、总结
人工智能已经走进我们的日常生活,不再仅仅是科幻小说的主题。目前,人工智能主要用于以下领域:?处理分析数据;?在大量异构数据的基础上快速做出合理的决策域;?需要保持警觉的单调活动。
在处理分析数据方面,现在我们只能使用决策支持系统,不过未来几年,我们将能够使用更多独立的决策系统。特别是在数据分析方面,我们正在开发针对特定问题的独立分析解决方案,尽管这些解决方案还不能在不同的场景中使用。例如,为检测股票价格异常变动而开发的解决方案不能用来解读图像的内容。人工智能系统需要集成各个相互作用的组件,从而能够处理目前只有人类能够胜任的日益复杂的任务,即便未来还是如此,但是这已经足够了,今天我们欣喜若狂可以目睹这一发展趋势。
如果对于股市系统的当前数据进行处理的程序还将可以依据从社交网站或个人博客上提取的新闻、视频和评论追踪和分析政局的发展,或监控和预测财务指标,那么程序需要许多不同的子组件集成,对这些子组件互动和合作的研究成为了当前的课题。
后记
文章是根据大众汽车集团执行副总裁、大众汽车股份公司首席信息官Martin Hofmann博士,大众汽车美国公司首席数据科学家Florian Neukart博士,莱顿大学计算机科学教授Thomas Bäck博士合著文章《Artificial Intelligence and Data Science in the Automotive Industry》翻译、加工整理而成,译者略有修改。文章经过上海汽车集团股份有限公司人工智能实验室总监金忠孝博士勘校,在此表示感谢!
文章中所涉及的技术目前已经在汽车制造商的生产实践中付诸了实施。如宝马汽车公司在其发布的新闻《Smart Data Analytics: BMW Group relies on intelligent use of production data for efficient processes and premium quality》中显示,宝马汽车公司通过数据挖掘、机器视觉、优化分析等人工智能的应用在汽车制造过程中实现了多项智能质量管控和设备预测性维护技术。
在人工智能技术发展的大潮下,国际汽车制造商迅速顺应这一发展趋势做出了转型。奔驰-戴姆勒汽车公司提出CASE(Connected、Autonomous、Shared、Electric)战略,其S部分采用IBM 公司Softlayer 建立了Car2Go平台;福特汽车公司也利用微软公司Azure平台推出FordPass 应用。2017年9月15日,在百度云智峰会上,百度公司现场展示了如何利用计算机视觉技术帮助宝钢公司实现钢铁生产过程质量管控。三菱汽车在2017年10月25日东京车展推出的e-EVOLUTION概念车具有自然语音处理、学习和自适应等人工智能技术。因此,我们相信,人工智能与汽车工业的全面结合已经成为必然,文章中提到的愿景也不是科幻。希望该文章能对中国汽车工业的发展、乃至中国制造的发展提供借鉴。
人工智能赛博物理操作系统
AI-CPS OS
“人工智能赛博物理操作系统”(新一代技术+商业操作系统“AI-CPS OS”:云计算+大数据+物联网+区块链+人工智能)分支用来的今天,企业领导者必须了解如何将“技术”全面渗入整个公司、产品等“商业”场景中,利用AI-CPS OS形成数字化+智能化力量,实现行业的重新布局、企业的重新构建和自我的焕然新生。
AI-CPS OS的真正价值并不来自构成技术或功能,而是要以一种传递独特竞争优势的方式将自动化+信息化、智造+产品+服务和数据+分析一体化,这种整合方式能够释放新的业务和运营模式。如果不能实现跨功能的更大规模融合,没有颠覆现状的意愿,这些将不可能实现。
领导者无法依靠某种单一战略方法来应对多维度的数字化变革。面对新一代技术+商业操作系统AI-CPS OS颠覆性的数字化+智能化力量,领导者必须在行业、企业与个人这三个层面都保持领先地位:
重新行业布局:你的世界观要怎样改变才算足够?你必须对行业典范进行怎样的反思?
重新构建企业:你的企业需要做出什么样的变化?你准备如何重新定义你的公司?
重新打造自己:你需要成为怎样的人?要重塑自己并在数字化+智能化时代保有领先地位,你必须如何去做?
AI-CPS OS是数字化智能化创新平台,设计思路是将大数据、物联网、区块链和人工智能等无缝整合在云端,可以帮助企业将创新成果融入自身业务体系,实现各个前沿技术在云端的优势协同。AI-CPS OS形成的数字化+智能化力量与行业、企业及个人三个层面的交叉,形成了领导力模式,使数字化融入到领导者所在企业与领导方式的核心位置:
精细:这种力量能够使人在更加真实、细致的层面观察与感知现实世界和数字化世界正在发生的一切,进而理解和更加精细地进行产品个性化控制、微观业务场景事件和结果控制。
智能:模型随着时间(数据)的变化而变化,整个系统就具备了智能(自学习)的能力。
高效:企业需要建立实时或者准实时的数据采集传输、模型预测和响应决策能力,这样智能就从批量性、阶段性的行为变成一个可以实时触达的行为。
不确定性:数字化变更颠覆和改变了领导者曾经仰仗的思维方式、结构和实践经验,其结果就是形成了复合不确定性这种颠覆性力量。主要的不确定性蕴含于三个领域:技术、文化、制度。
边界模糊:数字世界与现实世界的不断融合成CPS不仅让人们所知行业的核心产品、经济学定理和可能性都产生了变化,还模糊了不同行业间的界限。这种效应正在向生态系统、企业、客户、产品快速蔓延。
AI-CPS OS形成的数字化+智能化力量通过三个方式激发经济增长:
创造虚拟劳动力,承担需要适应性和敏捷性的复杂任务,即“智能自动化”,以区别于传统的自动化解决方案;
对现有劳动力和实物资产进行有利的补充和提升,提高资本效率;
人工智能的普及,将推动多行业的相关创新,开辟崭新的经济增长空间。
给决策制定者和商业领袖的建议:
超越自动化,开启新创新模式:利用具有自主学习和自我控制能力的动态机器智能,为企业创造新商机;
迎接新一代信息技术,迎接人工智能:无缝整合人类智慧与机器智能,重新
评估未来的知识和技能类型;
制定道德规范:切实为人工智能生态系统制定道德准则,并在智能机器的开
发过程中确定更加明晰的标准和最佳实践;
重视再分配效应:对人工智能可能带来的冲击做好准备,制定战略帮助面临
较高失业风险的人群;
开发数字化+智能化企业所需新能力:员工团队需要积极掌握判断、沟通及想象力和创造力等人类所特有的重要能力。对于中国企业来说,创造兼具包容性和多样性的文化也非常重要。
子曰:“君子和而不同,小人同而不和。” 《论语·子路》云计算、大数据、物联网、区块链和 人工智能,像君子一般融合,一起体现科技就是生产力。
如果说上一次哥伦布地理大发现,拓展的是人类的物理空间。那么这一次地理大发现,拓展的就是人们的数字空间。在数学空间,建立新的商业文明,从而发现新的创富模式,为人类社会带来新的财富空间。云计算,大数据、物联网和区块链,是进入这个数字空间的船,而人工智能就是那船上的帆,哥伦布之帆!
新一代技术+商业的人工智能赛博物理操作系统AI-CPS OS作为新一轮产业变革的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎。重构生产、分配、交换、消费等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生新技术、新产品、新产业、新业态、新模式。引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。
产业智能官 AI-CPS
用“人工智能赛博物理操作系统”(新一代技术+商业操作系统“AI-CPS OS”:云计算+大数据+物联网+区块链+人工智能),在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的认知计算和机器智能;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。
长按上方二维码关注微信公众号: AI-CPS,更多信息回复:
新技术:“云计算”、“大数据”、“物联网”、“区块链”、“人工智能”;新产业:“智能制造”、“智能金融”、“智能零售”、“智能驾驶”、“智能城市”;新模式:“财富空间”、“工业互联网”、“数据科学家”、“赛博物理系统CPS”、“供应链金融”。
本文系“产业智能官”(公众号ID:AI-CPS)收集整理,转载请注明出处!
版权声明:由产业智能官(公众号ID:AI-CPS)推荐的文章,除非确实无法确认,我们都会注明作者和来源。部分文章推送时未能与原作者取得联系。若涉及版权问题,烦请原作者联系我们,与您共同协商解决。联系、投稿邮箱:erp_vip@hotmail.com