【机器学习】LinkedIn的机器学习实践

2017 年 9 月 25 日 产业智能官 AI前线

作者｜Divye Kapoor

译者｜核子可乐

编辑｜Vincent

作为服务于全球超过 5 亿用户的专业社交网络，领英已经成为专业交流的首选平台。为了为领英会员提供切实有效的评论内容，领英的研发团队构建起一套具备可扩展能力的评论排名系统。该系统利用机器学习技术为访问领英内容生态系统的每一位会员提供个性化的会话体系。在今天的文章当中，来自领英的技术专家将详尽介绍自己的设计思路、面临的可扩展性挑战与解决办法，以及系统运行中必须承受的有限延迟空间。 更多精彩文章请添加微信“AI 前线”（ID：ai-front）

作为服务于全球超过 5 亿用户的专业社交网络，领英已经成为专业交流的首选平台。这里提供多种多样的职位选项，吸引到大量会员参与，其中部分文章更是拥有极高人气。但面对大量的受众与评论内容，人们往往发现有价值信息被快速淹没在干扰性内容当中。

为了为领英会员提供切实有效的评论内容，领英的研发团队构建起一套具备可扩展能力的评论排名系统。该系统利用机器学习技术为访问领英内容生态系统的每一位会员提供个性化的会话体系。在今天的文章当中，来自领英的技术专家将详尽介绍自己的设计思路、面临的可扩展性挑战与解决办法，以及系统运行中必须承受的有限延迟空间。

发展历史

领英馈送内容丰富多样，可供各类会员根据需求随意使用。其中一部分由会员有机生成（例如由领英公司创始人 Reid Hoffman 撰写的新文章等等），也有一部分来自第三方网站。研发团队需要确保能够定期发布高质量内容。这些文章将根据观点与偏好倾向吸引到广泛而热烈的会员参与，但就在不久之前，领英还没有能力将这种参与行为转化为平台之上真正具备现实意义的会员间对话。

领英馈送评论排名机制采取的默认模式为按新鲜度排序：如果您是最后一位在某热门主题之下发表评论的用户，则您的评论将被显示在顶端。由于无法理解评论的具体内容，因此无法建立起个性化概念，更遑论解析评论内容与参与度之间的实际关联。

领英的技术团队从 2016 年开始对这个问题加以关注。他们建立起一款简单的最低可行产品（简称 MVP），尝试利用其根据获得的“赞”数对评论进行排名（即简单利用这一数字作为评论内容质量的判断依据）。这款 MVP 获得了一定程度的左转，因为其确实能够将有价值评论优先显示在顶端。然而，其也暴露出依据单一且缺少个性化因素的弱点：只有在得到足够的交互评判之后，评论才会得到较高评价。在理想情况下，技术团队希望能够提前找出那些值得一读的评论内容。另外，延迟与规模化等问题也进一步阻碍开发团队将其引入实际生产系统。

根据从 MVP 当中汲取到的经验，领英建立起一套可扩展机器学习服务系统，其负责利用一套富特征集对评论内容进行个性化排名。评论特征——包括评论的实际内容、获得的参与度水平以及评论发布者的相关信息等——都将通过 Samza 流处理工具进行提前运算。在此之后，其特征将被预先判定，并快速与反射索引系统（FollowFeed）中的评论进行关联。当某一请求要求为特定查看者获取相关评论时，预先计算完成的特征与查看器将实现对接，而后运行一套机器学习模型以提供符合个性化要求的评论排名。在过去几个月中，已经通过实践证明，这套系统每秒能够支持数千次查询（简称 QPS），平均时长为 60 毫秒，且第 99 百分位延迟为 190 毫秒。

在接下来的内容当中，作者将就这套系统的具体构建细节进行探讨。

了解领英的对话机制

在馈送方面，每条评论通常都会产生一条 Comment Viral Update（即评论更新提醒），并通过评论者连接进行发布。技术团队利用这种评论更新提醒的方式建立领英新闻馈送中最具吸引力的更新术语，具体效果如下图所示：

当您发布在某篇文章或者某条状态下的评论生成大量参与度——包括点赞或者后续评论——时，更新评论更新提醒会显示在您的馈送内容当中。在全部馈送更新中，评论更新提醒会得到最高的参与度。每条评论更新所生成的交互次数相当于关联更新的 2.5 倍（这里的更新是指您个人专业网络中出现的新连接），亦相当于连接内点“赞”参与度的 1.8 倍。2017 年，领英迎来了创纪录的参与水平。与馈送内容相关的社交操作（包括点赞、分享以及评论等）实现 60% 以上的同比增长。如今领英会员们正以前所未有的热情进行交互，而这些交流线索也将带来极为可观的价值。然而，规模庞大的评论内容也给技术团队带来了新的挑战。

与互联网上的其它事物类似，评论线索也存在“长尾效应”。从列表的角度来看，少量长期拥有讨论热度的职位持续出现在会员们的眼前，并极大占用了其在网站上浏览的时间。具体来讲，1% 此类长线索吸引到超过 40% 的会员进行访问。很明显，以反向时间排序方式从头查看成百上千条评论内容绝对不会是令人愉快的使用体验。领英需要一种更为个性化的评论排名方法，以确保每位会员都能够从其关注的长线索评论当中获得最大价值。

MVP 架构

那么，领英是如何最终实现为会员提供相关信息的目标的？在回答这个问题之前，需要首先聊聊最低可行产品（简称 MVP）的实际架构。

设计

MVP 的架构其实非常简单：

iOS 与 Android 移动应用会与 Voyager-API（一个基于 REST 的应用层）进行通信，旨在为特定馈送内容上的某项活动请求相关评论。Voyager-API 会将此请求转发至 Feed Mixer（排名与混合层），用以生成一份相关评论列表。

Feed Mixer 通过向用户信息库扇出请求的方式获取对方的一级连接，从而实现 MP 评论关联性算法。而评论线索库则将获得一份关于特定线索的完整评论列表。该评论线索库为领英 NoSQL 存储库 Espresso 的真相库来源。对于该线索之上的每一条评论，Espresso 都会存储一项示例特征（即合并后的点赞次数）。各评论依靠这样的特征进行排名，并被发送回 Voyager-API 以实现面向观看者的结果显示。

可扩展性挑战

通过架构图可以看到，当用户等待相关评论列表时，会出现在线特征加入的问题。在这种情况下，系统会因延迟问题而导致可排名评论数量受限。极高的计算量与由评论特征检索及处理带来的延迟会令 Espresso 库的后台延迟超过 800 毫秒，这无疑会引发严重的站点性能下滑。可以肯定的是，领英无法将此作为长期性解决方案。

尽管如此，此 MVP 仍然算得上成功。其能够显示排名评论的价值，而不仅仅是根据时间顺序进行简单呈现。另外，其也暴露出这种简单处理方式的弱点——高质量评论可能单纯因为得到的赞较少而被低质量评论所淹没，而且新近发布的评论由于没有足够的时间积累赞与回复而在线索判断层面处于劣势。凭借着积累到的这些宝贵经验，技术团队开始着手对该系统进行生产化调整。

可扩展生产架构

2016 年 8 月，领英决定推出一套不存在上述在线特征生成问题的架构方案。他们还借此机会尝试进一步提升评论排名的实际效果。

特征管道

在起步阶段，技术团队选择了一套能够有效描述评论的特征列表以及作为特征获取来源的数据源。其规模要远远超过只具备单一功能的 MVP。为了实现这项目标，他们从以下三个角度着手：

关于评论者的特征 ;
关于评论内容本身的特征 ;
关于评论参与度的特征。

上述各项特征皆通过对各数据存储库进行近实时查询的方式获取。这些特征通过一条特征添加管道进行推送，而此添加管道又由评论创建与交互进行驱动。另外，这一特征添加管道利用 Apache Samza 构建而成（领英的近线流处理系统）。

最终，技术团队得到了一份已添加特征的可用列表，其中包含每条评论的对应交付系统的单一 SSD/ 内存查找结果。另外，以上全部特征皆驻留在 HDFS 当中以备离线分析与模型训练。

交付基础设施

为了保证评论内容的相关性，需要一套能够满足以下要求的交付子系统：

这套系统应具备一份索引，用以立足某一评论线索（快速）检索全部评论内容。
立足该线索快速访问添加特征列表当中的每条评论。
有能力以规模化方式支持成千上万 QPS 并立足馈送内容为每条请求生成相关评论。

虽然（1）与（2）两项任务比较简单，但（3）才是这项设计的核心驱动因素。以规模化方式交付成千上万 QPS 大大缩小了可选范围，因此最终选项被固定在两套子系统当中：Galene（文档划分式搜索堆栈）以及 FollowFeed（术语划分式馈送堆栈）。

这两套系统在各自的领域中皆拥有良好的实际表现：Galene 为领英的搜索流量与多站点功能（例如工作推荐、人员搜索等）提供支持，而 FollowFeed 则支撑着馈送体系中的全部用户生成内容。在经过审议与一系列基准测试之后，研发人员决定采用 FollowFeed，因为其已经与馈送生态系统完美结合起来。不过这又带来了其它一些值得讨论的设计取舍。

这里解释一下，FoolowFeed 是一套术语划分系统（其中每个叶节点负责存储与某一主要术语相关的文档）。在 FollowFeed 当中，各术语属于围绕 actor（例如会员、企业等等）建立而成的概念以及一份由该 actor 所执行社交操作的列表（评论、赞、分享等）。为了保证 FollowFeed 始终返回相关评论，需要对基础进行重新调整。

重整系统以接入可进行评论的各类条目

与能够在领英生态系统内部生成评论内容的少数 actor 不同（例如会员、高校、企业），这里研发团队面对的是更为广泛的会员可评论对象（例如文章、长篇帖子、分享、纪念活动以及视频等等）。FollowFeed 的核心数据结构能够将每个 MemberID 同一系列活动关联起来。技术专家们以这套数据结构为基础，而后构建起另一套能够将帖子 ID 同一份评论活动列表相关联的数据结构。从概念层面讲，这只是一项小小的调整，但在大型生产系统当中实现这项调整却需要耗费远超想象的时间。

修正前 N 条与扇出概念

在馈送领域当中，技术团队面临的挑战在于如何为特定用户挑选最适合的前 N 条帖子。他们需要根据特定会员及其连接列表生成这些与其需求最契合的前 N 条推荐内容。具体来讲，需要提取该会员的连接集，并根据该会员的每一条连接扇出请求，最终给出前 N 条帖子推荐结果。

不过在评论方面，需要将以上提到的 1：N 扩大到 M：NM。其中的 M 为帖子 ID，而每篇帖子都需要生成前 N 条最佳评论。

尽管可以在 FeedMixer 层上进行 N 次请求扇出并对 FollowFeed 进行 N 次查询，但这显然不是最佳解决方案。

方差和法则告诉技术团队，N 个独立延迟量彼此为加和关系。这意味着：

因此在 FeedMixer 层上进行请求扇出将极大提升延迟水平。最终的尾延迟不仅包含由 FollowFeed-Storage（最底层交付基础设施层）产生的方差，亦包括来自 FollowFeed-Query 层的方差。然而，如果首先对 FollowFeed-Query 执行单批次请求，而后再对 FollowFeed-Storage 进行一次扇出，则可有效控制尾延迟水平。

提供、发布及访问新特征，并利用其进行评论排名

这套系统尚处于早期开发阶段，因此还无法顺畅处理各类特征。在各个交付节点之上设置并使用特征存储库，在各节点间合理发布数据，并根据特定键进行划分。这一流程在基础设施工程层面非常简单：在出现数据时，技术专家们会利用 FollowFeed 出色的模型执行能力对来自机器学习模型内的相关评论进行排名。

领英使用的机器学习模型

为了实现个性化评论排名，领英训练出一套逻辑回归模型，用以预测查看者对于各条评论的参与度水平。这套模型利用领英 Photon ML 库当中的广泛特征储备训练而成。

这套机器学习模型从查看者、评论者以及评论内容处获取特征。任何查看者特定特征（例如评论者与查看者间的亲密度）都会以每日方式被添加至离线 Hadoop 工作流内。这些特征被从 HDFS 中推送至一套在线 Voldemort 存储库以供查询。评论相关特征（例如评论的语言表达）则在评论创建时由一款近线 Samza 处理工具负责生成。如前文所述，这些特征将在 FollowFeed 中进行索引以实现在线交付，并通过 ETL 流程引入以供离线模型训练使用。

评论者特征包含每一位评论者的声誉以及受欢迎程度（基于其个人资料视图中的查看次数及影响力状态等）。领英的这套模型还会根据行业、职位以及其它共享属性对评论者与查看者进行匹配。在领英，能够凭借各类成熟的机器学习信号资源发现两位会员之间的交互关系。技术专家们会考量双方的联系 / 关注关系，其各自个人资料的相似性以及以往馈送内容中的互动记录。这些信号属于关键性输入信息，能够帮助技术团队为每位查看者选定最具个性化考量的高质量评论内容。

而在实际评论内容层面，领英的技术专家利用自己的内部自然语言处理（简称 NLP）库来表达语言、评论长度、语法结构、主题标签的存在 / 不存在以及其它内容特征。他们还尝试推断评论当中是否有提及其他领英会员或者其它职能实体。

馈送信息当中的社交参与特征会根据不同行业进行细分，旨在保证机器学习模型能够准确找到只对特定一部分会员具有吸引力的评论内容。

评论新鲜度特征则源自针对当前评论的近期操作。技术专家们会捕捉评论的创建时间戳、最后回复以及最后点赞。查看者一般更倾向于阅读新鲜评论或者最近进行讨论的话题。

说到这里，还仅仅涉及这项任务的表面。在捕捉并实现在线排名功能的过程当中，实际使用到近 100 项特征，并利用机器学习模型进行特征训练以准确预测会员们对特定评论内容的参与度。对于每一位会员，都会利用其它机器学习模型对评论中的垃圾信息与低质量内容进行分类与检测，并最终选出最适合查看者的内容。

性能指标

这套系统拥有稳定的运行效果：可以看到，其第 50 百分位尾延迟水平为 15 毫秒，第 99 百分位延迟则为 65 毫秒。在获取会员特征时，整体系统的中位数延迟为 60 毫秒，而第 99 百分位端到端延迟则为 190 毫秒。具体来讲，这套系统相较于原本的 MVP，能够仅利用四分之一时间生成高达两倍的评论排名结果——这无疑解决了后者原本的最大短板。

结论

评论关联性这类长期基础设施项目拥有一段有趣的生命周期：首先是孕育期，而后是一段时间的持续评估，接下来投入具体执行，并最终进行稳定生产。回顾此前完成的这一系列工作，同时考虑到领英超过 5 亿会员得以借此获取价值，通过观察，会发现会员们阅读评论、参与内容馈送以及同领英生态系统当中其他会员进行交互与对接的效果皆有所改善。系统的个性化与资讯启发式发现能力得到了会员们的肯定，领英技术团队的工作也取得了良好的反响。

在调整之后，回复当中“赞”的数量开始快速提升。目前 iOS 平台上馈送内容的评论数量增长了 22%，而 Android 平台则提升 14%。

原文链接

https://engineering.linkedin.com/blog/2017/09/serving-top-comments-in-professional-social-networks

延展阅读：FCS Perspectives | 终身机器学习: 一种持续学习的范式

PaperWeekly

导读

在第一届北美计算机华人学者年会暨计算技术前沿研讨会上，来自伊利诺伊大学芝加哥分校的刘兵教授以“打造能够终身学习的机器”为主题，介绍了终身机器学习（Lifelong Machine Learning，LML），引起了广泛关注。

刘兵教授在 Frontiers of Computer Science (FCS) 2017年第 3 期发表了一篇题为“Lifelong machine learning: a paradigm for continuous learning”的文章，介绍了终身机器学习的研究背景、定义、特征、研究历史，并展望了终身机器学习研究的前景。

为使国内读者更精准地理解和学习终身机器学习的概念，FCS 特别邀请了FCS 青年 AE 石川教授，对该 Perspective 文章进行了精心翻译，以飨读者。

Frontiers of Computer Science, 2017, 11(3): 359-361

DOI 10.1007/s11704-016-6903-6

PERSPECTIVE

终身机器学习:

一种持续学习的范式

作者：刘兵 | 伊利诺伊大学芝加哥分校

特邀译者：石川 | 北京邮电大学

机器学习对数据分析和人工智能的发展起到了巨大的推动作用。近些年，深度学习的成功又使机器学习进入了一个新的高度。机器学习算法已成功应用于工业、科学和工程等几乎所有领域。

背景

当前，机器学习的经典模式是：在给定一个数据集上，运行一个机器学习算法，构建一个模型，然后将这个模型应用在实际的任务上。我们把这种学习范式称为孤立学习，因为它并未考虑任意其他相关的信息和过去学习到的知识。

孤立学习的缺点在于没有记忆，即它没有保留学到的知识，并应用于未来的学习。因此它需要大量的训练样例。

对于监督学习而言，大量的训练样例通常是手工标注得到的，这样费时又费力。但是现实世界中存在太多的学习任务，为了学习一个机器学习模型，对每个任务都手工标注大量的训练数据是不可能的。

更糟的是，事情总是处在不断变化中，因而需要不停地标注训练样例，这显然是无法完成的任务。对建立真正的智能系统而言，当前的孤立学习范式是不合适的，其仅仅可被用于解决具体领域的任务。

我们人类是以完全不同的方式进行学习的。我们从不孤立地学习，而是不断地积累过去学习的知识，并无缝地利用它们学习更多的知识。随着时间的增长，我们将会学习到越来越多的知识，而且越来越善于学习。

终身机器学习（或者终身学习，lifelong machine learning ）就是模仿人类的这种学习过程和能力。由于我们周围的事务都是紧密相关和相互联系的，因此这种学习方式是很自然的。

过去学习到的概念和关系可以帮助我们更好地理解和学习一个新的任务，因为不同领域和任务中的很多知识都是共享的。例如，没有人会给我们1000个正面和1000个负面的汽车评论，然后让我们建立一个分类器去给新的汽车评论分类。事实上，我们人类不需要任何的评论来训练就可以做到这些，因为我们已经积累了很多知识，并且知道人们是如何赞美和贬损事物的。如果没有过去的知识，我们人类是很难用这2000个正负面评论来建立一个好的分类器。

定义

终身机器学习是一个持续学习过程，其中学习器已经执行一个包含N个任务的任务序列T1，T2，…，TN。在面对第N+1个任务TN+1和对应的数据DN+1时，学习器可以利用其知识库中的先验知识来帮助学习TN+1任务。知识库中存储和维护过去N个任务中学习和累积到的知识。在学习了任务TN+1后，知识库会根据TN+1任务中学习到的中间或最终结果进行更新。

陈等人[1]给出的上述定义揭示了终身学习的主要特征：

持续学习；
知识被累积到知识库中；
利用过去学习的知识，以帮助解决未来的学习问题。

这些特征使得终身学习不同于迁移学习或者多任务学习等相关学习任务。

迁移学习是利用源领域来帮助目标领域的学习任务。它假设源领域有大量已经标注的训练数据，目标领域有很少或者根本没有标注的训练数据，但是有很多未标注的数据。迁移学习利用源领域已经标注的数据来帮助目标领域的学习任务。

迁移学习和终身学习存在几点不同。

迁移学习不是持续地学习，它仅仅是利用源领域来帮助目标领域的学习。
迁移学习不积累已学习的知识。
迁移学习是利用源领域帮助目标领域的单向学习过程。
迁移学习假设源领域与目标领域是很相似的，相似性由使用者确定。终身学习并没有这么强的假设，使用者通常也不参与决定任务的相似性。

多任务学习是通过进行多个相似任务的联合优化，以至于通过共享这些任务的知识来得到更好的全局结果。然而，多任务学习仍然遵循传统的机器学习范式。它同时优化多个任务而不是一个任务。

如果我们把多个任务看做一个更大的任务，那么多任务学习就变为传统的优化问题，这通常也是绝大部分多任务学习的优化形式。多任务学习并不积累知识，也没有持续学习的概念。

尽管有人认为，当新任务随时加入时，多任务学习也可以同时优化所有的任务。但是用一个单一的过程同时优化所有的任务是相当困难的，因为学习任务可能是各不相同的并且数量巨大的。

历史

终身机器学习的概念大约是1995年由Thrun和Mitchell[4]提出的，主要有以下四个研究方向。

1终身有监督学习

Thrun[5]率先研究了终身概念学习，即每个过去的或者新来的任务都是一个类或者概念。针对基于内存的学习和神经网络，出现了一些终身机器学习方法。

文献[6]提出了利用终身学习提升神经网络的方法。
Fei等人[7]把终身学习扩展到累积学习（cumulative learning）。当遇到新的类别时，累积学习建立一个新的多类别分类器，它可以区分所有过去的和新的类别，也可以辨别测试集中的未知类别。这也为自学习（self-learning）奠定了基础，因为这种可以辨别未知类别的能力可以用来学习新的事物。
Ruvolo和Eaton [8]提出了高效的终身学习算法ELLA来提升多任务学习方法。
陈等人[1]提出了一种针对朴素贝叶斯分类的终身学习技术。
Petina和Lampert等人[9]也对终身机器学习进行了理论研究。

2终身无监督学习

陈和刘等人[10]首次提出了终身主题模型。之后，他们又提出了一些其他类似的模型。这些技术主要是从过去的任务中得到的主题学习知识，然后在新的任务中利用这些学到的知识产生更加一致的主题。

刘等人[11]提出了一种用于信息抽取的终身学习方法。Shu等人[12]针对情感挖掘问题提出了一种终身图标注方法来区分两类表情。

3终身半监督学习

终身半监督学习的代表性工作是永动语言学习机系统（never-ending language learner，NELL）[13]。从2010年1月以来，NELL系统持续地读取网页信息用于信息抽取，已经积累了上百万的实体和关系。

4终身强化学习

Thrun和Mitchell[4]率先研究终身强化学习用于机器人学习。Tanaka和Yamamura[14]提出了一种终身强化学习方法，它把每个环境都看做一个任务。BouAmmar等人[15]提出了一种高效的策略梯度终身强化学习算法。

总结

尽管终身学习已有20多年的研究历史，但是目前为止还没有太多的研究。一个可能的原因是机器学习研究在过去20年主要关注统计和规则的方法。终身学习主要需要系统的方法。

然而，随着统计机器学习变得愈加成熟，研究者意识到它的局限性，终身学习将变得越来越重要。我们可以比较确信地说，如果没有终身学习的能力，即通过不断地积累已学到的知识并且用已有的知识以一种自激励的方式学习新的任务，我们不可能建立真正的智能系统，我们也仅能在一个很具体的领域解决问题。

致谢

该工作得到国家自然科学基金 (NSF) (IIS-1407927)，NCI基金和博世基金支持。

参考文献

Chen Z Y, Ma N Z, Liu B. Lifelong learning for sentiment classification. In: Proceedings of ACL Conference. 2015
Pan S J, Yang Q. A survey on transfer learning. IEEE Transaction on Knowledge and Data Engineering, 2010, 22(10): 1345–1359
Caruana R. Multitask learning. Machine Learning, 1997, 28(1)
Thrun S, Mitchell T M. Lifelong robot learning. In: Steels L,ed. The Biology and Technology of Intelligent Autonomous Agents. Berlin: Springer,1995, 165–196
Thrun S. Is learning the n-th thing any easier than learning the first? Advances in Neural Information Processing Systems,1996: 640–646
Silver D L, Mercer R E. The task rehearsal method of life-long learning:overcoming impoverished data. In: Proceedings of the 15th Conference of the Canadian Society for Computational Studies of Intelligence on Advances in Artificial Intelligence. 2002, 90–101
Fei G L, Wang S, Liu B. Learning cumulatively to become more knowledgeable. In: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2016, 1565–1574
Ruvolo P, Eaton E. ELLA: an efficient lifelong learning algorithm. International Conference on Machine Learning. 2013, 28(1): 507–515
Pentina A, Lampert C H. A PAC-Bayesian bound for lifelong learning. International Conference on Machine Learning. 2014: 991–999
Chen Z Y, Liu B. Topic modeling using topics from many domains, lifelong learning and big data. International Conference on Machine Learning, 2014
Liu Q, Liu B, Zhang Y L, Kim D S, Gao Z Q. Improving opinion aspect extraction using semantic similarity and aspect associations. In: Proceedings of the 30th AAAI Conference on Artificial Intelligence. 2016
Shu L, Liu B, Xu H, Kim A. Separating entities and aspects in opinion targets using lifelong graph labeling. In: Proceedings of Conference on Empirical Methods in Natural Language Processing, 2016
Mitchell T, Cohen W, Hruschka E, Talukdar P, Betteridge J, Carlson A, Dalvi B, Gardner M, Kisiel B, Krishnamurthy J, Lao N, Mazaitis K, Mohamed T, Nakashole N, Platanios E, Ritter A, Samadi M, Settles B, Wang R, Wijaya D, Gupta A, Chen X, Saparov A, Greaves M, Welling J. Never-ending learning. In: Proceedings of the 29th AAAI Conference on Artificial Intelligence.2015, 2302–2310
Tanaka F, Yamamura M. An approach to lifelong reinforcement learning through multiple environments. In: Proceedings of the 6th European Workshop on Learning Robots. 1997, 93–9
BouAmmar H, Eaton E, Ruvolo P, Taylor M. Online multi-task learning for policy gradient methods. In: Proceedings of the 31st International Conference on Machine Learning. 2014, 1206–1214

点左下角的「阅读原文」链接阅读英文原文。

作者介绍

刘兵，美国伊利诺伊大学芝加哥分校(UIC)计算机系教授。ACM Fellow，AAAI Fellow，IEEE Fellow。数据挖掘, 机器学习和自然语言理解研究领域的国际知名专家，在国际著名学术期刊与重要国际学术会议(如KDD、WWW、AAAI、IJCAI、ICML、ACL、EMNLP、TKDE等)上发表论文百余篇，论文引次数超过40000。著有多部计算机精选教材。担任过KDD以及多个其他学术会议程序委员会主席和ACM SIGKDD 主席。

特邀译者介绍

石川，北京邮电大学计算机学院教授、博导、智能通信软件与多媒体北京市重点实验室副主任。中国计算机学会人工智能与模式识别专委会委员和人工智能学会知识工程与分布智能专委会委员。主要研究方向: 数据挖掘、机器学习、演化计算和多目标优化。担任SCI期刊《Frontiers of Computer Science》青年AE。近五年来，作为第一作者或通讯作者发表高水平学术论文50余篇，包括数据挖掘领域的顶级期刊和会议IEEE TKDE、ACM TIST、KAIS、DKE、KDD、SDM、CIKM、ECML等，出版英文专著一部。获得ADMA2011国际会议最佳论文奖、CCF-腾讯犀牛鸟基金及项目优秀奖，获得北京市高等院校青年英才计划支持。指导学生获得顶尖国际数据挖掘竞赛IJCAI Contest 2015全球冠军。

新一代技术+商业操作系统：

AI-CPS OS

在新一代技术+商业操作系统（AI-CPS OS：云计算+大数据+物联网+区块链+人工智能）分支用来的今天，企业领导者必须了解如何将“技术”全面渗入整个公司、产品等“商业”场景中，利用AI-CPS OS形成数字化+智能化力量，实现行业的重新布局、企业的重新构建和自我的焕然新生。

AI-CPS OS的真正价值并不来自构成技术或功能，而是要以一种传递独特竞争优势的方式将自动化+信息化、智造+产品+服务和数据+分析一体化，这种整合方式能够释放新的业务和运营模式。如果不能实现跨功能的更大规模融合，没有颠覆现状的意愿，这些将不可能实现。

领导者无法依靠某种单一战略方法来应对多维度的数字化变革。面对新一代技术+商业操作系统AI-CPS OS颠覆性的数字化+智能化力量，领导者必须在行业、企业与个人这三个层面都保持领先地位：

重新行业布局：你的世界观要怎样改变才算足够？你必须对行业典范进行怎样的反思？
重新构建企业：你的企业需要做出什么样的变化？你准备如何重新定义你的公司？
重新打造自己：你需要成为怎样的人？要重塑自己并在数字化+智能化时代保有领先地位，你必须如何去做？

AI-CPS OS是数字化智能化创新平台，设计思路是将大数据、物联网、区块链和人工智能等无缝整合在云端，可以帮助企业将创新成果融入自身业务体系，实现各个前沿技术在云端的优势协同。AI-CPS OS形成的数字化+智能化力量与行业、企业及个人三个层面的交叉，形成了领导力模式，使数字化融入到领导者所在企业与领导方式的核心位置：

精细：这种力量能够使人在更加真实、细致的层面观察与感知现实世界和数字化世界正在发生的一切，进而理解和更加精细地进行产品个性化控制、微观业务场景事件和结果控制。
智能：模型随着时间（数据）的变化而变化，整个系统就具备了智能（自学习）的能力。
高效：企业需要建立实时或者准实时的数据采集传输、模型预测和响应决策能力，这样智能就从批量性、阶段性的行为变成一个可以实时触达的行为。
不确定性：数字化变更颠覆和改变了领导者曾经仰仗的思维方式、结构和实践经验，其结果就是形成了复合不确定性这种颠覆性力量。主要的不确定性蕴含于三个领域：技术、文化、制度。
边界模糊：数字世界与现实世界的不断融合成CPS不仅让人们所知行业的核心产品、经济学定理和可能性都产生了变化，还模糊了不同行业间的界限。这种效应正在向生态系统、企业、客户、产品快速蔓延。

AI-CPS OS形成的数字化+智能化力量通过三个方式激发经济增长：

创造虚拟劳动力，承担需要适应性和敏捷性的复杂任务，即“智能自动化”，以区别于传统的自动化解决方案；
对现有劳动力和实物资产进行有利的补充和提升，提高资本效率；
人工智能的普及，将推动多行业的相关创新，开辟崭新的经济增长空间。

给决策制定者和商业领袖的建议：

超越自动化，开启新创新模式：利用具有自主学习和自我控制能力的动态机器智能，为企业创造新商机；
迎接新一代信息技术，迎接人工智能：无缝整合人类智慧与机器智能，重新
评估未来的知识和技能类型；
制定道德规范：切实为人工智能生态系统制定道德准则，并在智能机器的开
发过程中确定更加明晰的标准和最佳实践；
重视再分配效应：对人工智能可能带来的冲击做好准备，制定战略帮助面临
较高失业风险的人群；
开发数字化+智能化企业所需新能力：员工团队需要积极掌握判断、沟通及想象力和创造力等人类所特有的重要能力。对于中国企业来说，创造兼具包容性和多样性的文化也非常重要。

子曰：“君子和而不同，小人同而不和。” 《论语·子路》云计算、大数据、物联网、区块链和人工智能，像君子一般融合，一起体现科技就是生产力。

如果说上一次哥伦布地理大发现，拓展的是人类的物理空间。那么这一次地理大发现，拓展的就是人们的数字空间。在数学空间，建立新的商业文明，从而发现新的创富模式，为人类社会带来新的财富空间。云计算，大数据、物联网和区块链，是进入这个数字空间的船，而人工智能就是那船上的帆，哥伦布之帆！

新一代技术+商业操作系统AI-CPS OS作为新一轮产业变革的核心驱动力，将进一步释放历次科技革命和产业变革积蓄的巨大能量，并创造新的强大引擎。重构生产、分配、交换、消费等经济活动各环节，形成从宏观到微观各领域的智能化新需求，催生新技术、新产品、新产业、新业态、新模式。引发经济结构重大变革，深刻改变人类生产生活方式和思维模式，实现社会生产力的整体跃升。