石油不仅仅是能源,很多衍生品也都需要依赖石油。类似地,我们在进行人工智能的探索道路上,我们也需要了解其本质,或者在其基础上衍生出各种上层的智能应用。在我个人看来,知识图谱正是起到了这样一个作用。
这里并没有过多介绍公司所做的业务,而是站在一个中立的角度尽量给大家呈现知识图谱在各领域的应用。
先介绍一些大家耳熟能详的应用
只是大家不了解这些应用是基于知识图谱的。
首先是“语义搜索”。因为知识图谱这个词最先是由谷歌在2012年提出的,作为谷歌的两大重要技术储备,一个是深度学习,形成了谷歌大脑;另一个就是知识图谱,用来支撑下一代搜索和在线广告业务。
上面的图中,大家可以发现与传统的搜索相比,搜索引擎开始理解用户输入的需求了,并对此返回各种非网页内容信息。在图中,对于New York(纽约州),返回各种结构化信息(在右边),类似一种经过梳理的高质量的摘要,供大家快速了解,而非仅有包含New York作为关键词的文档内容。
接着我们再来看另一个巨头脸谱公司的工作,它在之后利用知识图谱技术构建兴趣图谱(interest graph),用来连接人、分享的信息等,并基于此构建了graph search。
通过上图可以看到用户输入的两个自然语言问题,一个是问喜欢哈佛大学的人(左边),另一个访问过哈佛大学的人,如果按照传统的搜索做法,返回的结果会有很多重合,而事实上从返回结果我们可以看到脸谱公司可以清晰分辨这两者的区别。
那么这里就需要做更精确的语义分析,对于这里可以识别people(询问对象)、Harford University(大学),like/visit是动作,而like可以对应到社交网站中的点赞,而visit对应到社交网站上的签到,这样就能完全区分开了,更进一步,我们有了各种允许语音输入的个人助理。
从SIRI到EVI到Google Now,这些仅仅是在交互方式上有所不同,支持自然语言自由沟通的前提是庞大的知识库和基于知识库的各种服务—即知识图谱,此外,大家都知道IBM近年来一直在推动认知智能和智慧地球的理念。
IBM在2011年研发了Watson问答系统,参加了Jeopardy!(危险边缘)电视节目,类似国内的一站到底和开心词典,并打败人类冠军。很有幸,我参与了2年的Watson系统研发,这对后面的经历以及目前公司的技术选型有比较大的影响。
刚刚举了一些例子,我们总结一下知识图谱会带来的好处
这个对于大数据来说,其实就是全数据的概念。而对于人工智能来说,其实就是将原本没有联系的数据连通,将离散的数据整合在一起,从而提供更有价值的决策支持。而这里的副标题其实更进一步针对B端市场,我们强调了外部数据和内部数据整合的意义和价值。
这是一个通用的知识图谱的框架,我们可以看到知识图谱不是空中楼阁,而是基于现有数据的再加工,包括关系数据库中的结构化数据、文本或XML中的非结构化或半结构化数据、客户数据、领域本体知识以及外部知识,通过各种数据挖掘、信息抽取和知识融合技术形成一个统一的全局的知识库。
那么知识图谱能做什么呢?也就是上面提到的那些大家熟悉的应用(搜索、推荐、以及在后面会提到的各种垂直应用)。
知识图谱在农业中的应用
大家都知道我国是农业大国,但是我们的农业又多是基于小作坊,靠手工或看天工作的阶段。
大量的资料是很分散的,而且存放在各种格式中,而农民们非常迫切希望有人来指导他们更好地进行灌溉和解决虫害,那么这个时候的关键就是使得各种农业相关的知识可被这些农民朋友访问到。
这里我们以柑橘知识为例,我们发现传统的关系数据库模式对于这种复杂或多变的领域是不可行的,因为我们无法实现定义所有可能的知识点(用于构建关键数据库模式)。所以我们需要一种更加灵活的知识表示模型来管理,这个时候知识图谱就能起到很好的作用。
如果大家对知识图谱还比较陌生的话,可以看到这里贴出的可视化图,即根据上述施肥问答信息抽取构建的图谱片段。类似的,我们可以用各种抽取挖掘技术从各种多源异构数据中获取相应的知识,并统一用图谱进行表示,从而形成一个完整的知识库。
这里以Excel表或CSV文件为例,我们可以通过构建wrapper将其列映射为图模式,而将下面的记录(每一行)映射为对应的符合模式的图数据,并与之前从问答知识数据中获取的图谱进行关联整合。
这是一个整合之后的化肥本体知识。
对于这个知识库,我们可以通过SPARQL查询(可以可视化为图谱)来利用知识库,这里的例子是查询症状是座果率低的植物和其他相关症状。
图查询类似图谱数据,非常灵活,可以方便地进行变化,通过增删节点和边来实现,从而增加条件或放松条件。
知识图谱在电信行业客服中的应用
Amdocs是美国最大的第三方账单审计和客服中心,AT&T, Verizon和Sprint等都是他的客户,美国的电信市场很早就饱和了,所以各大运营商均没有很多新客户可以争取,那么维护好老客户就非常重要。
这是一个案例,大家有时间看看,其原则就是希望对于信用好的用户能前瞻性地了解他的需求,并在他打电话来反映情况的时候(抱怨或询问信息等),可以预先判断他需要什么,并帮其解决,从而减少沟通次数和沟通时长。
为了做到这一点,系统需要判断用户的信用等级。并根据用户的当前消费情况和各种动作来自动化判断其可能的行为。
通过上述概念得到的各种数据包括结构化,也包括流数据进行的各种数据映射和转换,类似的,也是形成统一的图谱进行管理。这个还包括趋势、时间、地理还有消费模式等很多信息。通过各种数据源进行数据的整合,形成统一的知识,并配合业务规则和贝叶斯网络来形成决策引擎,从而对用户的信用和各种行为结果预测起到作用。
最终达到的效果就是个性化前瞻性的客户关怀。
知识图谱在媒体发布中的应用
最早使用知识图谱的是英国广播电台,之前传得很火的新闻自动写作机器人也利用了知识图谱。
举个例子,针对2012年伦敦奥运会,很多对象的跟踪报道由专人负责,然后通过图谱将各种零散的信息关联在一起,从而形成一个完整页面。
知识图谱在金融方面的应用
金融方面是仅次于医疗(知识图谱应用最广泛的领域)。
先介绍一个我之前参与的国外的例子,是针对荷兰的案例。荷兰的法律导致破产是不用负责的,所以很多人钻这个空子来构建团伙进行倒卖,最后将其中的一些公司申请破产导致非法免费获得很多资源。
这一点,荷兰政府非常头疼,希望找到幕后组织,从而避免很多损失。
类似的,现在的问题(尤其是大数据情况下),各个部门和组织的数据非常分散,导致各个部门没有办法得到完整的信息来进行对上述团伙的判断。而传统的数据集成方法需要依赖非常有经验的专家对这些数据库进行手工集成,这大大增加了工作量和处理周期。
所以这里我们又将引入知识图谱,进行有效的去中心化的高效知识融合。
这是一个示例,和农业中的方案类似,不过使用了一个Hadoop PIG脚本来控制转换过程,之后我们将通过图可视化来发现这样的团伙。这个可视化的图中可以看到粉色的公司、橙色的机构和红色的破产的公司。
当我们将这张图进行缩放之后,可以发现这里一些有趣的模式,所有的红色破产企业都关联到图中圈定的公司,那么这个公司就有可能是指使这些破产行为的最终元凶。政府相关部门就可以对其进行深入的调查,这样使得原本大海捞针的搜索变得很有针对性。
知识图谱在政府中的应用
这里就不得不介绍最近非常红火的美国的独角兽Palantir。
Palantir应该是美国最早在政府领域使用知识图谱技术的公司,帮助美国政府成功定位到了本拉登的位置等。
其界面也包含各种图谱浏览、搜索、建模等工具,类似的,将不同来源不同格式的数据进行建模整合,来得到全面分析和挖掘的可能。
总结
知识图谱能做到的就是让知识可被用户访问到(搜索),可被查询(问答),可被支持行动(决策)。
当然知识图谱的构建和应用具有很大的技术难度,这里需要使用自然语言处理技术、数据库技术和语义推理技术等多重支持。
新一代技术+商业操作系统:
AI-CPS OS
在新一代技术+商业操作系统(AI-CPS OS:云计算+大数据+物联网+区块链+人工智能)分支用来的今天,企业领导者必须了解如何将“技术”全面渗入整个公司、产品等“商业”场景中,利用AI-CPS OS形成数字化力量,实现行业的重新布局、企业的重新构建和自我的焕然新生,在行业、企业和自身三个层面勇立鳌头。
数字化力量与行业、企业及个人三个层面的交叉,形成了领导力模式,使数字化融入到领导者所在企业与领导方式的核心位置。
分辨率革命:这种力量能够使人在更加真实、细致的层面观察与感知现实世界和数字化世界正在发生的一切,进而理解和更加精细地进行产品控制、事件控制和结果控制。
复合不确定性:数字化变更颠覆和改变了领导者曾经仰仗的思维方式、结构和实践经验,其结果就是形成了复合不确定性这种颠覆性力量。主要的不确定性蕴含于三个领域:技术、文化、制度。
边界模糊化:数字世界与现实世界的不断融合成CPS不仅让人们所知行业的核心产品、经济学定理和可能性都产生了变化,还模糊了不同行业间的界限。这种效应正在向生态系统、企业、客户、产品快速蔓延。
领导者无法依靠某种单一战略方法来应对多维度的数字化变革。随着变革范围不断扩大,一切都几乎变得不确定,即使是最精明的领导者也可能失去方向。面对新一代技术+商业操作系统(AI-CPS OS:云计算+大数据+物联网+区块链+人工智能)颠覆性的数字化力量,领导者必须在行业、企业与个人这三个层面都保持领先地位。
如果不能在上述三个层面保持领先,领导力将会不断弱化并难以维继:
重新进行行业布局:你的世界观要怎样改变才算足够?你必须对行业典范进行怎样的反思?
重新构建你的企业:你的企业需要做出什么样的变化?你准备如何重新定义你的公司?
重新打造新的自己:你需要成为怎样的人?要重塑自己并在数字化时代保有领先地位,你必须如何去做?
子曰:“君子和而不同,小人同而不和。” 《论语·子路》
云计算、大数据、物联网、区块链和 人工智能,像君子一般融合,一起体现科技就是生产力。
如果说上一次哥伦布地理大发现,拓展的是人类的物理空间。那么这一次地理大发现,拓展的就是人们的数字空间。
在数学空间,建立新的商业文明,从而发现新的创富模式,为人类社会带来新的财富空间。
云计算,大数据、物联网和区块链,是进入这个数字空间的船,而人工智能就是那船上的帆,哥伦布之帆!
人工智能通过三个方式激发经济增长:
创造虚拟劳动力,承担需要适应性和敏捷性的复杂任务,即“智能自动化”,以区别于传统的自动化解决方案;
对现有劳动力和实物资产进行有利的补充和提升,提高资本效率;
人工智能的普及,将推动多行业的相关创新,开辟崭新的经济增长空间。
新一代信息技术(云计算、大数据、物联网、区块链和人工智能)的商业化落地进度远不及技术其本身的革新来得迅猛,究其原因,技术供应商(乙方)不明确自己的技术可服务于谁,传统企业机构(甲方)不懂如何有效利用新一代信息技术创新商业模式和提升效率。
“产业智能官”,通过甲、乙方价值巨大的云计算、大数据、物联网、区块链和人工智能的论文、研究报告和商业合作项目,面向企业CEO、CDO、CTO和CIO,服务新一代信息技术输出者和新一代信息技术消费者。
助力新一代信息技术公司寻找最有价值的潜在传统客户与商业化落地路径,帮助传统企业选择与开发适合自己的新一代信息技术产品和技术方案,消除新一代信息技术公司与传统企业之间的信息不对称,推动云计算、大数据、物联网、区块链和人工智能的商业化浪潮。
给决策制定者和商业领袖的建议:
超越自动化,开启新创新模式:利用具有自主学习和自我控制能力的动态机器智能,为企业创造新商机;
迎接新一代信息技术,迎接人工智能:无缝整合人类智慧与机器智能,重新
评估未来的知识和技能类型;
制定道德规范:切实为人工智能生态系统制定道德准则,并在智能机器的开
发过程中确定更加明晰的标准和最佳实践;
重视再分配效应:对人工智能可能带来的冲击做好准备,制定战略帮助面临
较高失业风险的人群;
开发人工智能型企业所需新能力:员工团队需要积极掌握判断、沟通及想象力和创造力等人类所特有的重要能力。对于中国企业来说,创造兼具包容性和多样性的文化也非常重要。
新一代技术+商业操作系统(AI-CPS OS:云计算+大数据+物联网+区块链+人工智能)作为新一轮产业变革的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎。
重构生产、分配、交换、消费等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生新技术、新产品、新产业、新业态、新模式。引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。
新一代技术+商业操作系统(AI-CPS OS:云计算+大数据+物联网+区块链+人工智能)正在经历从“概念”到“落地”,最终实现“大范围规模化应用,深刻改变人类生活”的过程。
产业智能官 AI-CPS
用新一代技术+商业操作系统(AI-CPS OS:云计算+大数据+物联网+区块链+人工智能),在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的认知计算和机器智能;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。
长按上方二维码关注微信公众号: AI-CPS,更多信息回复:
新技术:“云计算”、“大数据”、“物联网”、“区块链”、“人工智能”;新产业:“智能制造”、“智能驾驶”、“智能金融”、“智能城市”、“智能零售”;新模式:“案例分析”、“研究报告”、“商业模式”、“供应链金融”、“财富空间”。
本文系“产业智能官”(公众号ID:AI-CPS)收集整理,转载请注明出处!
版权声明:由产业智能官(公众号ID:AI-CPS)推荐的文章,除非确实无法确认,我们都会注明作者和来源。部分文章推送时未能与原作者取得联系。若涉及版权问题,烦请原作者联系我们,与您共同协商解决。联系、投稿邮箱:erp_vip@hotmail.com