【导读】吴楚:当人们可以通过技术手段实现风险管理模型的优化时,钻法律空子和规则漏洞的违法者未来可能没有那么轻易能够得逞了。
政府招标项目中的腐败调查、集装箱货物在海关的入关查验、批贷评估,这些看似毫不相关的问题,解决的思路是类似的:在全部数据或者文档中,抽样检查很小的一部分样例。在荷兰,这些问题都在通过人工智能的技术手段解决。传统的分析方法越来越无法处理日益庞大的数据量,认知技术包括数据挖掘、机器学习和自然语言处理正在取代传统分析方法,并应用这些海量数据集,以帮助找到已知和未知风险的指标。人工智能特别适合应用在风险管理领域,因为典型的风险问题通常包括不太可能或者模棱两可的事件。
为什么说人工智能是风险管理行业的游戏颠覆者?由于计算处理能力的提升以及数据存储成本的降低,人工智能的应用越来越广泛,这其中,基于认知的技术的人工智能可帮助计算机像人类一样互动,推理和学习。通过认知分析,计算机可以具备学习和推理技术。在现实世界中,存在着大量的非结构化数据,使用包括自然语言处理(NLP)在内的认知技术,使用高级算法来分析文本,以便从非结构化数据中获得洞察力和情感。尤其是在风险管理领域,需要面对大量而庞杂的合同、文献以及法律材料等信息从中找到相关联的线索,使用人工智能技术对这些非结构化的数据处理将极大提高问题处理效率。
荷兰政府的反贿赂调查
荷兰德勤通过人工智能技术调查政府官员接受贿赂以帮助某些公司赢得公开招标的案件。这些行贿的公司通常会聘请销售代理人向公职人员支付账外贿赂费。在调查过程中,需要在海量的合同数据中确定调查哪些合同与贿赂案有关,同时需要确定哪些合同与销售代理人的哪些付款相关。德勤将人工智能与机器学习的方法应用在整个调查过程中,以发现与贿赂有关的合同、电子邮件和文件;分析与销售代理有关的付款和财务交易;运用法务会计的分析方法通过对原始文件的分析确定交易和文件中的证据;通过多种手段预测文件、邮件、档案之间的相关性;确定出被怀疑对象的人际关系网络草图,确定受怀疑者相关的处理系统和流程并进行数据搜集,同时对支付和相关的财务文档进行数据分析。在这里,律师不需要阅读所有的文件,通过人工智能技术辅助调查、分析、发现的过程,律师只需要阅读最相关的文件,即可找到受贿嫌疑人。利用机器学习的方法,加快案件调查的进程。
海关查验
鹿特丹是荷兰乃至欧洲主要的过境港口,每年都有数百万的集装箱过境,公司和组织必须向海关提供有关货物的申报信息。欧洲的入境规则很复杂,有时还可能发生改变。在选择的过程中,海关根据公司提供的基本信息决定哪些集装箱需要抽检。每种选择的方法都会产生误报和漏报,误报导致集装箱入关不必要的延迟,漏报导致非法货物进入欧盟或者产生税收损失,海关的目标是最小化这些错误。是否有可能通过更复杂的分析技术来支持海关的选择过程?在这个过程中,是否能保证在遵守欧盟法规的前提下,增加检测概率、减少漏报和误报的数量?
海关查验问题和反贿赂调查之间有什么共性呢?(1)用户面临的问题都是类似的,在真正的处理环节之前,都需要确定哪种情况是需要检查的,哪种情况并不需要。(2)方法论是类似的,采用机器学习的分析方法可以极大的提高分析效率和分析的准确性。(3)两个问题都需要在相对短的时间窗口解决。
在这个案例中,基于监督学习的方法可以改善现有的风险评估模型,因为模型决定什么是高风险指标,通过数据反馈优化模型中的指标,最终海关在基于优化的风险评估模型的基础上,对严格符合某些标准的集装箱进行检查,所产生的结果数据形成反馈闭环,不断优化的风险评估模型。
在反腐败调查和集装箱查验问题中,处理方式是相似的。风险评估的模型使用了同一类的算法,在处理在整个所有文档/数据中小部分抽样的问题中,都可以使用同一类算法在优化风险评估模型。主要的不同是,有的项目是非结构化的数据,有的项目是结构化的数据。但是这些的问题相似性大于不同性。
除了反腐败和海关查验,在金融风险管理领域,判断是否给个人用户贷款、信用卡消费欺诈、是否需要对产生负面消息的公司撤回贷款等应用中,人工智能技术都大有可为。而随着认知欺诈检测系统不断自我的学习,他们将能够发现更复杂的欺诈行为,这一优势可能对风险管理领域产生深远的影响。因为认知技术,机器帮助人类发现永远无法发现的风险。
荷兰德勤高级经理Sander Koemans根据项目实施的经验告诉我,在风险管理行业应用人工智能技术的挑战并不是如何使用人工智能技术本身,而是数据相关的问题。挑战是如何获得数据,如何获得正确格式的数据。公司通常所拥有比他们以为有的数据更多的可用数据,如何以创新性的思路获得所需要的、可用的数据,并将数据结构化,是一个通常的挑战。数据在哪里?如何将这些数据转移到一个单一的系统里?如果要看五年以前的数据,在数据集里,这些数据可能是不同的格式。如何处理五年以前系统更换的问题?
如何应用非结构化数据是另外一个挑战。现实世界中,只有15%的数据是结构化的,另外85%是非结构化数据,而且非结构化的数据在以超过结构化数据增长速度三倍的速度增长。德勤在上述的案例中,使用很多可用的文件、法律套件、邮件、或者邮件中包含的文本,使用系统抓取这些数据,通常是用关键字搜索,例如“VAT诈骗”,可能会得到很多关于VAT相关的邮件,但其中有很多与VAT诈骗是没关系的,只是让你交税,所有的这些文件通通是不相关的,通过人工检测上万份文件数据将是巨大的工作量,而通过算法,可以节省大量的人工。
通常来说,很多组织所面临的问题非常的复杂。为了正确的分析出风险,使用人工智能技术系统能够处理更加复杂的情况,变得更加的聪明,能够在金融风险领域、反欺诈、反腐败等领域做的更好。目前,在很多组织里,相应的工作是靠人手工来完成的。然而通过人工智能技术,很大的一部分工作可以自动完成的,人工智能能够在产生更少错误的情况下更快的完成更复杂的任务。在大量的非结构化信息面前,利用认知分析技术预测和主动进行风险管理可以帮助企业获得竞争优势,并且通过风险管理来提升组织的绩效。当人们可以通过技术手段实现风险管理模型的优化,钻法律空子和规则漏洞的违法者未来可能没有那么轻易能够得逞了。
注:感谢荷兰德勤金融犯罪分析高级经理Sander Koemans先生接受作者访谈。
(本文仅代表作者本人观点,责编:闫曼 man.yan@ftchinese.com)
来源:
http://www.ftchinese.com/story/001079558?full=y
-END-
专 · 知
人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!
请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!
请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~
请关注专知公众号,获取人工智能的专业知识!
点击“阅读原文”,使用专知