3月7日,北京大学“人工智能前沿与产业趋势”第二讲。本期主讲嘉宾为蚂蚁金服副总裁漆远,他的授课主题为:《人工智能与金融服务》,有技术、有举例,自然也有不少干货。
值得一提的还有课后讨论环节,北大人工智能创新中心主任雷鸣,还与漆远就未来AI在金融中的应用发展、突破等问题进行了探讨,问答都很精彩。
量子位作为独家合作媒体,为大家带来本期干货整理。
主讲嘉宾:漆远,蚂蚁金服副总裁、蚂蚁金服首席数据科学家。国家千人计划特聘专家。2005年获得MIT博士,并在MIT计算机与人工智能实验室进行博士后研究工作,受聘普渡大学计算机系和统计系终身教授。
2013年回国加入阿里巴巴,任职集团副总裁,与王坚一同领导创建iDST(阿里数据科学与技术研究院)。目前是机器学习权威杂志Journal of Machine Learning Research的执行编辑及机器学习会议ICML的领域主席,并获得微软牛顿研究奖和美国科学基金NSF Career奖。
以下为漆远博士分享实录整理:
今天跟大家主要分享一下蚂蚁金服目前在AI技术上的一些思考和发展。
我觉得今年是一个很好的时间点,大家能有更多的思考,带来更多的来落地和更深入地去发展技术。所以我们介绍一下人工智能,在蚂蚁金服和阿里的一些发展。
提到蚂蚁金服,在去年大家普遍的理解是:蚂蚁金服一个金融服务公司。其实蚂蚁金服有着AI的金融应用场景,其中也产生了很多有意义的问题和挑战。
这些场景的数据是AI产生的一个重要的源泉。那不同的数据怎么来产生价值,怎么利用数据,开发出更多的价值?这里边有很多挑战,比如时间的敏感性,一个交易,需要在毫秒级内作出判断,这里就牵涉到很多机器学习问题。
还有大家熟知的余额宝,其实这一切产品的背后,都有风险控制的需求,有信用的需求,我们怎么能够从不同的角度,把数据综合来看,产生更多的价值或更安全的系统,那这是非常有意思的问题。
另外一个方面是安全,还有系统性风险,有时候整个系统本身会产生风险。怎么从一个系统的角度来考虑,这个问题非常关键。
我们提出了一个“金融大脑”的概念,简单来说就是做出了一个强有力的金融平台。它有几个核心的功能:风控信用决策、降低服务成本和提升服务体验。
做金融智能的核心是安全,所以蚂蚁金服做了很多安全上的考虑。我们开发的金融智能平台里面涵盖了很多算法,下面介绍一些具体的例子。
系统安全
怎么能够保证系统安全性是非常关键的问题。
第一个关于系统安全性检测,我们采用了弱监督学习的技术,主要是用于发现潜在威胁和提升攻击检测。这个技术的上线效果非常好,蚂蚁金服出了一系列的文章来详细介绍弱监督学习。
反洗钱
另外一个很大的问题是反洗钱,怎么通过机器学习的角度,自动地系统化地来学习,是非常有意思的一个问题。所以我们建立了反洗钱模型,用的是无监督或者弱监督图算法,用于资金交易网络特征挖掘和无监督隐案挖掘。这都用到了真实的这案例中。
垃圾账户识别
举一个具体化的例子:垃圾账户识别。垃圾账户注册防控能够降低后端风险基数,稳定大盘指标,极大地提高整体的账户质量。控制垃圾账户的注册,确定账户是一个真实的有效的账户,是一个很关键的问题。
对于新注册用户,怎么来判定这是不是一个垃圾用户?我们的想法是从系统的角度来考虑人和这个社会之间的关联,然后构造网络,从网络结构来思考,一个人的信息不会很多,那么可以借整个网络的信息来一起分析。具体来讲就是组里老师开发了一个叫Struc2vec的算法,核心思想非常简单:把网络和深度学习结合起来。
Struc2vec算法的规则,很好地平衡了预测准确率和预测召回率。基本上是在90%的召回率情况下,准确率也基本能达到90%左右。
说明这个算法有非常强的区分能力,能够比较准确地区分一个账号的好坏,同时和经典的规则以及Node2vec比较,预测召回率也有所提升。
再说一下智能营销中的应用。很多公司都有增长用户的需求,那怎么来促进增长?平台怎么把商家和用户连接起来,那是非常关键的一个问题。
这里面我们就考虑到强化学习和加强学习,它的核心思想是:把现实的决策问题,放在数学的框架下来考虑。它的优势是能精准刻画用户状态、多渠道组合决策和全人群差异化决策。
去年提过,深度学习有一个非常大的提升,现在比深度学习的方法又有了一个很大的提升。在推荐卡片点击率上,实时深度强化模型较深度学习提升了70%;在最终签约率上,提升了50%。
再讲另外一个跟营销相关的问题。在现实生活中,大家可以看到不同的信息,那能不能把所有的信息源融合在一起?也就是怎么把信息融合在一起,使我们能看到更全面的细信息,来帮助更加精准地理解和判断。在金融的场景里,怎么把不同的行为结合起来。
这是非常有意思的一个问题。在这上面也可以理解为把很多数据源都接进来,然后在隐含空间里面把数据做一个综合,用统一的框架来表示。
举个真实的例子。看右边这张图,大家看到什么共同的特征?是很多穿着紧身牛仔裤的年轻女孩子,分析这个行为,发现买紧身牛仔裤的女孩,较其他人,买手机碎屏的服务的概率比较高。
于是我们就开发了叫做“碎屏险”的产品,这是非常小但很创新的产品,我们做推荐的人群就是左图这群人。
还有非常多类似的事情,一旦发现数据间的强关联之后,就能用很多应用来解决一些小的问题。
举一个定损宝的例子。
大家非常熟悉的是人脸识别,换一个场景,把计算机识别应用在这个车上。看到一辆车,我们目标是判断这车里哪里有问题,如果撞车,损失的价格是多少。
那么首先要知道哪些地方有问题,所以我们要识别每一个部件,这是经典的计算机视觉的问题。识别完之后,还要判断有没有问题。同时还要处理很多噪音的问题。
定损宝的决策是全链路深度学习,先将噪音去除进行类目识别,基于目标检测进行原因判断,程度判断,对目标分割进行多图融合,再生成决策。
除了刚才提到的在保险的应用之外,金融大脑本身还用在了金融信息服务里。
其中一个是智能助理。在蚂蚁金服里,智能助理起源于智能客服。蚂蚁金服业务发展太快,客户需求一直很高,必须要考虑使用智能客服,后来就考虑应用了人工智能。
客服机器人算法上是应用了结合用户行为轨迹的语义匹配模型。现在其实机器能解决大部分问题,但是在特别疑难的,很重要的大问题上,我们还是保证质量,机器人无法回答。
现在我们想推出一个机器人,它能够进行多轮对话,有整体的系统的智能。通过自然语言处理和机器学习的能力,向一系列场景:从买机票,买火车票到发红包,甚至医院挂号等场景都提供服务。
金融智能平台
前面讲了很多AI的具体应用,但真正背后它们都依赖一个非常关键的东西:平台。能够非常快地处理海量的数据,然后分析作出预测,这就是金融智能平台。
金融智能平台核心的第一条是安全。另外两个是实时性和大规模。
AB测试
从一个系统的角度来讲,一个策略要关心它从上线到下线,中间产生了什么效果,怎么保证它的效果?它是不是有问题?这里面一个方法叫做AB测试。我们把这个法,用在了金融的服务里面。AB测试是一个简单的因果分析的工具,用这个东西,和不用这个东西,比较来看它的效果。所以这是一个科学决策机制。
AI应用于金融,是不是有什么风险?我们会用什么方法去尽量避免这些风险?
在过去几年里面很多人,包括AI的研究人员都特别注意,我们不希望真的有一天我们的生活,从遥远的未来来讲,真的被AI控制。就目前而言,我觉得我们到那一天的距离和其他能看到的直接的危险还是比较小的,当然也有可能越是做这行的越没有意识到的风险。我们知道太多AI无法做到的事情,所以我们觉得到那一天今天我们技术本身还需要非常大的突破。
说一下近距离的风险。比如股市的突然波动。从几个方面来说一下风险:第一个叫算法的可解释性。要避免灾难,首先要理解它,理解这个决定是怎么做出来的。而今天很多深度学习系统,处理的数据是上亿的,人很难判断它核心什么变量的哪些变量哪些变量组合导致了我最后这个决定。
第二条是不确定性。很多决定做的是非常肯定的,有的决定做出来其实不肯定的。从决策论的角度来讲,那就有一个这个非常大的风险在里面。可喜的是还有很多的补救方法,大家可以考虑其他的方案,使决策更合理。
第三点是AI的系统风险。假如有很多AI系统同时在跑,他们其实可能会产生一种叫做系统性的风险。这个风险也是非常非常关键的,尤其在金融系统里边,这个是群体性的问题。
过去一年里,蚂蚁金服有哪些技术应用取得了一些进展,未来会有哪些技术在金融上取得突破?
去年的话,大家首先想到了深度学习。在金融里面第一大区域是风控,风控里面的只有很少的数据是有标注的,所以去年我们开发了弱监督学习算法,用在了风控里面。
这是业界就我个人所知,第一个使用这种算法。
然后在以后,我觉得对不确定性和解释性会更加关注。简单来说就是万一出了什么风险,我需要知道是怎么发生的。知道之后,预防它,不让它发生,这个非常关键。
对于学生来说,准备投身到金融领域,大家应该在哪些领域打好基础,为将来做更好的准备?
第一,我觉得金融领域特别适合机器学习,包括泛金融行业,都是关于数据,关于计算。
第二个说怎么准备,我觉得如果大家对金融感兴趣,可以学习的金融的基础知识,同时把这个人工智能它核心的一些东西学好。人工智能它本身是一个非常跨学科的学科,比如说统计;优化,怎么来做优化;应用数学,包括物理的很多东西和机器学习有很多相关性。鼓励大家多学一些东西。
未来AI可能在金融行业哪些领域有大的突破?或者说对社会进步会真正落地,真正公开,真正有用?
这个确实不好回答,因为这个问题是讲商业的问题。AI很多应用在没有产品化之前,C端的用户并不能体会到,并不知道每笔交易背后有AI算法。
另外我觉得是投资本身。大家以前做算法交易,主要靠高频交易,那高频交易肯定不是蚂蚁金服的使命,我们也不做这个东西,那我们做金融信息服务,我们怎么能够把信息提取出来,帮助做决策做的更快,然后服务管理资深的用户做更理智的决策。
从技术到应用,还是一个不断探索和捕捉的过程。技术跟应用结合过程中,什么时机比较成熟,有时候回头看有必然性,但是往前看的时候感觉什么都是偶然的,所以我觉得去多做一些探索。
对于创业企业,它在往前走的过程中,能有一些什么样的方式、方法避开这些大公司的锋芒,去比较好地建立起自己企业的优势呢?你有什么想法?
首先说一下,这个不是我擅长,我就讲一讲我自己的一个体会吧。第一个观点:拿技术来获取数据得交换,为什么给你数据?因为我为他产生价值,我能为他产生价值,产生有用的东西。就说如果大家的技术特别牛,那找到一个痛点,从痛点出发,技术能不能产生这种所谓技术服务,然后产生数据。
第二个我想说的是,考虑其他的因素,考虑新的技术。社会本身是最大数据的来源。
第三个,是自己的一个设想:在新的架构下,未来可能产生新的获取数据的机制。
对区块链这一块,就个人观点谈谈这个事情吧,你对新概念大概是一种什么样的观点?对它的技术层面,包括说未来应用发展这一块有什么样的想法?
区块链我其实关注了好几年,但是我并不是这个区块链专家,也没有专业做区块链。回看历史来理解,区块链的话,我觉得像互联网一样,会产生一个新的大的改变,对社会机制的改变。它产生了一个新型的机制,使大家能够不需要一个中心化的东西。区块链技术还在早期,还有很多机会。
下期北京大学“人工智能前沿与产业趋势”第三讲,将由旷视科技旷视研究院首席科学家孙剑,带来关于计算机视觉如何应用与落地的相关分享。关注微信公众号“机器学习研究会”可获取参与方式。
祝大家听课愉快~
在量子位微信公众号(QbitAI)界面回复:“180309”,可获取本次课程的视频回放链接。
— 完 —
加入社群
量子位AI社群15群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot6入群;
此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。
进群请加小助手微信号qbitbot6,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态