慧安金科黄铃:减少对标注数据的依赖,做规避用户隐私的AI风控丨镁客请讲

2019 年 8 月 26 日 镁客网



倾听创业故事,对接融资需求

 欢迎做客【镁客·请讲】栏目

点击菜单栏-联系我们让更多人看到你们


图 | 慧安金科创始人黄铃

慧安金科主要通过自主研发的半监督主动式机器学习技术来构建金融风控方面的预测模型和决策引擎。

策划&撰写:巫盼

洗钱、金融欺诈、各种黑产……

移动互联网带来诸多便利的同时,也是悬在我们头上的达摩克利斯剑,稍有不慎,便会跌入圈套损失惨重。

“金融领域新的应用场景和产品不断涌现,随之而来的各种风险、欺诈行为也是层出不穷。”这些促成了慧安金科的创始人黄铃回国投身于AI风控事业。

确实,在越来越频繁的金融欺诈行为下,智能风控是趋势,也是必然,借助AI技术的特性,它能做到及时预警、将损失最小化。

国内有AI技术极佳落地场景

2017年,国内的创业氛围都弥漫着AI的味道,彼时还在国外从事大数据、计算机安全工作的黄铃,也看到了国内发展智能风控的机会。

“当时很多国内用的方法,在面对这些新型的应用场景时存在不足,我们的机会还是很大。

作为AI领域的创业者,黄铃的个人履历可以说非常亮眼,这也是诸多AI明星创企的标配。黄铃是美国加州大学伯克利分校的计算机科学博士师从Anthony Joseph和Michael Jordan,一直从事机器学习算法研究以及计算机网络建模应用,在英特尔研究院担任过资深科学家……所以,他极为擅长借助AI技术解决网络、数据和业务安全问题,这也是慧安金科专注于智能风控的原因。

“我们希望把在硅谷、加州伯克利研究积累的技术,应用在国内的风控场景下。”黄铃表示。

正好当时国内移动支付等线上金融产品面临着风控上的巨大挑战,天时地利人和下,黄铃果断与另外两位伯克利的同窗,成立了主打金融风控的慧安金科。

黄铃强调,回国创业最关键的不是把国外现成的模式拷贝到国内,“我们更重要的是创新,国外有很好的技术,但是在国内有更好的应用和落地场景。

一方面是国外积累多年的机器学习研究,一方面是国内移动互联网发展下不断涌现出的金融领域新场景、新应用,黄铃领导下的慧安金科发展迅猛。

成立一年后,他们就完成了由创新工场领投,高瓴资本、丹华资本、长风智清等投资机构跟投的1亿元A轮融资。

高额融资背后也是对他们技术特性的肯定,目前,慧安金科主要通过自主研发的半监督主动式机器学习技术来构建金融风控方面的预测模型和决策引擎

减少数据标注的需求,用技术说话

正所谓道高一尺魔高一丈,传统的风控方式已经无法对抗现在全球范围内的团伙作战、狡猾多变的风险行为。

黄铃举了个例子,以前你需要大量的人工,以及历史风险样本训练模型,积累黑白名单生成风控的规则系统,这种方法面对新的风险威胁和攻击防范起来非常吃力。

他进一步指出,如果我们采用黑白名单、IP信誉库、规则系统这些方法,会涉及到大量数据的收集,也必然会关乎个人隐私问题。所以,慧安金科采用了半监督主动式机器学习技术,在尽可能少的数据标注下,融合图关联分析、用户行为建模等方法,准确快速地判断交易行为和账户可能存在的风险,进行预警和控制。

所谓的半监督学习,也就是让学习器不依赖外界交互、自动地利用未标记样本来提升学习性能,它的关键就在于利用少量的标注样本和大量的未标注样本进行数据模型的训练。

同时,因为风控反欺诈领域里每个标注过的案例都意味着血淋淋的代价,所以从这个角度看,AI风控也应该用尽量少的历史案例训练出合适的机器学习模型。

“用标注很少的数据进行建模,就得对海量未标注的数据进行交叉分析查询、异常检测,相应的计算复杂度会比有监督机器学习高的多,从而对算力提出更高的要求。所以我们需要设计很好的算法,既能够利用没有标注数据的特性,又能够降低处理这些数据的计算量。”这也是慧安金科独特在算法上的独特优势。

AI公司更要接地气

黄铃对公司的定位非常清晰明确,他强调AI只是一种技术手段,一个公司赖以生存的根本还是要“接地气”,即用技术解决客户的实际业务问题,这样才能体现技术的价值。

目前,慧安金科的业务也非常聚焦,主要集中在金融风控场景,包括交易反欺诈、反洗钱、营销风控和操作风险识别等等,他们也和不少股份制银行、电商平台达成了深度合作。

“在这些场景里我们有自己核心的产品和平台,既能兼顾客户的需求,也会在解决方案的基础上做一些定制。”黄铃认为,智能风控的核心就是让数据说话,但是我们也急需好的制度去规范管理这些数据。

而且金融领域最为敏感的便是个人的数据隐私安全,智能风控系统做到“监守不自盗”尤为重要,这也是黄铃再而三强调的,不涉及个人数据隐私的情况下去建立好的风控模型,通过算法提高对抗狡猾多变的欺诈行为的能力。

所以,慧安金科的目标是在不完全依赖历史数据情况下,或者存在数据孤岛的情况下,依然能够建立出非常准确的风控模型。

“我们一直朝这个方向努力,现在用的模型会更关注用户的行为数据,你不需要知道这个人是谁、他的电话等等信息,我们是根据他一系列行为去建模,而不是根据本人的身份来判断风险。

黄铃之前在采访中曾举过一个例子,用户填写账号或者输入密码时的速度、填写的顺序、手指按下的力度等行为数据,都可以作为“数据原料”,通过对这些数据进行特征的衍生处理和关联分析,可以检测出不同纬度上的异常。

从镁客网和黄铃的采访中可以明显感受到,这是一家强技术驱动的公司,真正做到用人工智能技术解决传统方法无能为力的问题。不过,当前智能风控到底能规避多少可能存在的风险行为,还是亟待更为先进的技术去推动。

估值超10亿美元!这家自动驾驶卡车创企如何一跃跻身独角兽行列?

 

三星7nm制程代工毁了全部高通5G芯片?台积电、联发科的机会来了

 

造车新势力"争斗"之下,"渔翁得利"的会是新能源后市场吗?


 星标我们,不要错过 


镁客网

科技 | 人文 | 行业
微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

登录查看更多
0

相关内容

专知会员服务
123+阅读 · 2020年3月26日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
【综述】金融领域中的深度学习,附52页论文下载
专知会员服务
163+阅读 · 2020年2月27日
2019年人工智能行业现状与发展趋势报告,52页ppt
专知会员服务
120+阅读 · 2019年10月10日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
推荐系统这事,难不?难在哪里?
聊聊架构
7+阅读 · 2018年2月26日
Arxiv
7+阅读 · 2020年3月1日
Deflecting Adversarial Attacks
Arxiv
8+阅读 · 2020年2月18日
Adaptive Neural Trees
Arxiv
4+阅读 · 2018年12月10日
Arxiv
6+阅读 · 2018年3月12日
VIP会员
相关论文
Arxiv
7+阅读 · 2020年3月1日
Deflecting Adversarial Attacks
Arxiv
8+阅读 · 2020年2月18日
Adaptive Neural Trees
Arxiv
4+阅读 · 2018年12月10日
Arxiv
6+阅读 · 2018年3月12日
Top
微信扫码咨询专知VIP会员