大数据行业生死劫:上万接口关停,90%公司将洗牌,涅槃后再重生

2017 年 9 月 30 日 腾讯科技 戈森 零和

点击上方“腾讯科技”,选择“置顶公众号”

关键时刻,第一时间送达


来源 / 一本财经(ID:yibencaijing)

文 / 戈森 零和

内容经授权转载发布


6月1日,《网络安全法》落地实施已过去三个月,大数据行业结束野蛮时代,进入洗牌期。


此前有15家数据公司被调查,此后,名单扩大到30家;


多家公司的业务负责人被约谈,他们甚至相互打招呼的方式,都变成了“今天,你被抓了吗”;


大量数据接口关停,数据产品停售,导致部分公司开始裁员,一家被调查的公司,甚至将大数据业务完全下架,退出市场。


一些公司黯然退场,一些却高调入局——一些有独家数据源的公司,在最近宣布成立。


数据行业,正处于二八分流,冰火两重天。


01 “你被抓了吗?”


2017年5月末,数据行业的清理行动开始。


据多位知情人透露,“数据堂”多人被警方调查,导致部分数据业务线停摆。


此后,数据堂发表声明称,因公司某一客户存在被公安机关调查的情形,公安机关为进一步了解具体情况,向公司个别业务人员及财务人员进行情况了解,不存在“公司高管被抓”的情形;公司业务运作正常。


目前,数据堂的官网可正常打开,但“数据定制—数据堂”的网站页面,却无法打开。



今年8月,数据堂发布股票停牌公告,称因存在“预计应披露的重大信息在披露前已难以保密或已经泄露,或公共媒体出现与公司有关传司,可能或已经对股票转让价格产生较大影响的”事项,2017年8月14日起暂停转让,预计股票恢复转让日期不晚于2017年11月13日。


“公司走了很多人,还有一些人准备拿完年终奖就走”,数据堂离职员工杨青称,“目前,精准营销线和大数据线基本暂停,现在仅靠人工智能一条业务线支撑”。


但杨青同时指出:“公司的海外客户,暂时没有受到影响。”


这只是大数据行业进入冰封时代的一个缩影。


一本财经曾独家报道,15家数据公司被调查,名单中不乏估值几十亿的大公司。据知情人透露,此后,调查范围则进一步扩大,“名单已有30家”。


行业一度风声鹤唳,传闻满天飞。


头部的大数据公司,都曾传出过CEO或高层被调查的“小道消息”。


网传聚信立的高管也被带去问话,业务呈收缩状态。


聚信立CEO罗皓不得不站出来辟谣,紧急接受媒体采访:“我敢否认,说明我们没有被约谈。”


“实际上,确实很多公司的业务负责人被约谈”,行业资深从业者罗锦江称,为了取证,通常电脑等存储设备也会被拿走。


一位大数据行业的CEO听到传闻,另外一家公司的创始人被调查,他急忙在微信上询问:“你没事吧?”


对方回复没事,说是谣言。


结果第二天,CEO又听到消息,接着再问:“今天你被抓了吗?”


“今天你被抓了吗”,这句话一度成为大数据行业高层从业者的问候语。


02 接口切断


几乎行业所有的人都明白,这次数据整顿,是为了6月1日新推出的《网络安全法》预热。


“这次是动真格了,毫无容情”,罗锦江称,5月底,很多公司主动将一些敏感业务线停掉。


“数据供应商突然间通知我们,业务暂停,但会支付违约金”,某信贷公司的商务负责人陈希称,最先被停掉的接口,就是“三要素”查询。


“所谓三要素,就是手机、姓名、身份证”,罗锦江称,以前的价格,“购买一条仅7毛、8毛”。


多位行业从业者称,三要素停了之后,大部分公司只提供两要素(身份证和姓名)的“验证”。


“把两个信息提供给数据方,对方只会反馈一个是与否的答案”,陈希称,如果符合,反馈“是”,如果不符合,反馈“否”。


陈希紧急修改了风控规则,让业务线可以勉强推进,但紧接着,更多的接口被切断。


以前一次查询2元的学历数据接口停掉,随后,车辆、住房、公积金等数据接口都全面切断。


“我们只能再次修改风控,让用户自己填写用户名和密码,授权我们去相应的页面爬取数据”,陈希称,如此操作大大提高了风控的成本和用户体验,“但合规了”。


紧接着,各项“特色”的数据产品也悄然撤下,或开始变得不稳定。


而某平台的风控总监郭飞透露发现:“今年年初,百融金服的产品收支等级,查询突然变得不太稳定,缺失率很高”。


所谓的收支等级,就是一个人信用卡和储蓄卡的入账和出账记录,并按照等级给出分数,数字远大,金额越大。


收支等级产品说明


郭飞称,这项数据,是信贷中很有价值的数据,查询一次的价格是2-3元。


但至于如此隐秘的金融数据,百融金服是如何拿到的,在业内一直是一个谜团。


华道征信的业务员称:“自6月份后,不良信息的查询、资产类,目前我们是暂停服务”。


媒体报道,为了规避政策风险,在《网络安全法》实施前,同盾停掉了“失联人修复”服务;中国移动下属全资子公司中移在线,也停掉了“移动三要素”的查询。


一边是主动停止合作,一边是客户直接跑单。


贷后邦的商务负责人称:“部分客户已与我们达成合作意向,规定一出来他们很害怕,所有关于数据的业务都暂时不接,我手上有一两例违约客户。”


大量接口断了后,行业开始了裁员潮。


头部的大数据公司,都曾传出过裁员消息。


“主要裁掉的,是销售和一些敏感业务线的人”,罗锦江称,大量的乙方公司业务人员被裁掉后,就进入了甲方公司。


03 艰难求生


2012年,马云在网商大会上震耳发聩地喊出:我们将进入大数据时代。


那一年,阿里巴巴集团设立了“首席数据官”一职,并推出大型数据分享平台“聚石塔”——这是中国大数据行业开始爆发的信号弹。


而大数据行业黄金年代的来临,是在2013年互联网金融崛起之后。



大数据和在线信贷相结合,激发了强烈的化学反应。


在黄金浪潮中,崛起了上万家的大数据供应商,他们采集数据,进行清洗加工,针对不同的应用场景,再输出不同的产品。


“早期,部分大数据公司的商业模式,极为简单,很多都是黑市采买数据后,简单打包,直接销售给客户”,罗锦江将其称为大数据的野蛮时代。


“在这里,就是大数据的天堂”,从美国回国创业的某CRO称,刚回国的时候,发现国内数据流通尺度之大,完全超乎想象。


在美国,很多并不敏感的数据,都无法用在信贷领域,比如,性别、人种颜色、年龄段,都不可随意参考,不然,就可能涉及“歧视女性、黑人或老人”。


滥用的用户数据,让大家就如裸泳一般,毫无隐私可言。


持续数年的数据之乱,终于在“徐玉玉”案之后,将行业推到了众矢之的的深渊。


这似乎成了诸多行业宿命,总是在鼎盛狂欢中,在利益催化之下,出现浮华泡沫。随后,巨大行业负面爆发,监管如期而至,洗牌来临。


校园贷和大数据行业,都是同样的轨迹。


行业正在挣扎中自救。


曾经很多大力宣传自己是专注大数据的公司,如今,对外的传播口径完全变动。


“行业污名化,不想和大数据扯上关系,外面现在都称自己是人工智能公司”,一位从业者称。


南京一家大数据公司也在被调查的30家名单中,目前,公司已将大数据业务全部关停,正在谋求转型。


“连我们业务员都需要加班加点看项目”,一家数据公司的商务称,公司甚至让他们去找项目,寻找出路。


大部分的数据提供商,正在寻找第一条自救之路:数据的脱敏、加密。


最常见的方式,就是查询结果的输出上,采取打分制,比如,如果完全匹配,就是100分,如果只有一半匹配,就是50分。


而查询不良则是用信息比对,输入名字身份证,输出命中与否。


还有一些公司,尝试用技术,保护用户隐私。如拨打催收电话,直接进行加密,只能看到一个加密号码拨出。


行业想到第二条自救之路:联合建模。


双方开发一套系统,直接放在客户公司的内部,双方共享数据,系统最终输出一个分数或结果。


“联合建模,确实解决了合规问题,能够使双方共享数据”,小赢科技首席风控官成少勇指出,从长远角度来说,这肯定是未来趋势,但目前,推进的过程依然困难重重。


今年8月,郭飞的公司和一家数据公司合作,对方提出了联合建模,但公司内部引发了争论。


“对于我们来说,增加了很大的工作量,我们不可能针对每家数据源都要去做建模,且联合建模的费用是十万”,郭飞称。


“实际上,现在大部分的联合建模,数据公司只是沦为一个技术提供商,这个模式太重,”大数据公司CEO林欣称,如果一家数据公司有20个客户,就得有20个建模师。


对于双方来说,这个模式重,成本高,为了合规都要付出代价。


04 行业洗牌


《网络安全法》出台后,要获取、使用用户的数据,都需要用户授权。


而第三方的数据公司,很难再用这种方式获取数据。


林欣认为,这样的公司,无非只有两个命运:要么在原有的老数据基础上,挖掘建模,但这样的产品,很快就会过时;


要么就变成技术提供商和咨询商,比如联合建模。但这个命运,也不能让人愉悦。


如果变成技术提供商,很难和大的公司合作。因为,大的公司数据和风控,都视为核心部门,很少外包;其次,大的公司对数据提供商也百般挑剔。


因此,数据公司几乎只能给小的公司提供技术服务。


“大的公司,从6月之后,都要求数据提供商签一个承诺书,确保使用的数据,都是经过用户授权的”,罗锦江称,基本没几家公司敢签字。


行业的最终命运如何?


“行业90%的公司将被淘汰”,多位行业从业者都下了如此的判断。


有意思的是,一边是死亡,一边又是生长。


就在9月25日,联通大数据公司成立。


“未来,有一类大数据公司能活得不错,就是拥有稀缺数据源的公司”,林欣称。


而成少勇也是同样的观点,只有独家、且不断更新的数据公司,才有竞争力,“二八格局已非常明显”。


对于此次洗牌大潮,大多从业者表示,并非坏事。


劣币被驱逐,良币才能沐浴阳光,茁壮生长。


去芜存菁,正本清源,大数据行业的野蛮时代终于结束。




登录查看更多
0

相关内容

数据堂是国内首家专注于互联网综合数据交易和服务的公司,致力于融合和盘活各类大数据资源,实现数据价值最大化,推动相关技术、应用和产业的创新。
商业数据分析,39页ppt
专知会员服务
159+阅读 · 2020年6月2日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
117+阅读 · 2020年5月10日
【复旦大学-SP2020】NLP语言模型隐私泄漏风险
专知会员服务
24+阅读 · 2020年4月20日
【ICMR2020】持续健康状态接口事件检索
专知会员服务
17+阅读 · 2020年4月18日
新时期我国信息技术产业的发展
专知会员服务
69+阅读 · 2020年1月18日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
300+阅读 · 2019年12月23日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
华为和其“公关危机”下的5G发布会
1号机器人网
7+阅读 · 2019年1月27日
为什么AI公司都在一边融资,一边投资?
腾讯创业
6+阅读 · 2018年9月25日
厉害!这家AI公司12个月市值2100亿,市盈率仅46!
全球人工智能
5+阅读 · 2018年3月21日
IDG资本杨飞:从价值投资谈2017中国现象
IDG资本
4+阅读 · 2017年12月22日
Arxiv
110+阅读 · 2020年2月5日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
SepNE: Bringing Separability to Network Embedding
Arxiv
3+阅读 · 2019年2月26日
VIP会员
相关VIP内容
商业数据分析,39页ppt
专知会员服务
159+阅读 · 2020年6月2日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
117+阅读 · 2020年5月10日
【复旦大学-SP2020】NLP语言模型隐私泄漏风险
专知会员服务
24+阅读 · 2020年4月20日
【ICMR2020】持续健康状态接口事件检索
专知会员服务
17+阅读 · 2020年4月18日
新时期我国信息技术产业的发展
专知会员服务
69+阅读 · 2020年1月18日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
300+阅读 · 2019年12月23日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
Top
微信扫码咨询专知VIP会员