大数据黑产业:有人年收入达到十几亿元!

2017 年 11 月 5 日 全球人工智能

——免费加入AI技术专家社群>>

——免费加入AI高管投资者群>>

2017年6月1日之后,一群做大数据地下产业的数据采集者和数据掮客常常聚在一起讨论两条最新出台的法规,惶惶不可终日。


“近期确实抓得很严,我周围不少人进去了,其中有一个人年收入十几个亿的。”一位数据掮客告诉《财经》记者。这名掮客曾在运营商和一家大型互联网公司从事数据相关工作,由于工作经历,他认识不少数据的买卖双方,经常攒局非法交易数据。

在他组的各种局里,主要议题是如何换数据、洗数据、做数据补全。但明面上,他是一家创业公司的核心成员。

另一位在地下数据产业周旋超过十年、目前是一家大数据公司创业者的人士对《财经》记者说,“我知道有一批数据公司要完蛋,包括新三板上市公司,和一些地方政府视为座上宾的公司,它们主要的数据渠道是黑色产业,一些高管已经进去了。”

据不完全统计,国内个人信息泄露数达55.3亿条左右,平均每人就有四条相关的个人信息泄露,这些信息最终的命运,是在黑市中反复倒手,直至被榨干价值。

其中,80%的数据泄露自企业内鬼,黑客仅占20%。

一位大数据产业的企业家对《财经》记者说,从企业到方方面面,对大数据安全都有一个认识过程,这给了大数据地下产业滋生的空间。

《网安法》颁布已有数月,相关细则也在陆续出台。7月下旬,中央网信办联合四部门开展互联网隐私条款专项工作。微信和微博作为首批测评对象,分别在9月中旬更新了用户隐私条款,规范了用户数据使用办法。

监管的口子越收越紧,但大数据地下产业的冬天真的来了吗?

2016年11月9日,西安市公安局雁塔分局刑侦大队,警方破获贩卖个人信息案。在某房地产公司工作人员陈某的因贩卖个人信息被雁塔公安分局刑拘。民警正在对犯罪嫌疑人陈某进行讯问,陈某对他贩卖个人信息的行为悔恨落泪,办案民警递上纸巾安慰陈某。图/视觉中国

内鬼猖獗

《网安法》生效后,仍然有大量渠道可以进行地下数据交易。这个“地下黑网”日交易额可达上亿元,整体规模难以估测

7月底,《网安法》颁布快两个月时,一家针对商务人士的培训公司市场负责人孟先生在几家面对高端读者的媒体上投放广告,但此后一个星期,没有接到一通打来咨询的电话。

多方打听之后,他换了一种渠道,去购买一些目标用户的个人信息数据,尝试“精准营销”。

7月24日晚,他在南京的一家网站上留言,希望购买一些个人信息数据,并留下了联系方式。

第二天一早,电话就打过来了。这个电话将他一步步带入数据地下产业。

打电话过来的人是该公司的销售人员,针对孟先生想要高净值人群信息的需求,他提出,可以提供经常出入别墅、高端酒店和高尔夫球场等场景的个人信息数据,包括手机Mac地址和Imei地址。

Mac是Media Access Control的缩写,是手机网卡的身份证号,用来定义网络设备的位置,具有全球唯一性。Imei是International Mobile Equipment Identity的缩写,是由15位数字组成的电子串号,一个号码对应一台移动电话机,具有全球唯一性。

通过Mac地址和Imei地址可以直接进行网络营销,被获取手机地址的人,只要打开网站,就能收到相关推送,而不是通过个人搜索行为来进行广告推送——这是目前多数大数据营销的正常手段。

这家南京公司的报价是Mac地址0.2元一条,Imei地址0.25元一条。

孟先生觉得这种方式效率还是太低。他询问对方能否直接提供目标人群的手机号,对方犹豫了,表示最近抓得很紧,手机号这类个人信息比较敏感,风险太高。

不过,这位销售人员提供了另外一条路径。

他说自己的公司与一家号称是上海联通呼叫平台的公司有合作。孟随即与之联系,呼叫平台相关人员告诉孟先生,他们可以通过南京公司提供的Imei地址定位到具体的手机号。

呼叫平台工作人员告诉孟先生,由于近期风声紧,他们只接大单,目前上海本地的订单已经不接了,低于100万元的订单也不能接了,但是这类小订单还可以通过合作平台来接,一个号码收费10元。但他强调,如果订单量够大,可以把价格降到一半以下。

用这样的方式进行电话营销,需要孟先生提供一个8位数的联通座机号码,信息被卖掉的手机号机主接到电话时均显示此号码。为了增加通话率,降低投诉率,他们还能提供闪信服务,在拨通电话前添加企业名片。

闪信在十几年前就出现了,是一种免费的短信服务,发送给用户的信息可直接显示在其手机屏幕上,阅读后信息不自动保存。但是由于通过闪信发送的骚扰信息太多,不少手机厂商已经开启了闪信屏蔽功能。

呼叫平台人员向孟先生强调,可以直接通过他们的标签来找目标人群,不需要先从南京公司那边购买Imei地址再给他们转成手机号,他们自己就可以通过联通用户的数据,比如地理位置、轨迹,以及通信费用占比,甚至包括交通工具等信息,来判断目标人群的收入和喜好来进行用户画像。

仅靠联通的数据会相对单一,上述呼叫平台工作人员透露,他们也在做数据整合优化的工作,正在与银联、学信网(高校学生信息网站)进行数据整合,这样可以让用户画像更加精准。这意味着,银联、学信网也出现了“内鬼”,而且他们之间达成了合作。

下了订单之后,前期流程包括审核客户的营业执照、预估项目大小、准备好确认的座机号码等工作,确认具体需求之后,只需要两天时间就能调出所有的数据和手机信息,通过他们提供的外呼平台就可以拨打电话。

呼叫平台人员还向孟先生强调,他们也接过银行的订单,但是营销效果如何他并未跟进,也未透露具体的客户信息。

《财经》记者联系了上海联通相关负责人,上海联通反馈,该公司呼叫中心的用工均为外包,招标入围后签订业务外包合同,坐席签订安全保密协议责任书。目前供应商有三家。上海联通相关负责人向《财经》记者强调,联通对倒买倒卖用户数据零容忍。

另一位从事数据交易超过十年的从业者告诉《财经》记者,由于体量庞大,外包公司和经销商过于分散,大型企业这样的问题很难根治。

浙江一位开发运营商核心软件的公司负责人告诉《财经》记者,《网安法》给他们带来了新的商机,南方一些运营商已经开始上马数据安全项目。

“过去一些运营商的数据库内部人能直接访问,现在要求内外网隔离,生产库查询库隔离,堡垒机审计,就是为了避免内鬼往外倒腾数据。”他说。

一位圈内颇有名气的前黑客,现国内某安全公司负责人告诉《财经》记者,虽然黑客听上去“神奇又神秘”,但是80%的数据泄露是企业内鬼所为,黑客和其他方式仅占20%。

黑客生态

一线黑客多是学历低下、没有固定工作的年轻人,赚来的黑钱大半被“师父”拿走,而“师父”之上还有“师父”

内鬼、黑客、爬虫以及手握数据的公司与个人之间的数据互换,是构成地下数据交易的主要来源,这些数据再经过清洗、分类,可以从不同的渠道销售出去。数据用途主要是精准营销,也包括身份认证和诈骗。

除了公司内部和外包公司,另一个容易出问题的是经销商。

今年6月,广东苍南警方称,他们在今年1月发现有苹果公司国内员工涉嫌以非法手段获取苹果手机关联的个人信息。涉案的22人中有20人在苹果国内直销公司及苹果外包公司工作。警方没有披露余下两人的相关信息。

遭售卖的信息包括苹果手机关联的手机号码、姓名、Apple ID等,警方未提到这些信息中是否包含密码和信用卡卡号这样的金融信息,如果此类信息也遭售卖,就表明这些犯罪嫌疑人能够获取苹果内部数据,后果也更加严重。

分类信息网站58同城在今年3月遭遇的信息泄露事件,则是典型的爬虫问题。有需求的个人或公司,只需在淘宝上支付700元购买一种爬虫软件,用卖家提供的账号登录后就能不断采集应聘者的相关信息,该软件每小时可以采集数千份用户数据。

事件曝光后,58集团立即回应,称将追查并加固信息安全系统,提升防爬虫技术手段,进一步区隔个人信息物理存档。

但到了8月,《财经》记者发现,淘宝上仍在出售能够扒到58平台个人信息的爬虫服务。如果直接购买成型的信息数据,只需要提供一个分类网址,例如,北京地区提供家教服务的列表,短时间内就能提供所有发布信息用户的姓名和手机号码。

具体的价格是,简单清洗去重的数据1000条售价50元,可议价,大量购买价格更优惠。

58集团书面回复《财经》记者称,这属于恶意抓取,58已全面升级用户隐私保护,对用户的敏感信息进行加密处理,提供电话隐私能力。

黑客窃取数据是传统方式。由于黑客行业的隐秘性质,国内的黑客多以口口相传的方式来发展新队伍。目前真正“奋战”在一线的黑客大多以学历低下,没有固定工作的年轻人为主,他们或经人介绍,或在逛论坛时偶然结识一个提供黑客软件的“师父”,简单学习之后,加入黑客队伍。

“师父”之上还有“师父”,这样一条自上而下的体系直接导致了黑客体系里严重分赃不均,前述经验超过十年的地下数据从业者就曾是一个小黑客,起初他对自己的技能颇为自豪,慢慢他发现,“师父”通过给他的那个软件,完全掌控他获得的数据,再加上他没有成熟销售渠道,每个月能赚到的钱少得可怜。

一开始,他会黑一些网站的信息数据,例如教育局内网里的学生信息数据,转手卖给需要这类数据的公司。随着技术越来越娴熟,业务越来越多,大学期间他开始连续创业,做了几个没什么收入的项目,他也多以“创业者”身份示人,但他的另一只手仍在操纵数据地下交易的生意。

“创业公司不赚钱,只有一个员工的地下数据项目,就能养活有30多个人的创业团队。”他对《财经》记者说。

从目前的行情来看,上述案例中,疑似联通呼叫平台有标签的用户信息10元一条,属于低价数据,这位资深人士手里的精准用户信息,可以卖到1000元一条。

从黑客到中介,从数据挖掘到数据清洗,地下数据产业链条的每个环节,这位人士都熟知,据他透露,如果有运营商的内部关系,加上一定的渠道资源,赚钱并不难。

但今年6月1日之前,他就嗅到了危险的气息,赶紧把风险较大的业务全部停掉,清除痕迹,戴上了“白帽子”。不过,他并未完全放弃这摊生意,而是将自己的数据交易公司用CRM的方式管理起来,保证每个数据源头都查不到任何破绽。现在,他只做大公司的生意,这些大客户要求严格,不会接受任何违法数据。

但他没想到,有一天他会栽在“同行”手里。

今年早些时候,通过客户反馈,他发现自己的公司也出现了“内鬼”,一名公司员工将客户资料卖给了竞争对手公司,直接导致他丢掉一个200万元的单子。

他很生气,威胁将这名员工告上法庭,最终得到一大笔赔偿金。事后,他将公司整个CRM系统重新整合,现在即使是他也看不到客户的手机号,所有的短信和电话都通过系统的内置功能来进行。不仅如此,所有员工的行为都会被自动记录,哪个账号查看了用户资料,哪个客服拉取的数据量高于其他人,或是搜索其他客户经理的资料,都会被调出来仔细排查。

黑产进化

传统地下数据产业人士称这些大数据公司为“简单粗暴的暴发户”,“他们太有钱了,本来我们都是小作坊的模式,他们一进来,把我们的生意全都挤没了。”

对上述地下数据产业人士而言,政策法规收紧只是促使他转型的因素之一,更重要的原因是,他发现这池水越来越浑了——新型大数据公司入局,打破了传统的地下数据交易网络。

芝麻数据并不直接交易涉及到公民身份的信息(包括手机号、身份证号等),不完全属于“地下”,但公司的触角已经伸到了地下。这样的大数据公司是数据地下世界的新人。

今年5月31日,《网络安全法》施行前夕,新三板上的大数据公司数据堂(831428)被传因泄露用户信息公司高管被带走调查。原因是涉嫌给一家理财营销公司提供大量个人隐私数据,包括身份信息、消费信息等。

根据公开资料,数据堂成立于2011年,于2014年12月在新三板上市,并在中美两地建立了4家子公司和5个数据处理中心。

数据堂公司官网称,其商业模式是“依托自身的数据资源、技术研发优势及丰富的市场运营经验,打通数据获取、数据处理、数据服务环节,融合和盘活各类数据资源,推动相关技术、应用和产业的创新,实现数据价值最大化”。

但多位大数据人士告诉《财经》记者,数据堂的商业模式是通过网络爬虫、公共领域共享等方式获取数据,对数据进行清洗、分类处理之后,向客户提供定制化数据服务来获取收益。这是一条完整的数据交易链。相对于过去分散的数据交易模式,这是一条全新的、进化版的交易链条。

5月23日,数据堂的下游客户公司发现,数据堂提供的一些数据接口突然断了,询问如何解决时,得到的回应是:“在调整,等消息。”

有媒体曾经质疑数据堂,为何未公告其高管被调查,影响了部分业务线一事?数据堂今年5月的回应是:“目前还没有出最终的调查结果。”

数据堂董秘朱文杰对《财经》记者表示,确实有一些数据经过脱敏处理变成标准化数据在网上交易,但是,这些标准化数据带来的业务收入只占数据堂收入的5%不到。

朱文杰强调:“数据堂不是一家数据交易公司,而是基于人工智能技术提供定制化的数据服务。”

另一位大数据公司高管告诉《财经》记者,哪怕是在两三年前,地下数据交易的量都不大,规模普遍维持在数百条信息的量级。“做得没那么明目张胆,外面也没人去扯这些小事儿。”

但他说,随着需求被放大,整个地下数据产业开始变成半公开化了。

苏州的一家大数据公司成立于2011年底,2013年就已经开始盈利,2016年注册用户60万,年营收过亿元。其市场优势是数据全面、价格便宜。

这家公司顶着明星创业公司的光环,不仅拿到巨额融资,还是苏州工业园区的重点引进项目。

不过,有地下数据产业资深人士透露,能做到数据全面且便宜的原因在于这家公司整合了大量购买数据的小渠道,这些渠道大多不合法。其中包括各种黑客、内鬼,他们通过QQ群、微信群出售数据,还包括以暗网为主的非法网站,他们大量搜刮数据,重新整理后低价出售。

上述地下数据产业资深人士将这些大数据公司称为“简单粗暴的暴发户”,“他们太有钱了,本来我们都是小作坊的模式,这样的公司一进来,把我们的生意全都挤没了。”

《财经》记者联系了这家公司,对方相关人士回应,他们的商业模式是提供API接口,并不涉及数据交易,《网安法》对于他们来说也没有任何影响,对于数据安全相关的问题,他不予置评。

该公司官网上最热门的几类数据里包含二代身份证认证与银行卡信息认证,但目前中国有资格进行身份证信息验证的公司只有国政通一家。

这家苏州公司为何能够拥有如此高端精准的个人信息认证体系?一位了解该公司的人士透露,因为他买通了一家国政通的合作公司,通过该合作公司发到国政通进行认证。

当《财经》记者致电这家合作公司的客服人员时,该客服人员表示,他们的身份证认证信息是对接了公安部的数据,而银行卡信息认证是通过银联的数据来对接。多位业内人士向《财经》记者表示,从未听说过这样的接口可以对外开放。

这家公司的身份证认证的价格为30万元100万次,据行业人士透露,该公司会进行数据截留,截取其他的信息,然后再进行处理,二次售卖。

这些处于灰色地带的大数据公司的主要客户来自互联网金融行业。

金融行业的获客成本普遍高于其他行业,2013年互联网金融行业开始火爆,模式比传统金融机构更轻,规模扩张也更快。

竞争压力之下,互联网金融公司的获客需求量激增,同时,也需要更快速进行用户身份验证以及贷款资格审查,这些都在一定程度上刺激了灰色大数据公司的发展。

前述数据掮客对《财经》记者表示,金融公司通过购买目标用户信息来进行电话营销,成功率可能高达10%,远超普通营销渠道。

这样的模式无疑进一步刺激了地下数据交易,也导致了大数据行业“劣币驱逐良币”的现象。如果保证数据获取合法,那么在价格上根本无法与从地下获取数据匹敌,这让很多干净的数据公司几乎毫无竞争力可言。

“就算只有一家云服务厂商碰了客户的数据,我们所有人都会在客户那里失去信任。”北京北森云计算股份有限公司CEO纪伟国对《财经》记者说。这家公司提供人才管理云服务。

硬币的另一面是,数据地下产业的快速进化,冒出大型公司,反倒让监管变得更容易下手。

在中关村大数据产业联盟常务秘书长张涛看来,大数据公司对监管机构而言是一个“抓手”,如果没有它们,监管机构在探查诈骗数据来源时,面对的就是一片汪洋大海。

接近权威部门的人员透露,监管部门对非法数据交易和买卖一直都非常重视,但囿于数据价值无法量化评估、交易过程隐蔽等问题,之前没有用一刀切的方式进行监管。


热门文章推荐

黑科技|Adobe出图象技术神器!视频也可以PS了!!

厉害!旷视科技包揽 COCO、Places 三项世界冠军

Python的开源人脸识别库:离线识别率高达99.38%

全球研发开支排名:亚马逊第一,BATJ排不上号!

一篇文章讲清楚人工智能、机器学习和深度学习的区别和联系

黑科技|Adobe出图象技术神器!视频也可以PS了!!

史上第一个被授予公民身份的机器人索菲亚和人对答如流!

浙大90后女黑客在GeekPwn2017上秒破人脸识别系统!

周志华点评AlphaGo Zero:这6大特点非常值得注意!

汤晓鸥教授:人工智能让天下没有难吹的牛!

登录查看更多
0

相关内容

中国联合网络通信集团有限公司(英文名称China Unicom、简称“中国联通”、“联通”)于2009年1月6日在原中国网通和原中国联通的基础上合并组建而成,在国内31个省(自治区、直辖市)和境外多个国家和地区设有分支机构,是中国唯一一家在纽约、香港、上海三地同时上市的电信运营企业,连续多年入选“世界500强企业”。
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
新时期我国信息技术产业的发展
专知会员服务
70+阅读 · 2020年1月18日
报告 | 2020中国5G经济报告,100页pdf
专知会员服务
97+阅读 · 2019年12月29日
电力人工智能发展报告,33页ppt
专知会员服务
128+阅读 · 2019年12月25日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
93+阅读 · 2019年11月13日
深度解读 | 美国打压华为这事水很深——什么是华为?(1)
混沌研习社广州分社
21+阅读 · 2019年6月27日
招行高端卡套路深!“理财办卡”坑了多少人?
凤凰财经
3+阅读 · 2018年12月30日
IDG资本杨飞:从价值投资谈2017中国现象
IDG资本
4+阅读 · 2017年12月22日
嘿,这是本应属于你的“红包”!
腾讯
3+阅读 · 2017年7月13日
人工智能与医疗,正成为人工智能时代重头戏
机器之能
6+阅读 · 2017年7月10日
Clustered Object Detection in Aerial Images
Arxiv
5+阅读 · 2019年8月27日
Arxiv
12+阅读 · 2019年1月24日
Arxiv
12+阅读 · 2018年9月15日
Arxiv
11+阅读 · 2018年5月21日
Arxiv
4+阅读 · 2016年9月20日
VIP会员
相关VIP内容
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
新时期我国信息技术产业的发展
专知会员服务
70+阅读 · 2020年1月18日
报告 | 2020中国5G经济报告,100页pdf
专知会员服务
97+阅读 · 2019年12月29日
电力人工智能发展报告,33页ppt
专知会员服务
128+阅读 · 2019年12月25日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
93+阅读 · 2019年11月13日
Top
微信扫码咨询专知VIP会员