在近期举办的光大控股成立20周年的庆祝酒会上,多位政商界人士出席并发表了演讲,其中不乏在今年七月份获得4.1亿美元融资并专注于计算机视觉领域的AI公司商汤科技。
在演讲中,商汤科技徐冰表示数据并非壁垒,“现在获取数据的成本非常低,现在市场上有数据没算法的企业实在太多了,比如说小米,当时共享给我们超过5亿的数据训练相册的算法”,并表示“有数据没算法的企业非常多,这些企业非常愿意把数据共享出来,跟我们进行算法的合作,享受算法的提升带来它的产品的提升。”
在商汤科技官网也展示了与小米的合作案例,在MIUI 7中,商汤科技人脸识别算法为小米实现了“一人一相册”的面孔相册分类功能。在云端存储则实现了自动分类,避免手动分类照片的繁琐操作。
但是网友却不买单,表示“小米泄漏隐私啊,把这么多照片导给这个公司做训练“。那么,小米真的泄露隐私了吗?小米提供的这5亿数据是通过什么方式获取的?用户是否知情?这些数据是否脱敏?
“十三五”规划纲要早已指出“实施国家大数据战略,推进数据资源开放共享”,小米数据共享本是题中之义。虽然通过数据共享进行合作,实现了产品质量的提升,但网友担忧数据泄露隐私并非没有道理。数据泄露隐私长期成为笼罩在人们心头的阴影。那些“有数据没算法”的企业,在向AI企业共享数据获得产品质量提升的过程中,是否可能泄露用户隐私?
答案是“可能”。为了保护数据安全,通常会有“对称/非对称加密、数据脱敏、同态加密、访问控制、安全审计和备份恢复”等保护手段。值得注意的是数据脱敏,为了新的和改进后的功能,应用程序开发者往往需要一个环境仿真来测试新功能从而确保此前的功能没被破坏,在拷贝敏感数据到非生产环境中会不经意间泄露很多信息,这些信息容易被窃取也容易被泄露。
在小米等类似企业共享数据给商汤科技等AI企业的过程中,需要对这些数据进行数据脱敏,即对某些敏感信息通过脱敏规则进行数据的变形,实现保护。并达到在不违反系统规则的条件下,对真实数据进行改造并提供测试使用。问题从脱敏数据还原用户敏感、隐私信息虽然有一定技术难度,但并非无法恢复。
一方面厂商为寻求技术实现产品质量提升,需要共享脱敏数据给AI企业,另一方面要达到100%的脱敏数据并且不被还原又难以实现,这是摆在任何一家“有数据没算法”的企业面前的困境。或许只有当还原脱敏数据所耗费的时间精力达到一定程度,与收获不成比例的时候,公众担忧才会慢慢减少。
但对于一般用户来说,消费需求在那里,无法等待到那个时候,所以现在你可以使用各种包含人工智能技术、算法的功能,如MIUI7中面孔相册分类功能。至于担忧隐私泄露,或许只能安慰自己,小米这样的企业早已做好风控。
安全优佳
http://news.secwk.com
长按识别左侧二维码,关注我们