小米共享超5亿数据给AI公司,网友:小米泄露隐私

2017 年 11 月 2 日 安全优佳 安小编
点击上方 “安全优佳” 可以订阅哦!

在近期举办的光大控股成立20周年的庆祝酒会上,多位政商界人士出席并发表了演讲,其中不乏在今年七月份获得4.1亿美元融资并专注于计算机视觉领域的AI公司商汤科技。

在演讲中,商汤科技徐冰表示数据并非壁垒,“现在获取数据的成本非常低,现在市场上有数据没算法的企业实在太多了,比如说小米,当时共享给我们超过5亿的数据训练相册的算法”,并表示“有数据没算法的企业非常多,这些企业非常愿意把数据共享出来,跟我们进行算法的合作,享受算法的提升带来它的产品的提升。”

在商汤科技官网也展示了与小米的合作案例,在MIUI 7中,商汤科技人脸识别算法为小米实现了“一人一相册”的面孔相册分类功能。在云端存储则实现了自动分类,避免手动分类照片的繁琐操作。

但是网友却不买单,表示“小米泄漏隐私啊,把这么多照片导给这个公司做训练“。那么,小米真的泄露隐私了吗?小米提供的这5亿数据是通过什么方式获取的?用户是否知情?这些数据是否脱敏?

“十三五”规划纲要早已指出“实施国家大数据战略,推进数据资源开放共享”,小米数据共享本是题中之义。虽然通过数据共享进行合作,实现了产品质量的提升,但网友担忧数据泄露隐私并非没有道理。数据泄露隐私长期成为笼罩在人们心头的阴影。那些“有数据没算法”的企业,在向AI企业共享数据获得产品质量提升的过程中,是否可能泄露用户隐私?

答案是“可能”。为了保护数据安全,通常会有“对称/非对称加密、数据脱敏、同态加密、访问控制、安全审计和备份恢复”等保护手段。值得注意的是数据脱敏,为了新的和改进后的功能,应用程序开发者往往需要一个环境仿真来测试新功能从而确保此前的功能没被破坏,在拷贝敏感数据到非生产环境中会不经意间泄露很多信息,这些信息容易被窃取也容易被泄露。

在小米等类似企业共享数据给商汤科技等AI企业的过程中,需要对这些数据进行数据脱敏,即对某些敏感信息通过脱敏规则进行数据的变形,实现保护。并达到在不违反系统规则的条件下,对真实数据进行改造并提供测试使用。问题从脱敏数据还原用户敏感、隐私信息虽然有一定技术难度,但并非无法恢复。

一方面厂商为寻求技术实现产品质量提升,需要共享脱敏数据给AI企业,另一方面要达到100%的脱敏数据并且不被还原又难以实现,这是摆在任何一家“有数据没算法”的企业面前的困境。或许只有当还原脱敏数据所耗费的时间精力达到一定程度,与收获不成比例的时候,公众担忧才会慢慢减少。

但对于一般用户来说,消费需求在那里,无法等待到那个时候,所以现在你可以使用各种包含人工智能技术、算法的功能,如MIUI7中面孔相册分类功能。至于担忧隐私泄露,或许只能安慰自己,小米这样的企业早已做好风控。

安全优佳

http://news.secwk.com

长按识别左侧二维码,关注我们


登录查看更多
0

相关内容

商汤科技致力于引领人工智能核心“深度学习”技术突破,构建人工智能、大数据分析行业解决方案。商汤科技核心团队成员由两大部分组成:一部分是来自麻省理工学院、斯坦福大学、清华大学等知名高校的博士科学家;另一部分来自谷歌、微软、联想、百度等产业界的人才。在人工智能产业兴起的大背景下,商汤集团凭借在技术、人才、专利上超过十年的积累,为公司的长久发展打下了坚实的基础。
【微众银行】联邦学习白皮书_v2.0,48页pdf,
专知会员服务
165+阅读 · 2020年4月26日
【复旦大学-SP2020】NLP语言模型隐私泄漏风险
专知会员服务
24+阅读 · 2020年4月20日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
【中国人民大学】机器学习的隐私保护研究综述
专知会员服务
131+阅读 · 2020年3月25日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
泰国通过个人信息保护法
蚂蚁金服评论
16+阅读 · 2019年4月3日
小米Note3 ‖ 国产首款支持人脸解锁手机
机械鸡
4+阅读 · 2017年9月12日
这位程序员为什么要弃用Facebook?
CSDN
5+阅读 · 2017年7月14日
共享单车惨遭共享:一款App能骑9种车到底是啥神器?
黑客技术与网络安全
4+阅读 · 2017年7月6日
Arxiv
110+阅读 · 2020年2月5日
AutoML: A Survey of the State-of-the-Art
Arxiv
69+阅读 · 2019年8月14日
One-Shot Federated Learning
Arxiv
9+阅读 · 2019年3月5日
Arxiv
25+阅读 · 2018年1月24日
Arxiv
5+阅读 · 2017年4月12日
VIP会员
相关论文
Arxiv
110+阅读 · 2020年2月5日
AutoML: A Survey of the State-of-the-Art
Arxiv
69+阅读 · 2019年8月14日
One-Shot Federated Learning
Arxiv
9+阅读 · 2019年3月5日
Arxiv
25+阅读 · 2018年1月24日
Arxiv
5+阅读 · 2017年4月12日
Top
微信扫码咨询专知VIP会员