整理:开放隐私计算
2022年6月20日,《财经》商业治理研究院与中国社科院大学互联网法治研究中心联合发布了《个性化广告合规发展研究报告--从个人信息保护角度出发》(以下称《报告》)。《报告》介绍了当前互联网广告行业的发展现状及趋势,个性化广告发展历史及原理,面临的困境与解决思路,以及当前隐私计算技术的发展方向。
关注公众号并回复 20220626 获取完整报告
《个性化广告合规发展研究报告--从个人信息保护角度出发》部分摘录:
广告产业作为市场经济发展的产物,受宏观经济影响较大。2021年,我国GDP 同比增长8.1%,在第四季度出现经济增长势头减弱的趋势。进入2022 年,第一季度GDP同比增长4.8%。广告行业明显受经济下行影响,根据《2021 中国互联网广告数据报告》统计,2021年,互联网行业实现了广告收入 5,435 亿元(不含港澳台地区),同比增长9.32%,增幅较上年减缓了4.53个百分点。
在2018年以前,中国互联网广告行业保持年均20%以上的市场规模增速。而2018年-2020年,中国互联网广告市场增速逐年从25.70%下降到11.94%,至 2022年一季度增速下滑到1.4%。广告行业增速持续放缓趋势明显。个性化广告作为一种广告形式,其发展与广告行业整体相关联。另一方面,个性化广告较大程度上又依托于移动互联网的发展。
中国互联网络信息中心(CNNIC)发布的第49次《中国互联网络发展状况统计报告》的数据表明,截至2021年12月,我国手机网民规模已达10.32亿,较2021年同比增加4373万人,网民使用手机上网的比例为99.7%。移动流量红利已趋近于见顶,新增流量红利趋弱,互联网流量价值从追求增量转向盘活存量,结构性创新成为互联网营销需要探寻的方向。个性化广告依托于算法推荐,具有“千人千面”的特点,可触达不同用户类型,实现较高的转化率,因此获得更大的市场认可。
报告指出不同用户对个性化广告的态度也不同。根据德勤2021 年的《数字媒体趋势报告》针对的2009名美国消费者的调查显示,在不同的娱乐类型和世代中,人们对广告的容忍程度以及他们愿意在哪里付费来避免广告的出现有很大的差异。对于流媒体视频而言,有 40%的受访者更倾向于每月支付12 美元的无广告服务,而 39%的受访者更喜欢有每小时12 分钟广告的免费服务。在社交媒体平台上,62%的Z世代人和72%的千禧一代更愿意看到针对自己喜好的个性化广告,而不是普通广告。
大数据的应用会让人产生一种“被监视”的感觉,个性化广告难免会给人带来“个人自治”受限的担忧,认为妨碍其自主选择并自由生活的权利。大数据的应用即便遵循着合法、正当的使用目的,预先告知用户采集数据用于的特定目的,并且会在数据处理过程中通过数据安全和匿名化的手段来保护个人信息及隐私,也难以完全符合用户的“隐私期待”。
用户个人对产品的隐私期待,应限于可以拒绝网络服务者不得通过使用其个人信息投放个性化广告,而非在免费互联网服务的前提下,完全拒绝广告投放。根据权利与义务一致性的观念,个人难以主张仅获取免费服务,而不拒绝接受广告。
“安全”是法律的价值追求。对于个性化广告而言,确保用户个人信息安全,是业务开展的前提。法律可以要求企业应当如何,并且提出禁止性规范,但对代码层面的监管,需要依靠技术手段才能实现管理,达到安全目的。因此,唯依靠隐私计算等技术,企业才能实现个人信息及隐私保护的合规。在未来,个性化广告不光是依靠技术来兼顾精准和用户体验。更重要的是,通过更好的隐私计算技术实现用户个人信息及隐私的全生命周期保护。
1.安全多方计算(MPC)
安全多方计算(Secure Multi-party Computation, MPC),安全多方计算是一种在参与方不共享各自数据且没有可信第三方的情况下安全地计算约定函数的技术和系统。通过安全的算法和协议,参与方将明文形式的数据加密后或转化后再提供给其他方,任一参与方都无法接触到其他方的明文形式的数据,从而保证各方数据的安全。安全多方计算的基本安全算子包括同态加密、秘密分享、混淆电路、不经意传输、零知识证明、同态承诺等。解决特定应用问题的安全多方计算协议包括隐私集合求交、隐私信息检索及隐私统计分析等。
安全多方计算与其他隐私计算技术融合应用成为主流趋势。由于安全多方计算需要消耗大量的计算和通信资源,目前应用更加适用于小规模数据量,并且应用主要是聚焦相对简单的统计、查询等类型的计算,而基于安全多方计算的联合建模框架只能支持相对简单的机器 学习模型,如逻辑回归模型等。其主流的应用主要以安全技术的形式融合在其他隐私计算解决方案中,例如与联邦学习的结合,在样本对齐阶段通过隐私集合求交来实现参与方公共样本ID 的发现;在联邦模型训练阶段,可以通过同态加密、秘密分享等技术来实现对中间技术结果或转化结果的保护。
2.联邦学习
联邦学习是一种分布式机器学习技术和系统,包括两个或多个参与方,这些参与方通过安全的算法协议进行联合机器学习,可以在各方数据不出本地的情况下联合多方数据源建模和提供模型推理与预测服务。在联邦学习框架下,各参与方只交换密文形式的中间计算结果或转化结果,不交换数据,保证各方数据不露出。联邦学习可以通过同态加密、差分隐私、秘密分享等提高数据协作过程中的安全性。根据联邦学习各参与方拥有的数据的情况,可以将联邦学习分为两类,即横向联邦学习和纵向联邦学习。
联邦学习助力广告程序化交易联合建模,提升广告主投放效果和用户体验。在广告场景中,流量方和广告主侧各拥有一部分链路数据,比如流量方拥有流量相关点击行为和基础画像,而广告主侧拥有深度转化链路数据如付费,后者属于广告主核心资产,不能完全同步给流量方,但是双方都有需求优化广告投放效果,以提升成本控制和起量效果。借助联邦学习可以在保护合作双方各自数据安全的前提下,联合训练、建模、优化模型效果。在这样的背景下,通过广告主和流量主的联邦建模,融合双方的数据优势,在游戏、金融、教育、电商行业的广告应用案例中能够取得显著效果提升。
3.可信计算
可信计算指借助硬件 CPU 芯片实现可信执行环境(TEE),从而构建一个受保护的“飞 地”(Enclave),对于应用程序来说,它的Enclave是一个安全的内容容器,用于存放应用程序的敏感数据与代码,并保证它们的机密性与完整性。以Intel SGX 为例,Enclave 的内存区域是由CPU默认加密的,且只能被同一个Enclave中的代码所访问。可信计算(TEE)是基于硬件和密码学原理的隐私计算方案,相比于纯软件解决方案,具有较高的通用性、易用性和较优的性能。
平台化和容器化是未来可信计算与云平台融合的关键路径。可信计算开发和部署成本较高,为了满足多样化业务的需求,向使用者提供简易和低成本的服务,平台化和容器化正成为各大厂商的主流选择。例如通过将远程/本地证明、可信信道的建立、数据密封在内的可信功能整合在TEE基础平台,实现对于隐私计算任务的无差别工作流程正成为业界的主流路径。
报告目录
由于公众号试行乱序推送,您可能不再准时收到机器学习与推荐算法的推送。为了第一时间收到本号的干货内容, 请将本号设为星标,以及常点文末右下角的“在看”。