在全球数据开放的大背景下,中国公共数据开放的步伐在近年来进一步提速。公共开放数据在数据资产生态中起到基础性的作用,为建设“数字中国”提供支撑。基于中国当前的公共开放数据资产现状与挑战,普华永道近日发布《开放数据资产估值白皮书》。
数据资产估值是未来数据资产价值释放的核心环节。然而,由于公共开放数据自身的独特性,将传统估值思路应用于其估值时面临诸多挑战。本白皮书首次借用物理学中的“势能”概念作为理论基础,推出“数据势能”新概念及其相应的估值逻辑,就政府公共开放数据的估值体系进行研究和探讨,旨在根据公共开发数据资产的特点,发掘其特有的价值驱动因素及其魅力所在,进一步揭示能够撬动其估值体系的支点。
白皮书指出,数据资产化是数据要素的重要趋势,旨在最大化释放数据的核心价值。在全球数据开放的大背景下,我国公共数据开放的步伐在近年来进一步提速。公共开放数据在数据资产生态中起到基础性的作用,为加快我国数字化发展,建设“数字中国”提供支撑。当前,全国已有18个省级公共数据开放平台正式上线,免费为社会各方提供相关政府单位的公开数据。但免费并不等同于没有价值。公共开放数据在“惠民”以及“智慧政务”方面产生了巨大的潜在社会价值。目前,公共开放数据的应用场景正在不断丰富的过程中,假以时日,必将蓄积巨大的潜在经济价值,未来可期。
报告认为,公共开放数据正如数据资产生态系统里的“土壤”,为加快我国数字化发展,建设“数字中国”提供支撑。一方面,各级政府部门拥有大量基础性、关键性的数据资源,掌握着社会绝大部分数据,包括交通、金融、电信、工商、卫生等行业。另一方面,大小企业、个人、数据中介等社会主体也采集和存储了大量具有公共属性和公共价值的数据。在保障国家安全、商业机密和个人隐私的首要前提下,将这些公共开放数据最大化开放,供全社会进行开发利用,有利于培育数据要素市场,释放公共开放数据的社会与经济价值。
从技术方面看,数据开放是在政府大数据局以及大数据中心汇聚的数据基础上进行开放的。目前省级开放平台,在数据跨部门的横向打通上仍然面临一些障碍,比如数据只能查询不能入库,数据的完整性、实时性、准确性也缺乏交叉检验或者核实。通常看到的情况是,数据字段非常多,但真正能发挥价值的不多,因为没有办法去核实数据的实用性。目前公共开放数据尚缺乏类似“撞库”或者区分度的方法论或实践,只有尽快铺开去实验这些保护数据隐私计算的方式,才能发掘出数据更多的价值。
目前,公共开放数据运用的基本技术包括以下两方面:
1.大数据处理技术:提供数据集的多版本控制,以及访问权限控制。
2.安全防护技术:提供有效数据的同时,防止爬虫扫描,防止恶意盗取有条件开放的数据资源。
在此基础上,目前开放数据在技术上在进行以下几方面的尝试:
1.敏感数据自动发现:开放数据上传目前大量依靠人工审核才能发布。该技术帮助相关部门在数据发布前进行审核,防止敏感数据上传公开。
2.多层数据融合汇聚:该技术能将分层存储在各个系统的分散数据进行汇聚,节省了时间和人力成本。
3.数据自动化发布流程:将日常政务数据发布流程标准化、自动化,确保输出数据的一致性和及时性。
4.隐私计算技术:适用于有限政府数据开放环境下,如上海的普惠金融开放数据。开放平台需提供一套可信安全计算环境,在数据可计算的情况下,保护公民和企业的敏感信息,确保数据“可用不可见”,计算结果按权属分发给参与方。
5.联邦学习技术:该技术能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模,特别适合关系网络的跨平台数据联合。
此外,本次研究整理出的10佳实践案例是通过综合考量相关公共开放数据的下载量、关注量、媒体报道次数、以及潜在社会价值等多维度严格筛选得出的结果。