构建数据资产清单,数起科技用大数据平台提供政府监管服务

2018 年 5 月 21 日 拓扑社

拓 扑 社

传 递 企 业 服 务 价 值


本文是拓扑社对微软加速器·北京第11期入选项目的专题报道。


微软加速器·北京第11期的入选企业的重点是人工智能与产业落地应用结合,以人工智能底层技术平台作为创业方向。这些校友企业都是企业服务类创业公司,覆盖大数据、人工智能、物联网、区块链等技术,并在医疗、政府、零售、建筑等行业中获得标杆客户。这些领域也是拓扑社持续关注的方向。


数起科技  创始人  李明国


拓扑社(ID:tobshe)5 月 21 日报道

文:窦悦怡


我国政府数据资源储量极为丰富,广泛存储于各地、各级政府机关院所等不同单位、不同部门、不同系统甚至不同网络环境中,数据种类繁多,数据质量较高,其潜在价值十分可观。但根据李克强总理指出,80% 的政府数据仍待字闺中,如何释放政府数据价值,成为各省市政府摆在面前的难题。


「从狭义上说,政务大数据有四类应用方向,一类是公共服务,如公安、交通、旅游;一类是市场监管,例如,个人征信,企业征信;此外还包括政府决策大数据和政府监管大数据。从广义上说,除了国务院序列、党、人大、政协、法院、检察院、监察委等七大班子外,协会、公益组织等社团,以及国有金融机构、国有医疗机构和国有企业等,因为其数据资产的所有者均属于政府,所以均可以列为广义政府大数据的范围。


不过,在政务大数据推进过程中,存在着「不愿共享」「不敢共享」「不能共享」三个难题。首先,政府各职能部门出于权本位思维不愿意共享数据,认为数据的共享意味着权力的流失或者旁落。其次,有些政府部门基于安全风险考虑不敢将数据拿出来与其他部门共享,担心后会造成数据泄密,带来负面影响和不利后果,不敢承担风险。第三,有些政府部门习惯于因循固有的工作模式,缺乏数据共享的动机。」数起科技创始人李明国如此解读。

 


数起科技成立于 2016 年,是一家专注政务监管数据服务的创业公司,创始人李明国,曾任国内知名软件公司副总裁,从事政府数据服务十余年,对政府数据市场以及政府数据的应用有着深刻的理解。


数起科技做的事情是从审计和林业两个领域,以数据应用为起点,通过构建数据资产清单,再利用大数据技术对这些清单上的数据加工处理,帮助用户将数据变成资产,对内支撑本轮以数据为核心的业务变革,对外实现数据的交换共享。


- 从审计切入政务大数据

聚焦行业最痛点 -


李明国解释道,选择从审计和林业切入是与国家在这两个领域的强监管需求和数起科技多年的行业业务积累有关的,在今年两会出台的政府机构改革中,国家大大加强了在监管方向的资源整合和管理力度,国家对于公务人员行使公权力的监管、对于资金资产的监管、对于生态的监管都在加强,数起科技专注的主要是这三大监管方向。


政府监管数据服务业务需要能够读的懂数据、熟悉监管流程和业务的厂商,数起科技公司技术团队有足够的技术壁垒和业务壁垒在这个领域为政府监管提供这样的优质服务。


拓扑社了解到,传统审计模式是以处室为单位,按照各自职责承担相应行业的审计,审计人员各守一摊,难以满足统一指挥、分工协作、灵活调配等需求。这样,审计员的审计覆盖面不全,工作量大,效率低,结果准确性差。

 


其次,在审计内容上,受数据资源和审计手段所限,不能覆盖全部业务环节。同时,被审计对象存在的问题也越来越隐蔽,呈现出跨领域、跨地域、跨行业的特点,很多多方关联数据很难查深查透。


第三,目前各省市级审计机关尚未建设数据平台,数据分散存放,未能形成数据资产,数据价值挖掘不出来,不能帮助审计机关很好利用数据,指导其业务监督。另一方面,这些数据过于零散,针对财政财务、业务等具体场景构建数据模型,具有很强的数据针对性,通用性比较差,这样这样不利于数据模型的共享和复用。


「此外,在政务大数据里,广义政府大数据涵盖的所有数据(七大班子、社团、国有经营机构等),最终都会汇总到审计机关,从数据层面来讲,审计部门要面对在党和国家层面才会面对和要处理的数据,从这个方向解读,就不难理解为什么审计部门的数据痛点最为严重。」


李明国指出,林业监管领域的痛点主要集中在信息系统建设独立、数据孤岛,也缺少落地的数据场景,同时对外的林业产业方向也不能很好的使用林业数据。


- 建立数据资产清单

为后续数据服务提供基础 -


「在政府里涉及的行业很多,每个部委都是一个行业,同时里面又有很多的系统,这些系统里存放着海量数据,数据作为资产是需要具有可描述、可计量的属性的。但这些数据并非是天然的资产,一定要处理加工后才能成为资产,所以,我们首要解决的问题是数据握手的关系,把这些数据聚合在一起。


其次,数据时代,数据应用不再是专业数据分析人员的工作,所有的人员都要读的懂数据,可以基于这些数据做应用。此外,当解决数据握手、读懂数据之后,我们同样会面临数据分析场景难落地,难以进行多角度、全覆盖式的数据分析工作。」


据此,数起提出了数据资产清单的概念,来解决前述两个问题。数据资产清单是指在帮助用户建立数据资产的目录体系,并进行数据入库处理。通过数据加工转换模板连接原始数据与可读的懂的规划数据,打通监管机构和监管对象之间数据翻译转换的通道。

 


据李明国介绍,目前公司在数据资产清单上面的投入很大,这部分清单主要是通过公司提供有着丰富从业经历的数据分析师团队完成的。相对而言,这是一项十分依靠人力和经验的工作,通过对监管业务的分类研究,以对象为维度将各类数据清单化。


简单来说,数起利用大数据、人工智能等技术,将用户的监管类所有维度数据以科学有效的进行整合,再把这些数据按照一定规则进行分门别类,放置在清单的子目录下。这构成了随后 ETL、数据分析及应用等数据处理过程的基础。


同时,数据资产清单的建立,为后续的数据交换、数据管理、数据分析、数据应用等数据工作奠定了基础。目前数起已经形成了涵盖政府、银行等十九个行业的数据资产清单。


- 打造 LDP 数据平台

延伸多种应用场景 -


在产品上,数起打造了 LDP 数起大数据平台。LDP 平台是一个基于分布式计算框架的数据资产全生命周期平台,引入机器学习、NLP、知识图谱等技术增强预测性分析能力。功能上涵盖了数据采集、数据管理、数据资产、数据分析、数据应用等。



简单来说,LDP 平台支持文件、数据库、网络爬取、定制化采集等多种形式、多种类型的数据接入。其次,平台提供从数据资产目录建立,到资产注册、发布、申请、审批、注销的全生命周期管理。


 

第三,平台无需任何预处理即可对数据做任意维度的多维分析,简单拖拽即可通过数据获得业务洞察,业务人员也能自助分析数据。平台还可以对数据所有者提供全方位的数据安全运维服务,数据安全运维体系包括认证授权、数据审计、数据防护、集群管理、集群监控和任务调度等。


目前,LDP 平台已成功应用在政府、审计、林业、交通等行业,满足用户不同的数据应用需求。


以林业为例,数起建立了统一规范的林业数据资产清单,对林业海量的数据资源进行采集、处理、整合、分析,形成规范的林业数据资产库,充分运用大系统共治的建设思路,「未来,林业的数据资产讲在两个方向发挥重要作用:对内大数据成为林业生态监测的眼睛、林业规划和林业生态建设的大脑,对外通过数据服务成为人民美好生活和林业产业健康发展的外脑。」


据悉,数起主要提供三方面服务:根据用户的业务需求,帮助客户快速建立数据资产清单,并实现数据归档入库;根据用户需求,提供现场和非现场的两种形式处理数据和服务;此外,数起还提供专业的数据分析人员培训,培训后可参加 CDA 考试认证。


在盈利模式上,数起科技是按照产品+服务的模式进行收费,产品采用 licence 授权,客单价在数百万之间,目前公司已取得千万收入,并实现盈利。


- 主编点评 -


加入微软加速器后,微软在技术和产品上给数起科技极大的支持。基于微软 Azure 云平台,AI 技术,数起新版本的 LDP 平台已经成功引入将引入机器学习、深度学习、NLP 等技术,将人工智能的成果引入到政府监管领域。


其次,微软针对校友企业的 CEO 和 CTO 提供了相应的技术、市场和财务等培训课程,提升他们在管理等方面的能力。

 

第三,数起科技已经沿着监管的链条(政府监管机构—>监管对象)向企业监管、金融监管进行拓展,因此微软加速器会把相关优质的资源输送给数起科技,为其积累丰富的人脉资源。另外,微软加速器还会提供品牌宣传、媒体采访、市场活动、融资对接等资源,还会牵线搭桥,与众多校友建立生态联系,互通有无。


END


声  明


本文为拓扑社(微信:tobshe)原创稿件,转载须在文章开头明显处注明来源拓扑社(微信:tobshe)及作者名字。如不遵守,拓扑社将向其追究法律责任。

 

拓扑社报道中所涉及的融资金额均由企业方提供,拓扑社不保证其数字真实性,仅供参考。

 

投稿、寻求报道或商务合作,请发邮件至 tobshe@itjuzi.com,或联系拓扑君(微信:tobsir),标注公司-职务-姓名,谢谢。


热点回顾

创业速递


资本观点




登录查看更多
1

相关内容

专知会员服务
124+阅读 · 2020年3月26日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
303+阅读 · 2019年12月23日
2019中国硬科技发展白皮书 193页
专知会员服务
82+阅读 · 2019年12月13日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
93+阅读 · 2019年11月13日
华为和其“公关危机”下的5G发布会
1号机器人网
7+阅读 · 2019年1月27日
2018年中国供应链金融行业研究报告
艾瑞咨询
7+阅读 · 2018年11月20日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
一个人的企业安全建设之路
FreeBuf
5+阅读 · 2017年7月7日
Arxiv
102+阅读 · 2020年3月4日
Arxiv
15+阅读 · 2019年9月11日
Arxiv
12+阅读 · 2018年9月5日
Arxiv
25+阅读 · 2018年1月24日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
Top
微信扫码咨询专知VIP会员