独家 | 大数据提升政府决策力的实践与案例分析(附PPT和视频)

2017 年 12 月 15 日 THU数据派 数据派


随着互联网的不断发展,社会群众对政府网站的要求越来越高,而国务院办公厅在2017年5月发布了《政府网站发展指引》,目标是推进互联网政务信息数据和便民服务平台建设,提升政府网上服务能力。围绕这个话题,11月30日清华大数据“应用·创新”系列讲座邀请到清华大学公共管理学院副教授张楠老师和国双科技政府事业部王晓群总监一起探讨如何实现电子政务,用大数据打造智慧的政府门户。


以下是演讲视频:(后附图文版实录)


清华大学公共管理学院副教授 张楠


国双科技政府事业部产品总监  王晓群


以下是图文版实录:


张楠教授从政府网站定位、政府网站评估和政府网站大数据内容挖掘三个方面进行了分享。 


后台回复关键词“1130”,下载张楠教授完整版PPT。


清华大学公共管理学院副教授 张楠


一、政府网站的定位与发展


1. 政府网站的定位


可以从多个角度理解政府网站的定位。政府网站是界面,是传递信息的渠道,同时也是政府连接内外部的枢纽。它既是虚拟世界的一个入口,也是承载业务的平台。它是用户服务的窗口,也是政府履职的平台。因此,政府网站是推动政府管理创新职能转变的一个助推器。



10年前国务院办公厅对网站已经有比较明确的定位。第一是“政府信息公开”;第二是“网上办事”,即服务导向,希望有越来越多的事情能够通过政府网站办理,减少线下的压力;第三是“政民互动”,网站是双向的,政府网站既是信息公开发布的平台,同时也是获取百姓诉求心声的平台。


2. 政府网站的发展


政府网站的发展经历从最初的“技术导向”,后面的“内容导向”,到现在的“服务导向”三个阶段。一方面网站成为日益主流的公众参与渠道,另一方面技术推动新的公共服务需求,提出互联网+概念,带动公共服务热点、难点问题的解决。


在这些新形势下,网站的很多问题也显露出来。如网站的“四不”问题,“信息更新不及时”、“信息发布不准确”、“服务功能不实用”、“公众反馈不回应”。这些问题虽然放在全国看还是局部,但造成的影响非常不好。



为此国务院办公厅从2014年至今颁布一系列政策对政府网站建设和维护进行规范和指导。


二、政府网站的普查与评估


1. 全国政府网站普查


2015年国务院办公厅第一次对全国政府网站普查,之后又陆续进行几次抽查督察。主要解决政府网站的四方面问题,“认识不足”、“家底不清”、“保障不利”和“基础不实”



目前,网站监测在国务院办公厅体系进入一个常态化阶段,通过抽查通报监测和问责机制,地方政府逐渐重视政府网站工作,政府网站整个面貌得到比较大的改观。


2. 清华大学中国政府网站绩效评估


为引领政府网站更好发展,促进良性关系,清华大学公共管理学院孟庆国教授为首的团队于2016年开始做政府网站的绩效评估。


团队从全国3万多个政府网站中抽取了认为做的较好约400到500个网站,从信息发布、解读回应、开放参与、平台支撑、网站应用五个纬度进行绩效评估,发现了亮点,也找到了存在的问题。



三、网站大数据与内容挖掘


1.网站大数据研究工作


用大数据的方法研究网站,用网站数据进一步完善公共管理、公共政策,以及支撑政府决策的研究。将网站的内容数据全部保存下来,对将来是很有价值的,可以用来进行更多更深层次的分析。


用大数据技术对网站内容进行文本分析和文本挖掘,LDA是目前国际上比较好用比较主流的方法。


LDA方法通过将网站上的每篇文章的词语进行统计,若干词语集中形成一个主题,从这些词语里提出来这些主题,描述成一个概率矩阵,变成传统的统计方法能够处理的问题,这是文本挖掘的基本思路,将海量的网站信息变成概率矩阵,就能看到每篇文章跟这个主题的关系,就能做进一步分析。

2017年1月,国家自然科学基金委关于大数据的重大研究计划列了一个培育项目“基于网络政府数据分析的政策扩散路径和政府回应能力研究”。这个项目是对以政府网站数据为主的一批数据进行系统性分析,构建一些需要解决的关键问题,如建模、建模融合、适用方法、知识图谱、以及增量式搜索等。重点关注两个应用问题,一个是信息公开的传播效果,另外一个和回应关切有关,如清华大学新闻传播学院沈阳老师在做公共舆情指数,按照地域、时间发布公众舆情关注的热点。


2.网站大数据未来展望


2017年5月份国家发布了《政府网站发展指引》,进一步规定了政府网站的呈现形式、展现布局、链接形式、标题形式,未来政府网站会愈发规范,对数据的整理和分析带来更多便利。


十九大报告中提到要实现网络强国、数字中国、智慧社会,这些目标的实现都离不开政府网站和未来政府网站在新技术形态下的延伸,政微信、政微博以及公众号、APP等。同时十九大报告也强调,增强执政本领的过程中我们要善于运用互联网技术和信息化手段开展工作,所以基于网站方面的工作,未来会非常的重要。


网站内容分析的前景,会有几方面的趋势:


1、关注状态数据到内容数据的变化;

2、从抽检丢弃的模式到大数据储存的模式过渡;

3、从五花八门的网站到统一规范的变化。


我们未来的世界,实际上是一个网上网下边界日益模糊的世界。电子政务作为一个概念消失的时候,电子政务目标才真正实现。政府网站绩效评估,将来会过渡到以网站内容评估政府绩效。政府所有的行为,应该在一个公开的状态下,网站反映的信息和工作内容应该无限接近于政府实际的工作内容,这是未来政府网站的发展方向,当然这里面需要更多的数据的分析支撑以及对结果的提炼。


以上是王楠教授的讲演。随后,王晓群总监从行业实践的视角,从数据分析、数据挖掘和人工智能三个角度分别举例,分享了国双科技在政府网站数据领域的一些实践案例。


国双科技政府事业部产品总监  王晓群 


王晓群总监首先引用《国家大数据发展战略》指出数据的价值和历史机遇。“在大数据时代,数据正在成为一种生产资料,成为一种稀有的资产和新兴的产业,任何一个行业和领域都会产生有价值的数据,而对这些数据的统计、分析、挖掘和人工智能会创造意想不到的价值和财富”。


一、数据纬度的细分,能够帮助我们更好的分析问题和解决问题


国网网站改版通过超过18个纬度的数据分析和加权计算,对所有频道重要性进行重新排序,挑选出相对比较科学的8个频道栏目。如果我们只是单纯通过访问量或通过所谓政策的单一角度来分析,大家很难达成一致。而当数据细分到一定程度再来分析和解决问题,排序出来的结果就有很强的说服力。



对比网站改版前后变化,网站层级变少,清爽度更好,信息也不再那么杂乱。新网站同时兼顾改版服务需要、用户体验需要、甚至是搜索引擎需要。


二、大数据以曲为直的数据挖掘方法,可以临时性解决数据烟囱问题


1. 数据烟囱问题背景


在信息孤岛和数据烟囱存在的今天,大数据“以曲为直”的解决问题的方法是大家所看重的,因为我们还是要解决实际问题。


预测交通状况,虽然没有交通局数据,比如用智能停车数据,某一个时间段内大量汽车从地库或停车场涌上路面,就能预测接下来交通状态可能会比较拥堵。用智能生活数据,7点半的时候用电数据都下降,说明大家关灯关电器出门,可能再过10分钟路面就要拥堵。


2.农业部网站病虫害页面访问量统计的案例


在全国访问农业部网站的统计结果中抽取访问病虫害相关的数据,按照地理纬度打点,标记出来画成热力图并把一年热力图串成一帧帧动画播放看整个效果,推测这张图可能和全国实际发生的病虫害情况一致。甚至还可以推测出一些结论,比如2012年底冬季病虫害信息比较少,冬季是病虫害的低发期,12月到1月江浙地区的关注量非常大,可能是冬季油彩蚜虫的发病期。



我们还可以去和业务部门数据做比对。如果我这里有病虫害但业务部门没监测到病虫害数据,可以进一步分析是没有统计到还是那个地方没有上报;如果是我这里没监测到但业务部门那里有病虫害,那就得反思推测模型是不是出了问题,会不会那里网络不够好或是不知道农业部网站没有进行访问。因此,可以通过推测与验证不断优化模型和解决问题。


三、文本挖掘关联分析与人工智能


1.短语词云实现初步数据智能



从关键词词云到短语词云,能够帮助我们更好的从文本信息里挖掘知识,这是一种初步的数据智能。右边的图是国双在特定行业领域实现的结果。分析文本得到的结果不是说用户在讨论刹车、用户在关注油耗,而是直接告诉你这些用户认为你的刹车疲软,认为你的汽车油耗低,更直观的把结论和知识呈现出来。


2. 舆情分析系统横跨多个纬度做知识关联统计


现在市面上绝大多数舆情分析仅从单一纬度进行统计分析,无法回答在某某媒体上某个地区的普通网民关注哪些词,因为这需要横跨三个纬度去分析数据。



国双实现了横跨8个纬度的知识关联实体的统计分析。这样的关联分析不仅是给一个信息或数据的呈现,而是能够更好更直接的回答问题,甚至去挖掘一些你可能都不知道的问题。

 

3. “我向总理说句话”文本分析服务的案例



 “我向总理说句话”日常向大家收集对政策的建言,通过对连续三年收到的百万条网民留言进行分析,能够支撑政府工作报告以及其他政策的制定。2016年我们挑选了2000多条网民建言报告给国办,其中有101条建言和两会上总理做的政府工作报告中的表述高度契合。


4. 改革知识库系统案例


知识库知识图谱概念正逐渐兴起,其中运用到大数据加人工智能技术。智能主要体现在两方面:第一是提供参考和做事的依据,对专业人员工作进行指导;第二是管理层评估个人工作,从以前根据经验判断,到现在利用知识库系统检查工作偏差度的客观评价。


改革知识库系统在时间、地点、人物、事件等方面进行结合,提供一种知识查询功能。未来知识库系统可以智能产生结果帮助大家直接解决问题。


四、畅想未来


畅想未来,我们认为智慧型大数据政府还有很多的机遇和挑战,应用的广度和深度都有很大提升空间。从应用广度来看,内部数据打通,多机构部门数据连接,未来目标是整个大政府都由智慧型大数据来驱动。从应用深度上来看,从“数据的智能”到“分析的智能”最后发展到“决策的智能”。


具有决策智能型的大政府是未来的方向,我们离这一目标还有一段距离。《国家大数据发展战略》提到,“在大数据时代,用大数据可以通过海量、动态、高增长、多元化、多样化的数据高速处理,快速获得有价值的信息,提高公共决策能力”,这是国家要求,也是我们面临的巨大机遇和挑战。

 

后台回复关键词“1130”,下载张楠教授完整版PPT。

内容整理:莫天

校对:丁楠雅

为保证发文质量、树立口碑,数据派现设立“错别字基金”,鼓励读者积极纠错

若您在阅读文章过程中发现任何错误,请在文末留言,或到后台反馈,经小编确认后,数据派将向检举读者发8.8元红包

同一位读者指出同一篇文章多处错误,奖金不变。不同读者指出同一处错误,奖励第一位读者。

感谢一直以来您的关注和支持,希望您能够监督数据派产出更加高质的内容。

登录查看更多
0

相关内容

从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。前文提到的网络日志、视频、图片、地理位置信息等等。第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
少标签数据学习,54页ppt
专知会员服务
196+阅读 · 2020年5月22日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
专知会员服务
123+阅读 · 2020年3月26日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
301+阅读 · 2019年12月23日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
医药零售行业报告
医谷
9+阅读 · 2019年7月8日
2019中国养老产业发展剖析与发展趋势分析报告
行业研究报告
8+阅读 · 2019年5月18日
腾讯85页PPT“智能+”产业报告
物联网智库
52+阅读 · 2019年5月1日
艾瑞咨询2019中国智慧城市发展报告,附PPT下载
智能交通技术
25+阅读 · 2019年4月18日
网络舆情分析
计算机与网络安全
20+阅读 · 2018年10月18日
警务云情报分析研判平台解决方案(ppt)
智能交通技术
16+阅读 · 2018年3月18日
Clustered Object Detection in Aerial Images
Arxiv
5+阅读 · 2019年8月27日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
4+阅读 · 2016年12月29日
VIP会员
相关VIP内容
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
少标签数据学习,54页ppt
专知会员服务
196+阅读 · 2020年5月22日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
专知会员服务
123+阅读 · 2020年3月26日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
301+阅读 · 2019年12月23日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
相关资讯
医药零售行业报告
医谷
9+阅读 · 2019年7月8日
2019中国养老产业发展剖析与发展趋势分析报告
行业研究报告
8+阅读 · 2019年5月18日
腾讯85页PPT“智能+”产业报告
物联网智库
52+阅读 · 2019年5月1日
艾瑞咨询2019中国智慧城市发展报告,附PPT下载
智能交通技术
25+阅读 · 2019年4月18日
网络舆情分析
计算机与网络安全
20+阅读 · 2018年10月18日
警务云情报分析研判平台解决方案(ppt)
智能交通技术
16+阅读 · 2018年3月18日
Top
微信扫码咨询专知VIP会员