专访 | 社科学院和美术学院毕业生与大数据的故事【第一届数据故事计划】

2019 年 5 月 9 日 数据派THU


摘要:细听学长学姐讲故事,或许在他们的路上也有你的身影!


【第一届数据故事计划】


“数据故事计划”旨在收集各类有关大数据的故事然后进行比赛及相关的宣传和推广。包括同学们接触大数据、使用大数据、最终取得成果的过程,主要内容为大数据在各类行业的应用以及个人感悟。希望以此活动使得更多同学认识大数据,学会利用大数据解决问题,最终实现向“数据ers”的转变。

 

 

这一期数据故事,我们联系到了“大数据能力提升项目”的优秀毕业生仉力学长与张玉平学姐,他们在走向工作岗位后仍然与大数据有着密切的联系,让我们来听听他们口中的大数据吧。


 仉力



毕业年份:2016年毕业

毕业院系及专业:社会科学学院理论经济学(大数据硕士项目)

目前所处公司及职业:河北省发展和改革委员会副主任科员

 

项目简介

 

我们在保定市涞源县的一个贫困乡驻村扶贫,涞源县是国家级贫困县,境内几乎全为山区,交通不畅,与外界联系极为不便。涞源县富有矿山,采矿、炼铁原是其支柱产业,但近些年为改善首都空气质量,大部分现已关停,全县缺乏二三产业和龙头企业,就业机会匮乏。


近年来,随着精准扶贫的大力推进,政府对贫困地区进行了大量投入,基础设施条件显著改善,不仅村村通了硬化路,光纤、4G网络也已基本全覆盖,接入外界信息等资源的能力大幅提升。另一方面,随着人工智能技术广泛应用于各个领域,深度学习对训练样本的需求也越来越大,机器学习的训练样本都是人工手动标注,是劳动密集型产业,且只需要一台接入网络的电脑就能远程完成,不受地理和交通的限制。


乡村振兴,数据先行。数据标注需要大量的人工,而交通不便的贫困农村恰有富余的低成本劳动力。作为一项探索尝试,我们在村里建起了“大数据与人工智能网络众包工作室”,吸纳留在村里的中青年,在培训他们熟练使用电脑的基础上,承揽数据标注、数据整理、数据采集等网络众包业务,帮助村民们足不出村、乃至足不出户就能就业增收。

 

Q1:您现在所进行的大数据项目/文章主要应用的是哪个大数据技术,以及能否介绍一下该技术的优劣、以及可解决的问题种类。


A1:我们做的事情没有复杂的技术,主要就是对接劳动力的供求双方,为交通不便又缺乏产业的贫困地区的富余劳动力提供就业机会,同时也为大数据与人工智能的机器学习训练集提供低成本供给。


引导贫困农村劳动力参与大数据与人工智能领域的网络众包,优势在于其人力成本低,且若能建立起稳定有效的运行机制,帮助贫困地区发展起劳动密集型产业,将产生较大的社会价值。


劣势在于贫困地区人口文化素质偏低,电脑操作能力有限,初期需要大量培训,只能进行较为简单的操作,对需要较强专业知识背景的操作难以胜任;质量管控、专业素质培养等方面也需要更大投入。

 

Q2:走上工作岗位之后,您都用过什么样的大数据技能帮助您解决工作中/生活中的何种问题?


A2:在工作中,我曾运用大数据互通共享的理念,整合乡镇的人口信息数据,实现民政、工商、环保、党建、维稳等信息“一库通查”,提高了工作效率。在生活中,我常用词云和词频分析等工具解剖重大新闻或政策文件,以更好地把握要点。

 

Q3:您有什么建议/口号,给目前还在学习大数据的同学做指导/鼓励?


A3:Data is power!此外,我们的众包工作室还在起步阶段,还没有较为稳定的业务渠道,如果校友或其他热心人士从事相关行业,各位看官能否提供一些业务,进而带动更多贫困村农民就业增收?如图片分割标注、文档整理等,我们已较为熟练。村民的文化素质偏低,但好在较为年轻,还有不错的学习能力,我们将尽百分百的心力做好!(如有意愿可在公众号后台留言:众包业务+姓名+个人联系方式)

 

张玉平


张玉平(左六)毕业时与数据科学研究院的老师们合影留念


毕业年份:2018年毕业

毕业院系及专业:美术学院艺术史论系

目前所处公司及职业:中国华录集团,方案策划

 

项目简介


前不久做了一个文化科技小镇的case,方案的关键点在于如何通过大数据分析来提升文化场馆的运营效率,从哪些维度来做用户画像,怎么设计文化业态来深挖小镇旅客的用户价值,整个过程需要和技术部门的同事密切合作。


我所在的策划部几乎都是文科生,多在工作后才开始接触大数据,而我得益于之前在学校时学的大数据知识,虽然刚入职,却幸运地把握住了这个机会。上个月顺利完成了这个方案,效果还不错。


所以,我非常庆幸自己在学校参加过大数据能力提高项目,π型人才培养模式的确让我很受益。我不够懂技术,但是我可以理解技术部门同事说的意思,并从市场营销的角度给技术部门提需求,共同商量怎么落实到方案里。

 

Q1:您现在所进行的大数据项目/文章主要应用的是哪个大数据技术,以及能否介绍一下该技术的优劣、以及可解决的问题种类。


A1:通过分析用户画像,深挖用户价值,调整业态布局,提高文化设施的商业收入。

 

Q2:走上工作岗位之后,您都用过什么样的大数据技能帮助您解决工作中/生活中的何种问题?


A2:我认为更多是大数据这种思维,让我能够理解不同背景的领导同事合作方所讲的概念,并在做“文化+科技”的case中能够更全局地思考问题。

 

Q3:您当时所印象最深的一门大数据项目课程/实践是什么?能否介绍一下,以及请谈谈感受深的原因。


A3:大数据暑期实践课。这门课非常好地将所学知识付诸实践,整个过程变数非常大,我们开头根本没有料到会出现的各种意外,但应对这些意外的过程让我们获得了非常大的成长。作为小组里唯一的文科生,我从开头只做市场端口的设计,到后来还要在B班技术大牛们跟甲方争执地很来气的时候跳出来软化局面、平复各方情绪,还要通过各种沟通来凝聚各位技术大牛齐心协力去朝一个方向努力。过程是很艰辛的,但是现在回头看这次实践激发了我的沟通潜能,这都是我成长的财富。徐葳老师的技术指导让我们在数据遇到问题时找到新方向,罗国荣老师的心理鼓励让我们在柳暗花明中继续打起精神向前走,特别感谢老师们!

 

Q4:您有什么建议/口号,给目前还在学习大数据的同学做指导/鼓励?


A4:首先,我刚开始学大数据并不知道能和我专业有什么契合点,当时就是对大数据本身感兴趣。后来在学习的过程中逐渐发现了很多契合点,后来在我找工作时大数据这个教育背景给我很大助力,现在也让我在职场表现地更好。


另外,很多文科的学弟学妹会担心学习难度的问题。我刚上《大数据系统基础A》的时候,感觉老师讲的很好,这是个全新的世界很有意思,可是我只能听懂一个个散点,没法连成体系来理解,这让我很着急。所幸我参加了大数据协会,跟协会里信息学院的同学多请教,尤其是向不同同学问同一个问题,对比不同答案会有更立体的理解。协会的前辈也会推荐一些入门书,读这些书也很有利于文科生理解大数据。当然了,最棒的还是当时的会长做了一次针对文科生的考前辅导,用文科生的认知维度来讲解大数据,这让我茅塞顿开,感觉一下子融会贯通了起来。

 

更多数据故事,敬请期待~也欢迎各位读者分享你与大数据的故事!


编辑:文婧


登录查看更多
1

相关内容

从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。前文提到的网络日志、视频、图片、地理位置信息等等。第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。
专知会员服务
123+阅读 · 2020年3月26日
中科大-人工智能方向专业课程2020《脑与认知科学导论》
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
【CCL 2019】2019信息检索趋势,山东大学教授任昭春博士
专知会员服务
29+阅读 · 2019年11月12日
西湖大学“人工智能与机器人中心”2019年度招聘
知社学术圈
5+阅读 · 2019年5月1日
清研实践|清华深研院师生赴澳洲墨尔本六所高校开展数据科学访问
国内高校人工智能教育现状如何?
大数据技术
9+阅读 · 2018年4月24日
清华发布全国城市AI实力榜,你那里排名第几?
海康威视AI Cloud助力平安城市4.0建设
海康威视
7+阅读 · 2018年1月17日
Generating Fact Checking Explanations
Arxiv
9+阅读 · 2020年4月13日
Arxiv
14+阅读 · 2020年1月27日
Arxiv
6+阅读 · 2018年10月3日
Arxiv
19+阅读 · 2018年6月27日
Arxiv
6+阅读 · 2018年4月21日
VIP会员
相关论文
Generating Fact Checking Explanations
Arxiv
9+阅读 · 2020年4月13日
Arxiv
14+阅读 · 2020年1月27日
Arxiv
6+阅读 · 2018年10月3日
Arxiv
19+阅读 · 2018年6月27日
Arxiv
6+阅读 · 2018年4月21日
Top
微信扫码咨询专知VIP会员