「计算经济学」是什么科学?
计算经济学,简单说就是利用已有的海量数据,感知社会经济发展情况、发现制约其发展的关键问题并提出解决方案。
2019年3月21日,周涛老师在腾讯做了关于计算经济学的分享,通过宏观举例和具体研究向大家阐释了何为计算经济学及计算经济学的基本研究对象和方法。以下内容根据演讲整理。
举几个栗子
怎么样利用一些好像不是经济学的数据,去做一些经济学的问题?
1. 我们通过遥感看晚间的灯光的数据,能看到一些地方大概的社会经济发展情况,推算出哪些地方更贫穷一些,哪些地方更富裕一些。
2. 通过社交媒体看城市产业的健康度
通过4.3亿微博用户的活跃程度预测经济发展情况。
3. 用人才流动数据预测经济情况
利用一个简历数据库,看人们在哪儿读书、学历如何、读完书从哪个城市到哪个城市、薪水如何,通过人才的流动预测经济趋势。
两个研究
1
佛教徒会跟基督教徒做朋友吗?
不同宗教和文化团体,因内部倡导文化不同,会表现出不同的社会连接。越小众的亚文化团体,往往内部成员连接越紧密。宗教亦是如此。有些宗教可能比较包容,也有些宗教可能相对保守。
那么,宗教成员之间是怎样相互连接的呢?
图片来源:J. Hu, et al., arXiv: 1802.06721, 2018
经过我们的研究,得到了一些比较重要的结论:
第一,每个地方的宗教都是分离的,可能和内部连接很紧密,不在一个宗教都不想和你连接。
整个宗教的分离程度比历史上报道过的一切社交网络中的分离程度高,比如说因为种族分离、性别分离。
第二,47.6%的跨宗教连边都是和慈善有关的,换句话说,一半左右的跨宗教连边,连的这两个中间至少有一个人是搞慈善的,或者因为慈善而连在一起。哪些慈善相关的账号大多都属于佛教。这些结果暗示,佛教在中国的跨宗教交流中扮演重要角色,慈善活动或将促进宗教间的沟通。
2
什么样的学生成绩更好?
如何通过学生行为预测学生成绩?当我们拥有众多学生的一卡通数据,这个问题也许就能解决。一卡通数据意味着了解学生的吃饭、洗澡、进出图书馆、打水以及买东西等的行为规律。
有这个数据之后,我们分析了党员和非党员成绩的差异,发现党员成绩比比较平均分比非党员高4分。
另外,基于教学楼打水和进出图书馆的次数,估计努力程度(Diligence)。行为数越多,努力程度越大。
图片来源:Y. Cao, et al., J. R. Soc. Interface 15 (2018) 20180210
数据分析发现,有序性与学习成绩显著正相关。努力程度与学习成绩的关联性,稍微强于有序性与学习成绩的关联性。有序性与努力程度不显著相关,说明他们对学习成绩的独立解释能力。将有序性作为重要特征引入机器学习模型,能够显著提高对成绩的预测能力。
这些结果或将对学生的预测性管理产生很大影响。如果学生沉迷于网络游戏,很可能表现出行为有序性极大降低。通过分析行为数据,可以精准识别网络沉迷学生,有针对性的引导他们的校园生活,避免严重学业问题的出现。
总结
计算社会经济学研究的就是来自社会经济学各种各样的现象,主要是来自于社会经济发展的,用的是定量化的手段,并且基于大量的数据,在这一套方法论中有三个关键点:
1. 量化方法(quantitative method)
量化就是利用数量来计算。在大五人格出现以后,人格理论才变成一个科学的分支,我可以通过问卷给大五人格打分,然后把它和你的就业、成功、家庭幸福、寿命等联系起来,这就变成了可以合理化的科学问题。
2. 真实的数据(real data)
计算经济学是需要采用真实的数据来计算的。传统经济学常常会为了数学的美感和工整,丢掉很多细节,也没有任何用数据驱动的方法。另外,大部分的经济学数据不是用真实的数据,而是基于一些模型做的,这使它越来越偏离现实,对现实的预测能力随着经济系统变得复杂而变得越来越差。
3. 大规模(large scale)
这是从收集的数据样本来看,一方面就如同我们传统的认知那样,大规模的样本相比小样本误差是小一些的;但从另一方面来说,一些研究发现大样本数据做出的结果和小样本做出来的结果可能有本质的不同,这不仅仅是量的差异带来的变化,而是本质的不同。
-- END --