为什么科学家的研究兴趣老变?

2017 年 12 月 11 日 科学网

欢迎点击「科学网」↑关注我们!


摘要

研究和理解科学家研究兴趣的转移与演化具有重要意义。Nature HumanBehaviour上近期的一篇论文用海滩游走seashore walk)模型解释其内在的演化规律与特性。


步一 / Indiana University


注:图片来源于参考文献中的论文


科学家像『海边捡贝壳的孩子』

牛顿说:在我的科学生涯中,我就像一个在海滩上玩的孩子一样,找啊找,最终找到了更美丽的贝壳。科学家研究兴趣的变化也大致如此。


科学家的研究兴趣并非一成不变的,而是随着社会变迁、技术进步、文化兴起而不断变化。例如,十年前,科学家的研究兴趣并不包括人工智能、大数据等。科学计量学中科学家“研究领域”的测度,主要使用以下几种方式:


✦使用文献关键词、题名、摘要或者全文进行自然语言分析;


✦使用主题建模方法;


✦使用数据库提供的分类号。


尽管以往存在一些研究,对于科学家研究兴趣的转移进行了一定的定量描述,但极少有文章使用大规模数据,以物理建模和拟合的方式,对科学家研究兴趣演化机制进行探讨。今年,Tao Jia教授等人在Nature Human Behaviour上发表了一篇论文在这一领域做了尝试。


科学家的职业生涯与研究兴趣

Tao Jia教授等人使用了美国物理学会(APS,AmericanPhysical Society)中含有物理学与天文学分类号的数据集。数据集包含了1976-2009年间发表的物理学领域的论文;这些论文的作者姓名已经由前人进行了消歧。


科学家在数据集中第一篇文章的发文年份被视为该科学家职业生涯的起点,而在数据集中最后一篇文章的发文年份则被定义为终点。作者首先选取了所有科学家职业生涯最开始的两篇和最末的两篇文章(m=2),然后获取这四篇文章在数据集中的分类号(同一篇文章可能被标记多个不同的分类号);作者用分类号的前两位代表论文所在的大类。随后,作者使用余弦相似度计算每位科学家职业生涯开始和结束时期的话题相似度。为了得到更具有鲁棒性的结果,作者尝试选取了不同的m值进行同样的计算,得到了类似的结果。这表明m值的选取对于实证结果整体影响不大。


科学家研究兴趣的变化

作者随后提出三种不同的特性来理解科学家职业生涯中研究兴趣的转移。


✦异质性(heterogeneity)强调,科学家在其职业生涯中发表的论文可能在研究话题上有所重复,但有些可能只出现一次。


✦新近效应(recency)则假设,科学家在研究过程中会尽量避免回到之前研究过的话题中,这导致他们倾向于探索更新的研究话题。


✦主题相近性(subject proximity)则认为,当科学家准备变换其研究话题时,他/她更可能选择和之前研究话题类似(但不是相同)的研究话题。


为了更好地探索这三种特性是否会潜在影响科学家研究领域的转移,作者使用了三种不同的方式建立了三种不同的对照模型。研究发现,这三种特性都影响着科学家研究兴趣的转移。其中,异质性和主题相近性起到了对现有研究领域深度挖掘和探索的作用,但新近效应则相反,它驱使科学家探索新的研究领域。


用『海滩游走』模型解释『为什么科学家的研究兴趣老变』

科学家寻找研究兴趣的过程与牛顿在海滩建筑贝壳的过程相似。因此,作者使用上图中的“海滩游走”(seashore walk)模型来解释科学家的研究兴趣的演化。


在这一模型中,“海滩”上有某一数量的点,某些点上存在一定数量的贝壳,存在多种类型的贝壳,每种类型代表一种研究话题,贝壳数量在各点上的概率分布为P(q),有可能某些点上不存在任何种类的贝壳。


科学家随机从“海滩”上选择一个点,然后向左或者向右随机行走,向左和向右的概率均为0.5;他(她)有可能在某些点上经过两次或两次以上;走到的点如果有贝壳,则代表发表了一篇某种研究话题的论文。科学家每走一步代表着一个单位的时间过去,他(她)所走的总步数等于其科学职业生涯包含的总时间(即数据集内最后一篇他的论文与最先一篇他的论文的时间之差)。作者成功拟合了实际数据。


参考文献

Jia, T., Wang, D., & Szymanski, B. K.(2017).Quantifying patterns of research-interest evolution. Nature Human Behaviour, 1,0078.


转载本文请联系原作者获取授权,同时请注明本文来自李江科学网博客。
链接地址:http://blog.sciencenet.cn/blog-1792012-1088890.html

关注我们

微信号:sciencenet-cas (←长按复制) 或长按下方二维码

登录查看更多
0

相关内容

专知会员服务
142+阅读 · 2020年6月15日
一份简短《图神经网络GNN》笔记,入门小册
专知会员服务
224+阅读 · 2020年4月11日
图神经网络表达能力的研究综述,41页pdf
专知会员服务
168+阅读 · 2020年3月10日
BERT技术体系综述论文:40项分析探究BERT如何work
专知会员服务
138+阅读 · 2020年3月1日
专知会员服务
232+阅读 · 2020年1月23日
【论文】结构GANs,Structured GANs,
专知会员服务
14+阅读 · 2020年1月16日
周志华教授:如何做研究与写论文?
专知会员服务
148+阅读 · 2019年10月9日
钱炜:与山同坐,成为灯塔
罗辑思维
14+阅读 · 2019年6月30日
为什么强化学习会成为当下机器学习最火的研究领域?
机器学习算法与Python学习
6+阅读 · 2018年6月15日
如何用人工智能帮你找论文?
AI100
10+阅读 · 2018年2月21日
为什么大家都不戳破深度学习的本质?
36大数据
4+阅读 · 2017年12月7日
GAN猫的脸
机械鸡
11+阅读 · 2017年7月8日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Feature Selection Library (MATLAB Toolbox)
Arxiv
7+阅读 · 2018年8月6日
Arxiv
3+阅读 · 2018年6月24日
Arxiv
3+阅读 · 2018年2月24日
VIP会员
相关VIP内容
专知会员服务
142+阅读 · 2020年6月15日
一份简短《图神经网络GNN》笔记,入门小册
专知会员服务
224+阅读 · 2020年4月11日
图神经网络表达能力的研究综述,41页pdf
专知会员服务
168+阅读 · 2020年3月10日
BERT技术体系综述论文:40项分析探究BERT如何work
专知会员服务
138+阅读 · 2020年3月1日
专知会员服务
232+阅读 · 2020年1月23日
【论文】结构GANs,Structured GANs,
专知会员服务
14+阅读 · 2020年1月16日
周志华教授:如何做研究与写论文?
专知会员服务
148+阅读 · 2019年10月9日
相关资讯
钱炜:与山同坐,成为灯塔
罗辑思维
14+阅读 · 2019年6月30日
为什么强化学习会成为当下机器学习最火的研究领域?
机器学习算法与Python学习
6+阅读 · 2018年6月15日
如何用人工智能帮你找论文?
AI100
10+阅读 · 2018年2月21日
为什么大家都不戳破深度学习的本质?
36大数据
4+阅读 · 2017年12月7日
GAN猫的脸
机械鸡
11+阅读 · 2017年7月8日
Top
微信扫码咨询专知VIP会员