项目名称: 中英文论文中的中国作者姓名消歧研究

项目编号: No.71473236

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 管理科学

项目作者: 袁军鹏

作者单位: 中国科学技术信息研究所

项目金额: 59万元

中文摘要: 作者姓名消歧是科技评价、科学计量学、数字图书馆、信息检索等领域当前急需但是尚未解决的基本问题之一。越来越多的中国学者同时发表中、英文论文,但是中国作者的英文姓名音译、简写后重名现象更加严重,中国作者中、英姓名消歧就更加复杂和困难。本项目提出寻找拥有共同中文姓名或共同英文姓名的中国作者所发表论文的真正作者智能算法。该算法主要包括中、英文论文中基于唯一性特征的作者姓名消歧算法,改进的合著网络和作者领域演化的姓名消歧算法等。在进行英文姓名消歧时,集成利用中文论文信息,减少英文同名数据集的规模,提高姓名消歧效率。这些问题大多数是对此领域的新探索,对于发展和完善作者姓名消歧的理论与方法有较大的意义。该问题的解决可以把基于科学计量学的评价和文献检索推进到微观的个人层面,可以为学科发展、科研评价、产出分析、机构测度、人才评价、成果管理、信息搜索等提供更准确的数据支撑,具有广泛的应用背景和发展前景。

中文关键词: 姓名消歧;合著网络;引文分析;科学计量学

英文摘要: For any work of literature, a fundamental issue is to identify the individual(s) who wrote it, and conversely, to identify all of the works that belong to a given individual. Attribution would seem to be a simple process and yet it represents a major, unsolved problem for information science. It is more difficult to identify the Chinese author's English name. This project focuses on Chinese author name disambiguation who wrote Chinese and English Papers. We analysis papers and authorship characteristics, combined with the nature of the characteristics of the existing algorithms, design of machine learning algorithms. Specific analysis include: based on the unique characteristics of author name disambiguation, propose the evolution of the field and co-author network of author name disambiguation, integrating existing Chinese information to assist the English of author name disambiguation, especially identify the different data sets but the author have the same name in English, to reduce the scale of same name in English. The project is the research focus of the field of information science, bibliometrics, web search, natural language processing and information extraction in recent years. Solution of the problem to the literature data retrieval and evaluation based on bibliometrics advance to the micro-individual level, can provide data to support the personnel evaluation, preventing the phenomenon of academic false and academic fraud, has a wide application background and development prospects.

英文关键词: Name Disambiguation;Co-author Networks;Citation Analysis;Scientometrics

成为VIP会员查看完整内容
0

相关内容

专知会员服务
45+阅读 · 2021年8月12日
ICML 2021论文收录
专知会员服务
122+阅读 · 2021年5月8日
【机器学习术语宝典】机器学习中英文术语表
专知会员服务
59+阅读 · 2020年7月12日
近期必读的五篇KDD 2020【图神经网络 (GNN) 】相关论文_Part2
专知会员服务
157+阅读 · 2020年6月30日
近期必读的12篇KDD 2019【图神经网络(GNN)】相关论文
专知会员服务
62+阅读 · 2020年1月10日
六篇 EMNLP 2019【图神经网络(GNN)+NLP】相关论文
专知会员服务
71+阅读 · 2019年11月3日
线上兼职招募丨NLP论文数据标注
学术头条
2+阅读 · 2021年12月8日
自动化所主办期刊《Machine Intelligence Research》即将出版
中国科学院自动化研究所
0+阅读 · 2021年11月15日
哈工大SCIR入选2020年度科研团队公众号Top10
哈工大SCIR
1+阅读 · 2021年5月6日
解读《中国新一代人工智能发展报告2019》
走向智能论坛
32+阅读 · 2019年6月5日
论文浅尝 | 基于知识库的自然语言理解 01#
开放知识图谱
15+阅读 · 2019年2月22日
热烈祝贺CSIG机器视觉专委会多名委员入选中国高被引学者
CSIG机器视觉专委会
0+阅读 · 2018年1月21日
资源:10份机器阅读理解数据集 | 论文集精选 #02
PaperWeekly
11+阅读 · 2017年9月16日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
5+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
26+阅读 · 2022年1月13日
Arxiv
28+阅读 · 2021年10月1日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
小贴士
相关主题
相关VIP内容
相关资讯
线上兼职招募丨NLP论文数据标注
学术头条
2+阅读 · 2021年12月8日
自动化所主办期刊《Machine Intelligence Research》即将出版
中国科学院自动化研究所
0+阅读 · 2021年11月15日
哈工大SCIR入选2020年度科研团队公众号Top10
哈工大SCIR
1+阅读 · 2021年5月6日
解读《中国新一代人工智能发展报告2019》
走向智能论坛
32+阅读 · 2019年6月5日
论文浅尝 | 基于知识库的自然语言理解 01#
开放知识图谱
15+阅读 · 2019年2月22日
热烈祝贺CSIG机器视觉专委会多名委员入选中国高被引学者
CSIG机器视觉专委会
0+阅读 · 2018年1月21日
资源:10份机器阅读理解数据集 | 论文集精选 #02
PaperWeekly
11+阅读 · 2017年9月16日
相关基金
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
5+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员