不要再用arxiv链接了!为了让论文引用更规范,上交毕业生、南加州大学华人博士创建了一个小工具

2021 年 1 月 28 日 机器之心

机器之心报道

作者:魔王

只需两步,将文献的 arXiv 信息转换为正式来源信息。


伴随着预印本平台 arXiv 的广泛使用,越来越多的研究者喜欢在写论文参考文献时直接使用 arXiv 信息。这看似非常方便,但也存在问题:这篇 arXiv 论文是否在 ACL、EMNLP、NAACL、ICLR 或 AAAI 等学术会议上发表过?

没错,在某些情况下,只引用 arXiv 信息显得不那么准确,这种不准确的文献条目甚至可能会违反某些会议的论文提交或 camera-ready 版本提交规则。

如何解决这一问题呢?最近,上交毕业生、南加州大学博士生林禹臣开发了一个简单的 Python 工具——Rebiber,它能够基于 ACL Anthology 和 DBLP 数据库自动解决这一问题。

项目地址:https://github.com/yuchenlin/rebiber


下图展示了 Rebiber 的使用示例:


在该示例中,文章的原始信息来自 Google Scholar,仅包括标题、作者、期刊(arXiv)、年份。而事实上该论文已被 EMNLP 2020 接收,原始信息显然不够准确。

经过 Rebiber 转换后,原始 arXiv 信息被转换为来自正式来源的准确信息,包括标题、作者、年月、出版商、数字对象识别码(doi)、网址等详细内容。

Rebiber 支持的会议包括 ACL Anthology 涵盖的会议,如 ACL、EMNLP、NAACL 及其 workshop,以及 DBLP 涵盖的会议,如 ICLR 2020。

目前,Rebiber 支持的会议列表如下所示:


使用者还可以手动添加 DBLP 包含的任意会议:只需从 DBLP 中下载会议 bib 文件至 data 文件夹,然后将其转换为 json 格式,再把路径添加至 bib_list.txt 即可。

如何使用?

这款工具的使用也很简单。

首先,运行以下命令行:

git clone https://github.com/yuchenlin/rebiber.gitpip install bibtexparser tqdmcd rebiber

然后,将文献条目归一化为正式格式:

python normalize.py -i example_input.bib -o example_output.bib -l bib_list.txt

只需要简单的操作,就可以将 arXiv 信息转换为正式信息了。

项目作者简介


项目作者林禹臣本科毕业于上海交通大学 IEEE 试点班,曾获上海市优秀本科生奖学金、上海交通大学优异学士学位论文奖,现在南加州大学攻读计算机科学博士学位,导师为南加州大学计算机科学学院助理教授、情报与知识发现(INK)研究实验室主任任翔。

他曾在微软亚洲研究院和谷歌 AI 有多段实习经历,研究兴趣包括构建能够深度理解世界的神经符号系统、集成信息提取、知识图谱、机器推理、图神经网络和模型鲁棒性的技术。近期研究集中在利用常识推理推动自然语言处理(理解与生成)。多篇论文发表在 ICLR、AAAI、EMNLP、KDD、ACL 等学术会议上。

参考链接:https://yuchenlin.xyz/

百万级文献分析,十万字深入解读
2020-2021 全球AI技术发展趋势报告

报告内容涵盖人工智能顶会趋势分析、整体技术趋势发展结论、六大细分领域(自然语言处理、计算机视觉、机器人与自动化技术、机器学习、智能基础设施、数据智能技术、前沿智能技术)技术发展趋势数据与问卷结论详解,最后附有六大技术领域5年突破事件、Synced Indicator 完整数据。

识别下方二维码,立即购买报告。

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

登录查看更多
0

相关内容

arXiv(X依希腊文的χ发音,读音如英语的archive)是一个收集物理学、数学、计算机科学与生物学的论文预印本的网站,始于1991年8月14日。截至2008年10月,arXiv.org已收集超过50万篇预印本;至2014年底,藏量达到1百万篇。在2014年时,约以每月8000篇的速度增加。
自然语言处理顶会COLING2020最佳论文出炉!
专知会员服务
23+阅读 · 2020年12月12日
如何撰写好你的博士论文?CMU-Priya博士这30页ppt为你指点
专知会员服务
55+阅读 · 2020年10月30日
【新书】图神经网络导论,清华大学刘知远老师著作
专知会员服务
361+阅读 · 2020年6月12日
还在修改博士论文?这份《博士论文写作技巧》为你指南
【高能所】如何做好⼀份学术报告& 简单介绍LaTeX 的使用
CMU博士论文:可微优化机器学习建模
专知会员服务
58+阅读 · 2019年10月26日
招募 | 新加坡南洋理工大学招博士后
AI科技评论
6+阅读 · 2019年4月21日
最新国内大学毕业论文LaTex模板集合(持续更新中)
人工智能前沿讲习班
54+阅读 · 2019年3月1日
2018 ACL fellow 出炉,5人上榜,无中国学者
专知
4+阅读 · 2018年12月18日
IEEE Fellow 2019 名单出炉,41位华人学者入选
科学网
4+阅读 · 2018年11月25日
新加坡科技设计大学杨杰博士莅临我校,并做了报告:Recent Advances in Sequence Labeling
黑龙江大学自然语言处理实验室
4+阅读 · 2018年9月13日
2018全球大学AI排名发布,中国高校表现强势!
行业研究报告
3+阅读 · 2018年4月1日
Arxiv
0+阅读 · 2021年6月11日
Arxiv
14+阅读 · 2019年11月26日
Arxiv
20+阅读 · 2019年9月7日
VIP会员
相关资讯
招募 | 新加坡南洋理工大学招博士后
AI科技评论
6+阅读 · 2019年4月21日
最新国内大学毕业论文LaTex模板集合(持续更新中)
人工智能前沿讲习班
54+阅读 · 2019年3月1日
2018 ACL fellow 出炉,5人上榜,无中国学者
专知
4+阅读 · 2018年12月18日
IEEE Fellow 2019 名单出炉,41位华人学者入选
科学网
4+阅读 · 2018年11月25日
新加坡科技设计大学杨杰博士莅临我校,并做了报告:Recent Advances in Sequence Labeling
黑龙江大学自然语言处理实验室
4+阅读 · 2018年9月13日
2018全球大学AI排名发布,中国高校表现强势!
行业研究报告
3+阅读 · 2018年4月1日
Top
微信扫码咨询专知VIP会员