不要再用arxiv链接了！为了让论文引用更规范，上交毕业生、南加州大学华人博士创建了一个小工具

2021 年 1 月 28 日 机器之心

机器之心报道

作者：魔王

只需两步，将文献的 arXiv 信息转换为正式来源信息。

伴随着预印本平台 arXiv 的广泛使用，越来越多的研究者喜欢在写论文参考文献时直接使用 arXiv 信息。这看似非常方便，但也存在问题：这篇 arXiv 论文是否在 ACL、EMNLP、NAACL、ICLR 或 AAAI 等学术会议上发表过？

没错，在某些情况下，只引用 arXiv 信息显得不那么准确，这种不准确的文献条目甚至可能会违反某些会议的论文提交或 camera-ready 版本提交规则。

如何解决这一问题呢？最近，上交毕业生、南加州大学博士生林禹臣开发了一个简单的 Python 工具——Rebiber，它能够基于 ACL Anthology 和 DBLP 数据库自动解决这一问题。

项目地址：https://github.com/yuchenlin/rebiber

下图展示了 Rebiber 的使用示例：

在该示例中，文章的原始信息来自 Google Scholar，仅包括标题、作者、期刊（arXiv）、年份。而事实上该论文已被 EMNLP 2020 接收，原始信息显然不够准确。

经过 Rebiber 转换后，原始 arXiv 信息被转换为来自正式来源的准确信息，包括标题、作者、年月、出版商、数字对象识别码（doi）、网址等详细内容。

Rebiber 支持的会议包括 ACL Anthology 涵盖的会议，如 ACL、EMNLP、NAACL 及其 workshop，以及 DBLP 涵盖的会议，如 ICLR 2020。

目前，Rebiber 支持的会议列表如下所示：

使用者还可以手动添加 DBLP 包含的任意会议：只需从 DBLP 中下载会议 bib 文件至 data 文件夹，然后将其转换为 json 格式，再把路径添加至 bib_list.txt 即可。

如何使用？

这款工具的使用也很简单。

首先，运行以下命令行：

git clone https://github.com/yuchenlin/rebiber.gitpip install bibtexparser tqdmcd rebiber

然后，将文献条目归一化为正式格式：

python normalize.py -i example_input.bib -o example_output.bib -l bib_list.txt

只需要简单的操作，就可以将 arXiv 信息转换为正式信息了。

项目作者简介

项目作者林禹臣本科毕业于上海交通大学 IEEE 试点班，曾获上海市优秀本科生奖学金、上海交通大学优异学士学位论文奖，现在南加州大学攻读计算机科学博士学位，导师为南加州大学计算机科学学院助理教授、情报与知识发现（INK）研究实验室主任任翔。

他曾在微软亚洲研究院和谷歌 AI 有多段实习经历，研究兴趣包括构建能够深度理解世界的神经符号系统、集成信息提取、知识图谱、机器推理、图神经网络和模型鲁棒性的技术。近期研究集中在利用常识推理推动自然语言处理（理解与生成）。多篇论文发表在 ICLR、AAAI、EMNLP、KDD、ACL 等学术会议上。

参考链接：https://yuchenlin.xyz/

百万级文献分析，十万字深入解读

2020-2021 全球AI技术发展趋势报告

报告内容涵盖人工智能顶会趋势分析、整体技术趋势发展结论、六大细分领域（自然语言处理、计算机视觉、机器人与自动化技术、机器学习、智能基础设施、数据智能技术、前沿智能技术）技术发展趋势数据与问卷结论详解，最后附有六大技术领域5年突破事件、Synced Indicator 完整数据。

识别下方二维码，立即购买报告。

转载请联系本公众号获得授权

投稿或寻求报道：content@jiqizhixin.com

登录查看更多

相关内容

arXiv

关注 1122

arXiv（X依希腊文的χ发音，读音如英语的archive）是一个收集物理学、数学、计算机科学与生物学的论文预印本的网站，始于1991年8月14日。截至2008年10月，arXiv.org已收集超过50万篇预印本；至2014年底，藏量达到1百万篇。在2014年时，约以每月8000篇的速度增加。

自然语言处理顶会COLING2020最佳论文出炉！

专知会员服务

24+阅读 · 2020年12月12日

如何撰写好你的博士论文？CMU-Priya博士这30页ppt为你指点

专知会员服务

58+阅读 · 2020年10月30日

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

专知会员服务

58+阅读 · 2020年7月20日

【新书】图神经网络导论，清华大学刘知远老师著作

专知会员服务

368+阅读 · 2020年6月12日

还在修改博士论文？这份《博士论文写作技巧》为你指南

专知会员服务

166+阅读 · 2020年6月9日

【高能所】如何做好⼀份学术报告& 简单介绍LaTeX 的使用

专知会员服务

94+阅读 · 2020年5月16日

【毕业之路】如何修改博士论文？这份45页PPT《Editing your thesis》教你

专知会员服务

78+阅读 · 2020年4月13日

【EMNLP2019教程】图神经网络GNN的自然语言处理，附315页PPT及作者博士论文下载

专知会员服务

78+阅读 · 2020年1月27日

CMU博士论文：可微优化机器学习建模

专知会员服务

64+阅读 · 2019年10月26日

Natural Language Interface to Knowledge Graph (our experience) ，加州大学圣塔芭芭拉分校严锡峰副教授，CIPS ATT 16（2019）

专知会员服务

16+阅读 · 2019年10月25日

2020顶会指南：征稿截止时间、举办地、举办时间一览

机器之心

7+阅读 · 2020年1月22日

2019杰青名单公示！陈云霁、陈海波、潘纲等青年学者上榜

新智元

4+阅读 · 2019年8月2日

招募 | 新加坡南洋理工大学招博士后

AI科技评论

6+阅读 · 2019年4月21日

最新国内大学毕业论文LaTex模板集合（持续更新中）

人工智能前沿讲习班

54+阅读 · 2019年3月1日

干货 | 清华大学刘知远 CCL 2018学生研讨会报告（附完整PPT下载）

数据派THU

13+阅读 · 2019年1月8日

2018 ACL fellow 出炉，5人上榜，无中国学者

专知

4+阅读 · 2018年12月18日

IEEE Fellow 2019 名单出炉，41位华人学者入选

科学网

4+阅读 · 2018年11月25日

招生 | 全额奖学金机会，加拿大MILA实验室招收博士后和博士生

机器之心

5+阅读 · 2018年11月8日

新加坡科技设计大学杨杰博士莅临我校，并做了报告：Recent Advances in Sequence Labeling

黑龙江大学自然语言处理实验室

4+阅读 · 2018年9月13日

2018全球大学AI排名发布，中国高校表现强势！

行业研究报告

3+阅读 · 2018年4月1日

Finite volume schemes and Lax-Wendroff consistency

Arxiv

0+阅读 · 2021年6月11日

A Topology-Shape-Metrics Framework for Ortho-Radial Graph Drawing

Arxiv

0+阅读 · 2021年6月10日

Graph2Graph Learning with Conditional Autoregressive Models

Arxiv

0+阅读 · 2021年6月6日

HopRetriever: Retrieve Hops over Wikipedia to Answer Complex Questions

Arxiv

10+阅读 · 2020年12月31日

Time-Series Event Prediction with Evolutionary State Graph

Arxiv

14+阅读 · 2020年11月25日

TeMP: Temporal Message Passing for Temporal Knowledge Graph Completion

Arxiv

9+阅读 · 2020年10月7日

AutoETER: Automated Entity Type Representation for Knowledge Graph Embedding

Arxiv

5+阅读 · 2020年10月6日

Few-Shot Knowledge Graph Completion

Arxiv

15+阅读 · 2019年11月26日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

20+阅读 · 2019年9月7日

CERES: Distantly Supervised Relation Extraction from the Semi-Structured Web

Arxiv

6+阅读 · 2018年4月12日

VIP会员