会员服务 ·

如何学会看 arxiv.org 才能不错过自己研究领域的最新论文？

2020 年 8 月 19 日 极市平台

↑ 点击蓝字关注极市平台

来源丨有三AI

极市导读

使用arxiv-sanity，能够很方便地对arxiv.org资源库中的论文进行预览和检索。同时，它还开放了个人图书馆，帮助提高工作效率。>>>极市七夕粉丝福利活动：炼丹师们，七夕这道算法题，你会解吗？

1 什么是arxiv-sanity

我们都知道arxiv.org是一个非常大的预印本资源库，里面有大量的最新的论文，但缺点是浏览、搜索和排序不是很方便。这个库每天会更新大量的论文，如果只是通过手动搜索和浏览效率就太低了。

这样特别容易让人和一些优秀的有趣儿的论文擦肩而过，这些论文可能是和你的研究领域相关的。所以接下来你可能就能猜到这个arxiv-sanity是干什么用的了。

网址为： http://www.arxiv-sanity.com/

2 arxiv-sanity的基本功能

1、便捷的预览

首先，arxiv-sanity在展示最新更新的文献时，提供了可读性更强的缩略图预览模式方便读者来快速预览，并在缩略图下方的绿色区域显示文献的abstract 。

2.感兴趣相关度排序

更重要的是，它可以让你根据自己的阅读兴趣对文献进行重新排序。比如这里有一篇关于对人体姿态估计的文献是你感兴趣的，点击右上角的' rank by tf-idf similarity to this'，文献列表会按照与这篇文章的相关度进行排序，接下来我们会看到arxiv上所有关于人体姿态识别的论文。这个功能是基于TF-DF算法来实现的，效果很好。（一种文档特征提取法，它是由Salton在1988 年提出。其中TF称为词频, IDF称为反文档频率, 感兴趣的可以自己百度。）

3.个人图书馆

如果你是注册用户，在登录账户之后，还可以把自己感兴趣的文献收藏到你的个人图书馆。比如，我喜欢上图的这篇人体姿态估计的文献，点击右上角存盘图标，（看到了吗？就在' rank by tf-idf similarity to this'下面），点击之后就把这篇文献存在我自己的library里面了。

这时，刚刚黑色的图标变成了蓝色，点击上面的library标签，可以看到它出现在了最上方。你可以像这样收藏很多自己感兴趣的文献。想删除的时候，在自己的library里面再次点击那个图标就可以删除了。

4.感兴趣推荐系统

另外，library不光是用来收藏和跟进自己领域的论文更新进度，arxiv-sanity可以通过你收藏的内容给你推荐你也许会感兴趣的论文。具体怎么实现的呢？library内部的论文会被标记为positive，Library之外的论文标记为negative，然后arxiv-sanity基于bigram文本特征提取来训练你的personal SVM，然后在reconmmended 标签里推荐给你。点击recommended标签你就可以看到最近两周arxiv-sanity认为你会感兴趣的文献。当然，你也可以通过设置时间来自己筛选，如去年，上个月，上周，昨天和全部，看看自己有没有错过什么文献。

5.看看大家都在看什么

最后，再介绍一下“top recent”标签。这里面展示的是arxiv-sanity上被用户收藏最多的文献。这些文献也可以按照时间来筛选。即使你不是注册用户，你也可以浏览到大家都在收藏的文献。

6.网站代码开源

在页面上方可以看到，arxiv-sanity只展示machine learning的论文，如CV，CL等ML的分支领域，因为这是arxiv-sanity作者自己的研究领域。（对，这是人家闲暇时间写的）。作者已经把arxiv-sanity开源了，所以如果你想根据自己的研究领域新建自己的arxiv-sanity，可以去GitHub自己fork。GitHub搜索 karpathy/arxiv-sanity-preserver。

各分支领域缩写翻译如下：

cs.CV：Computer Vision and Pattern Recognition 计算机视觉与模式识别；

cs.CL：Computation and Language 计算语言学；

cs.LG：Learning 机器学习（计算机科学）；

cs.AI：Artificial Intelligence 人工智能；

cs.NE：Neural and Evolutionary Computing 神经与演化计算；

stat.ML：Machine Learning 机器学习（统计学）。

好了，就是这样，赶快用起来吧。

推荐阅读

添加极市小助手微信（ID : cvmart2），备注：姓名-学校/公司-研究方向-城市（如：小极-北大-目标检测-深圳），即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群：每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~