如何学会看 arxiv.org 才能不错过自己研究领域的最新论文?

2020 年 8 月 19 日 极市平台
↑ 点击 蓝字  关注极市平台

来源丨有三AI

极市导读

 

使用arxiv-sanity,能够很方便地对arxiv.org资源库中的论文进行预览和检索。同时,它还开放了个人图书馆,帮助提高工作效率。>>>极市七夕粉丝福利活动:炼丹师们,七夕这道算法题,你会解吗?


1 什么是arxiv-sanity


我们都知道arxiv.org是一个非常大的预印本资源库,里面有大量的最新的论文,但缺点是浏览、搜索和排序不是很方便。这个库每天会更新大量的论文,如果只是通过手动搜索和浏览效率就太低了。
这样特别容易让人和一些优秀的有趣儿的论文擦肩而过,这些论文可能是和你的研究领域相关的。所以接下来你可能就能猜到这个arxiv-sanity是干什么用的了。

网址为: http://www.arxiv-sanity.com/

2 arxiv-sanity的基本功能


1、便捷的预览

首先,arxiv-sanity在展示最新更新的文献时,提供了可读性更强的缩略图预览模式方便读者来快速预览,并在缩略图下方的绿色区域显示文献的abstract 。

2.感兴趣相关度排序

更重要的是,它可以让你根据自己的阅读兴趣对文献进行重新排序。比如这里有一篇关于对人体姿态估计的文献是你感兴趣的,点击右上角的' rank by tf-idf similarity to this',文献列表会按照与这篇文章的相关度进行排序,接下来我们会看到arxiv上所有关于人体姿态识别的论文。这个功能是基于TF-DF算法来实现的,效果很好。(一种文档特征提取法,它是由Salton在1988 年提出。其中TF称为词频,  IDF称为反文档频率, 感兴趣的可以自己百度。)

3.个人图书馆

如果你是注册用户,在登录账户之后,还可以把自己感兴趣的文献收藏到你的个人图书馆。比如,我喜欢上图的这篇人体姿态估计的文献,点击右上角存盘图标,(看到了吗?就在' rank by tf-idf similarity to this'下面),点击之后就把这篇文献存在我自己的library里面了。
这时,刚刚黑色的图标变成了蓝色,点击上面的library标签,可以看到它出现在了最上方。你可以像这样收藏很多自己感兴趣的文献。想删除的时候,在自己的library里面再次点击那个图标就可以删除了。

4.感兴趣推荐系统

另外,library不光是用来收藏和跟进自己领域的论文更新进度,arxiv-sanity可以通过你收藏的内容给你推荐你也许会感兴趣的论文。具体怎么实现的呢?library内部的论文会被标记为positive,Library之外的论文标记为negative,然后arxiv-sanity基于bigram文本特征提取来训练你的personal SVM,然后在reconmmended 标签里推荐给你。点击recommended标签你就可以看到最近两周arxiv-sanity认为你会感兴趣的文献。当然,你也可以通过设置时间来自己筛选,如去年,上个月,上周,昨天和全部,看看自己有没有错过什么文献。
 
5.看看大家都在看什么

最后,再介绍一下“top recent”标签。这里面展示的是arxiv-sanity上被用户收藏最多的文献。这些文献也可以按照时间来筛选。即使你不是注册用户,你也可以浏览到大家都在收藏的文献。

6.网站代码开源

在页面上方可以看到,arxiv-sanity只展示machine learning的论文,如CV,CL等ML的分支领域,因为这是arxiv-sanity作者自己的研究领域。(对,这是人家闲暇时间写的)。作者已经把arxiv-sanity开源了,所以如果你想根据自己的研究领域新建自己的arxiv-sanity,可以去GitHub自己fork。GitHub搜索 karpathy/arxiv-sanity-preserver。

各分支领域缩写翻译如下:
cs.CV:Computer Vision and Pattern Recognition 计算机视觉与模式识别;
cs.CL:Computation and Language 计算语言学;
cs.LG:Learning 机器学习(计算机科学);
cs.AI:Artificial Intelligence 人工智能;
cs.NE:Neural and Evolutionary Computing 神经与演化计算;
stat.ML:Machine Learning 机器学习(统计学)。

好了,就是这样,赶快用起来吧。


推荐阅读



添加极市小助手微信(ID : cvmart2),备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳),即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群:每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~

△长按添加极市小助手

△长按关注极市平台,获取 最新CV干货

觉得有用麻烦给个在看啦~   
登录查看更多
0

相关内容

arXiv(X依希腊文的χ发音,读音如英语的archive)是一个收集物理学、数学、计算机科学与生物学的论文预印本的网站,始于1991年8月14日。截至2008年10月,arXiv.org已收集超过50万篇预印本;至2014年底,藏量达到1百万篇。在2014年时,约以每月8000篇的速度增加。
专知会员服务
45+阅读 · 2020年10月5日
专知会员服务
146+阅读 · 2020年6月15日
【综述】金融领域中的深度学习,附52页论文下载
专知会员服务
163+阅读 · 2020年2月27日
专知会员服务
87+阅读 · 2020年1月20日
【论文】欺骗学习(Learning by Cheating)
专知会员服务
26+阅读 · 2020年1月3日
周志华教授:如何做研究与写论文?
专知会员服务
154+阅读 · 2019年10月9日
在计算机视觉方向如何快速提升自己?
计算机视觉life
8+阅读 · 2019年9月6日
新技能 | 如何快速获取视觉前沿技术动态?
计算机视觉life
3+阅读 · 2019年5月22日
《自然》(20190221出版)一周论文导读
科学网
6+阅读 · 2019年2月23日
BMC新举措,审稿过程更清晰,投稿更放心
科研圈
27+阅读 · 2018年10月24日
阅读深度学习论文的新姿势
计算机视觉life
16+阅读 · 2018年7月22日
决策树
Datartisan数据工匠
4+阅读 · 2018年4月19日
如何用人工智能帮你找论文?
AI100
10+阅读 · 2018年2月21日
16篇论文入门manipulation研究
机器人学家
15+阅读 · 2017年6月6日
Adversarial Mutual Information for Text Generation
Arxiv
13+阅读 · 2020年6月30日
Conditional BERT Contextual Augmentation
Arxiv
8+阅读 · 2018年12月17日
Arxiv
3+阅读 · 2018年10月18日
Arxiv
13+阅读 · 2018年4月6日
VIP会员
相关VIP内容
专知会员服务
45+阅读 · 2020年10月5日
专知会员服务
146+阅读 · 2020年6月15日
【综述】金融领域中的深度学习,附52页论文下载
专知会员服务
163+阅读 · 2020年2月27日
专知会员服务
87+阅读 · 2020年1月20日
【论文】欺骗学习(Learning by Cheating)
专知会员服务
26+阅读 · 2020年1月3日
周志华教授:如何做研究与写论文?
专知会员服务
154+阅读 · 2019年10月9日
相关资讯
在计算机视觉方向如何快速提升自己?
计算机视觉life
8+阅读 · 2019年9月6日
新技能 | 如何快速获取视觉前沿技术动态?
计算机视觉life
3+阅读 · 2019年5月22日
《自然》(20190221出版)一周论文导读
科学网
6+阅读 · 2019年2月23日
BMC新举措,审稿过程更清晰,投稿更放心
科研圈
27+阅读 · 2018年10月24日
阅读深度学习论文的新姿势
计算机视觉life
16+阅读 · 2018年7月22日
决策树
Datartisan数据工匠
4+阅读 · 2018年4月19日
如何用人工智能帮你找论文?
AI100
10+阅读 · 2018年2月21日
16篇论文入门manipulation研究
机器人学家
15+阅读 · 2017年6月6日
Top
微信扫码咨询专知VIP会员