微软亚洲研究院推荐:有什么值得推荐的计算机视觉项目?

2019 年 8 月 28 日 极市平台

加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动!

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流。关注 极市平台 公众号 ,回复 加群,立刻申请入群~


作者:微软亚洲研究院

https://www.zhihu.com/question/320330671/answer/738260594
来源:知乎,已获作者授权转载,禁止二次转载。

我们邀请了微软亚洲研究院视觉计算组资深研究员王井东博士研究员元玉慧博士为大家推荐来自微软亚洲研究院众多项目,共分为目标检测、语义和实例分割、人体姿态估计、人脸对齐、高效和轻量级卷积神经网络结构设计、行人再识别、视频目标检测、目标跟踪、最近邻搜索等领域。


目标检测


1. HRNet-Object-Detection


微软亚洲研究院视觉计算组提出的一种新型主干网络结构,可以学到高分辨率表征,提高了目标特别是小目标检测的空间精准率。支持multi-scale sync-bn 训练。



代码: 

https://github.com/HRNet/HRNet-Object-Detection
https://github.com/HRNet/HRNet-MaskRCNN-Benchmark
https://github.com/HRNet/HRNet-FCOS

论文:

https://arxiv.org/pdf/1904.04514.pdf


2. Deformable convolutional networks


微软亚洲研究院视觉计算组提出的具备建模几何形变的卷积神经网络。



代码:

https://github.com/msracver/Deformable-ConvNets

论文:

https://arxiv.org/abs/1703.06211
https://arxiv.org/abs/1811.11168


3. Relation networks

微软亚洲研究院视觉计算组提出的利用物体之间的关联来提高物体检测器的性能。



代码:

https://github.com/msracver/Relation-Networks-for-Object-Detection

论文:

https://arxiv.org/pdf/1711.11575.pdf


语义和实例分割


1. HRNet-Semantic-Segmentation


微软亚洲研究院视觉计算组提出的一种新型主干网络结构,可以学到高分辨率表征,有效的提高了语义分割的性能。



代码: 

https://github.com/HRNet/HRNet-Semantic-Segmentation
https://github.com/HRNet/HRNet-MaskRCNN-Benchmark

论文:

https://arxiv.org/pdf/1904.04514.pdf


2. Fully convolutional instance-aware semantic segmentation


微软亚洲研究院视觉计算组提出的端到端的实例分割的系统,整体设计是基于全卷积网络,在COCO2016比赛中获得了冠军。



代码:

https://github.com/msracver/FCIS

论文:

https://arxiv.org/pdf/1611.07709.pdf


人体姿态估计


1. HRNet-Human-Pose-Estimation


微软亚洲研究院视觉计算组提出的一种新型主干网络结构,可以学到高分辨率表征,有效的提高了人体关键点热图空间的精准度。



代码:

https://github.com/leoxiaobin/deep-high-resolution-net.pytorch

论文:

https://arxiv.org/pdf/1902.09212.pdf


2. SimplePose


微软亚洲研究院视觉计算组提出的一种用于检测人体的关键点任务的网络结构,简单有效。



代码:

https://github.com/Microsoft/human-pose-estimation.pytorch

论文:

https://arxiv.org/abs/1804.06208


3. Integral human pose regression


微软亚洲研究院视觉计算组提出了一种积分操作来处理3D人体姿态估计任务中的后处理/量化不可求导的问题。



代码:

https://github.com/JimmySuen/integral-human-pose

论文:

https://arxiv.org/abs/1711.08229


人脸对齐


1. HRNet-Facial-Landmark-Detection


微软亚洲研究院视觉计算组提出的一种新型主干网络结构,可以学到高分辨率表征,有效的提高了人脸关键点检测的性能。



代码:

https://github.com/HRNet/HRNet-Facial-Landmark-Detection

论文:

https://arxiv.org/pdf/1904.04514.pdf


高效和轻量级卷积神经网络结构设计


1. HRNet-Classification


微软亚洲研究院视觉计算组提出的一种新型主干网络结构,可以学到多分辨率表征,然后组合多分辨率表征来做图像识别。



代码:

https://github.com/HRNet/HRNet-Image-Classification

论文:

https://arxiv.org/pdf/1904.04514.pdf


2. Interleaved group convolutions


微软亚洲研究院视觉计算组提出的一种轻量级的网络结构,在分类检测等任务上都取得了比谷歌的MobileNetv2更好的结果。



代码:

https://github.com/homles11/IGCV3

论文:

https://arxiv.org/pdf/1707.02725.pdf
https://arxiv.org/pdf/1804.06202.pdf
https://arxiv.org/pdf/1806.00178.pdf


行人再识别


1. Deeply-learned part-aligned representations


微软亚洲研究院视觉计算组提出的利用人体部位信息来提取行人表征。



代码:

https://github.com/zlmzju/part_reid

论文:

http://openaccess.thecvf.com/content_ICCV_2017/papers/Zhao_Deeply-Learned_Part-Aligned_Representations_ICCV_2017_paper.pdf


2. Part-aligned bilinear representations


微软亚洲研究院视觉计算组提出一种利用双线性池化来组合人体姿态以提取行人表征。



代码:

https://github.com/yuminsuh/part_bilinear_reid

论文:

http://openaccess.thecvf.com/content_ECCV_2018/papers/Yumin_Suh_Part-Aligned_Bilinear_Representations_ECCV_2018_paper.pdf


视频目标检测


1. Deep feature low


微软亚洲研究院视觉计算组提出的视频理解的网络结构,通过利用视频之间的光流信息来传递相邻帧之间的预测。



代码:

https://github.com/msracver/Deep-Feature-Flow

论文:

https://arxiv.org/abs/1611.07715


2. Flow-guided feature aggregation


微软亚洲研究院视觉计算组提出的解决视频中物体检测问题的框架,利用光流在帮助组合相邻帧的表征。



代码:

https://github.com/msracver/Flow-Guided-Feature-Aggregation

论文:

https://arxiv.org/pdf/1703.10025.pdf


目标跟踪


1. Deeper and wider Siamese networks


微软亚洲研究院多媒体搜索和挖掘组提出的更深更宽的孪生网络来解决目标跟踪问题。



代码:

https://github.com/researchmm/SiamDW

论文:

https://arxiv.org/abs/1901.01660


最近邻搜索


1. SPTAG


微软亚洲研究院系统组与微软必应组共同推出的一个可以处理上亿数据的索引建立以及搜索系统,已经用在微软必应产品里。



代码:

https://github.com/Microsoft/SPTAG

论文:

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.862.7975&rep=rep1&type=pdf
http://pages.ucsd.edu/~ztu/publication/cvpr12_knnG.pdf, 

https://ieeexplore.ieee.org/iel7/34/4359286/06549106.pdf


2. Composite quantization


微软亚洲研究院视觉计算组提出的一种高效的紧致编码(哈希)算法。



代码:

https://github.com/hellozting/CompositeQuantization

论文:

http://proceedings.mlr.press/v32/zhangd14.pdf




-完-



*延伸阅读




添加极市小助手微信(ID : cv-mart),备注:研究方向-姓名-学校/公司-城市(如:目标检测-小极-北大-深圳),即可申请加入目标检测、目标跟踪、人脸、工业检测、医学影像、三维&SLAM、图像分割等极市技术交流群,更有每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流一起来让思想之光照的更远吧~


△长按添加极市小助手


△长按关注极市平台


觉得有用麻烦给个在看啦~  

登录查看更多
0

相关内容

专知会员服务
160+阅读 · 2020年4月21日
专知会员服务
109+阅读 · 2020年3月12日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程
专知会员服务
82+阅读 · 2019年12月11日
可解释推荐:综述与新视角
专知会员服务
111+阅读 · 2019年10月13日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
CVPR2019年热门论文及开源代码分享
深度学习与NLP
7+阅读 · 2019年6月3日
计算机视觉知识点总结
极市平台
18+阅读 · 2019年4月16日
CVPR 2019 论文开源项目合集
专知
18+阅读 · 2019年4月7日
本周精选共读论文《计算机视觉图像分割》六篇
人工智能前沿讲习班
10+阅读 · 2019年4月1日
计算机视觉方向优秀公众号推荐
计算机视觉life
8+阅读 · 2018年12月14日
推荐 | 机器学习开源项目 Top 10
AI100
3+阅读 · 2018年3月21日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
Arxiv
4+阅读 · 2018年9月25日
Arxiv
5+阅读 · 2018年3月6日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
4+阅读 · 2017年11月14日
VIP会员
相关VIP内容
专知会员服务
160+阅读 · 2020年4月21日
专知会员服务
109+阅读 · 2020年3月12日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程
专知会员服务
82+阅读 · 2019年12月11日
可解释推荐:综述与新视角
专知会员服务
111+阅读 · 2019年10月13日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
相关资讯
CVPR2019年热门论文及开源代码分享
深度学习与NLP
7+阅读 · 2019年6月3日
计算机视觉知识点总结
极市平台
18+阅读 · 2019年4月16日
CVPR 2019 论文开源项目合集
专知
18+阅读 · 2019年4月7日
本周精选共读论文《计算机视觉图像分割》六篇
人工智能前沿讲习班
10+阅读 · 2019年4月1日
计算机视觉方向优秀公众号推荐
计算机视觉life
8+阅读 · 2018年12月14日
推荐 | 机器学习开源项目 Top 10
AI100
3+阅读 · 2018年3月21日
相关论文
Top
微信扫码咨询专知VIP会员