ICDAR数据集刷榜捷报频频 商汤团队多项任务世界第一

2017 年 12 月 22 日 商汤科技 SenseTime

近日,在OCR识别领域最具权威的ICDAR数据集挑战中,商汤团队频传捷报,取得三项任务榜单第一。其中,最有影响力和难度最大的ICDAR2015数据集中,文字检测和端到端识别两项任务排名世界第一,超过了百度、三星等团队。在ICDAR2013数据集文字检测任务中,又斩获世界第一,超过腾讯、旷视、百度、微软、三星等国内外强队。



今年,商汤的算法在ICDAR数据集及MS COCO、CVPR会议相关赛事中,得以验证并刷新了多项任务的最好成绩,领先的前沿技术不仅推动了计算机视觉技术在各领域的发展,也将在更多实际场景中带来突破。


ICDAR2017 MLT数据集上文字检测任务排名第一

 

ICDAR2015 数据集文字检测任务排名第一

 

ICDAR2015 数据集文字检测识别端到端任务

word spotting标准下Strongly Contextualised排名第一


ICDAR2015 数据集文字检测识别端到端任务

word spotting标准下Generic排名第一

 

ICDAR数据集每届呈现的特点不同,难度和复杂性也逐渐提高。从ICDAR 2013起,主要针对在自然场景下的水平文字检测,随后在ICDAR2015和ICDAR2017中,数据集的难度不断增加,文字检测不仅要在自然场景下完成,字体变化如模糊、倾斜、背景干扰等也增加复杂性和识别难度,带来更大挑战。ICDAR2017又增加了多国语言的文字检测,难度进一步加深。

 

所以,由于ICDAR的难度复杂性和专业度,无可厚非成为了OCR领域最受关注的竞赛,每届ICDAR公布的数据集,吸引世界各国的深度学习、OCR领域技术强队前来刷榜、挑战。由IAPR主办的ICDAR文档分析与识别国际会议,自1991年创办以来,每两年举行一次,每届的东道国也在变化。

 

ICDAR2013 数据集上文字检测任务DetEval排名第一


ICDAR2013 数据集上文字检测任务IOU排名第一

 

基于FCN检测网络,商汤研究团队从今年3月份起开始准备,通过算法的复现,克服技术上的重重困难,一步步将遇到的问题改进、完善。利用文字检测和识别的方法,商汤团队在最后feature map上每个点预测对应的文字位置,并将文字区域对应的feature map进行识别。通过端到端训练方法,在数据集任务中对算法性能有很大的提升,减少了算法运算的时间。



随着竞赛推动力的算法更新及OCR领域的发展,商汤研究团队不仅将深度学习技术在各大赛事及数据集任务上做到更新迭代,一些实际场景中效果比较好的算法,也应用在工程和产品化落地中。目前,在ICDAR三个数据集中自然场景下的文字检测和识别,商汤科技已将领先的OCR技术与众多现实场景相结合,除卡证类、票据类的文字识别,还包括车牌检测识别、商标识别、道路标识识别、自动驾驶、短视频及图片中的文字审核等等,大大提升了产品检测识别效果和用户体验,降低了人力成本。

 

前不久,商汤科技刚刚宣布同日本著名汽车公司本田达成合作,作为全球领先的人工智能企业,商汤领先的OCR识别技术也将在自动驾驶领域带来视觉感知和安全性能的提升。商汤科技也将不断通过算法的提升,赋能更多的行业,引领人工智能视觉技术在各应用场景落地的新趋势,将精准的算法与更多先进的技术和产品相结合,让人们感受到前沿技术迭代赋予生活的诸多美好。


登录查看更多
1

相关内容

ICDAR是一个非常成功的旗舰会议系列,是文献分析界研究人员、科学家和实践者的最大和最重要的国际会议。该会议得到了IAPR-TC 10/11的认可,成立于近30年前。第15届文件分析与识别国际会议(ICDAR 2019)由澳大利亚悉尼科技大学(UTS)主办,并在悉尼国际会议中心(ICC)举行。接受的论文由会议出版服务(CPS)出版,并提交给IEEE Xplore数字图书馆。官网链接:http://icdar2019.org/
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
118+阅读 · 2020年5月6日
专知会员服务
161+阅读 · 2020年4月21日
【CVPR2020】多模态社会媒体中危机事件分类
专知会员服务
54+阅读 · 2020年4月18日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
303+阅读 · 2019年12月23日
2019 IROS—终生机器视觉数据集全球挑战赛
PaperWeekly
7+阅读 · 2019年9月6日
【紫冬快讯】夺冠!自动化所团队拔得CVPR2019 UG2+人脸识别竞赛头筹
中国科学院自动化研究所
9+阅读 · 2019年6月22日
自然场景下的文字检测:从多方向迈向任意形状
人工智能前沿讲习班
8+阅读 · 2019年6月7日
旷视COCO2018 Keypoint冠军算法详解
极市平台
5+阅读 · 2019年1月10日
ECCV 2018 | 10篇论文+5项第一,记旷视科技ECCV之旅
机器之心
5+阅读 · 2018年9月14日
腾讯数平精准推荐 | OCR技术之检测篇
机器学习研究会
13+阅读 · 2018年3月17日
自然语言推理新突破,地平线斩获三个世界第一
HorizonRobotics
6+阅读 · 2017年9月22日
Arxiv
5+阅读 · 2019年4月25日
SlowFast Networks for Video Recognition
Arxiv
4+阅读 · 2019年4月18日
Arxiv
5+阅读 · 2019年4月8日
Arxiv
4+阅读 · 2018年12月20日
Arxiv
8+阅读 · 2018年1月12日
Arxiv
3+阅读 · 2017年11月12日
VIP会员
相关资讯
2019 IROS—终生机器视觉数据集全球挑战赛
PaperWeekly
7+阅读 · 2019年9月6日
【紫冬快讯】夺冠!自动化所团队拔得CVPR2019 UG2+人脸识别竞赛头筹
中国科学院自动化研究所
9+阅读 · 2019年6月22日
自然场景下的文字检测:从多方向迈向任意形状
人工智能前沿讲习班
8+阅读 · 2019年6月7日
旷视COCO2018 Keypoint冠军算法详解
极市平台
5+阅读 · 2019年1月10日
ECCV 2018 | 10篇论文+5项第一,记旷视科技ECCV之旅
机器之心
5+阅读 · 2018年9月14日
腾讯数平精准推荐 | OCR技术之检测篇
机器学习研究会
13+阅读 · 2018年3月17日
自然语言推理新突破,地平线斩获三个世界第一
HorizonRobotics
6+阅读 · 2017年9月22日
相关论文
Arxiv
5+阅读 · 2019年4月25日
SlowFast Networks for Video Recognition
Arxiv
4+阅读 · 2019年4月18日
Arxiv
5+阅读 · 2019年4月8日
Arxiv
4+阅读 · 2018年12月20日
Arxiv
8+阅读 · 2018年1月12日
Arxiv
3+阅读 · 2017年11月12日
Top
微信扫码咨询专知VIP会员