动态 | 美团将主办 ICDAR2019「中文门脸招牌文字识别」比赛,并公开首个真实场景招牌图像数据集

2019 年 3 月 1 日 AI科技评论

AI 科技评论按:国际文档分析与识别国际会议(International Conference on Document Analysis and Recognition,ICDAR)是由国际模式识别学会(IAPR)组织的专业会议之一,其专注于文本领域的识别与应用,目前已经是全球文档图像分析识别领域公认的权威学术会议。该会议每两年举办一次,今年的 ICDAR 2019 将于 9 月 20-25 日在澳大利亚悉尼举办。

ICDAR 的一大重头戏便是「鲁棒文本阅读竞赛」(Robust Reading Competitions),该比赛于 2003 年设立,致力于提高自然场景的文本检测和识别水平,至今已有来自 89 个国家的 3500 多支队伍参与。

今年的 ICDAR 2019 上,美团将联合国内外知名科研机构和学者主办「中文门脸招牌文字识别」比赛(ICDAR 2019 Robust Reading Challenge on Reading Chinese Text on Signboards)。据悉,美团将挑选出非常能代表中文特点的餐饮商家的门脸招牌图片来组织竞赛,这些招牌上的文字存在中文特有的设计和排版,同时也兼有自然场景文字识别中普遍存在的拍照角度、光照变化等干扰因素。值得一提的是,本次比赛所使用的数据集,便是美团即将公开的业界首个真实场景招牌图像数据集。

比赛的具体信息如下:

组织者

  • 美团:王栋、张睿、刘曦、周永生

  • 华中科技大学:白翔、廖明辉、杨明锟

  • Microsoft (Redmond,USA):Baoguang Shi

  • Nanyang Technological University (Singapore):Shijian Lu

  • Computer Vision Centre,UAB(Spain):Dimosthenis Karatzas

  • IIIT Hyderabad(India):C. V. Jawahar

数据集介绍

美团本次公开的数据,由遍布全国的市场人员所拍摄的众多门脸招牌图片组成,共 25000 张。每张图片是由完全独立的不同个人、采用不同设备、在不同地点和不同时间和不同环境下所拍摄的不同商家的门脸招牌图片。该数据集以中文文字为主,也包含一定数量的英文和数字:英文和数字的占比介于 10% 和 30% 之间。标注内容比较完备,每张图片均标注了单个字符的位置和文本,以及各字符串的位置和文本,是难得的用于研发和评估中文识别技术的数据集。这 25000 张图片中,20000 张图片将用于训练,2000 张将用于验证,3000 张将用于测试。

数据集示例

比赛内容

本次门脸招牌识别,共定义了 4 个任务,分别如下:

  • TASK 1:招牌端到端文字识别

  • TASK 2:招牌文字行定位

  • TASK 3:招牌区域内单字识别

  • TASK 4:招牌区域内字符串识别

奖励方式

  • 颁发奖状:按照最终成绩进行排名,以从高至低顺序依次选取前三名,颁发奖状。

  • 比赛奖金:从高至低顺序选取前三名参赛方为学校及科研院所等非盈利机构。

奖金具体设置如下:

重要日期

  • 2019 年 3 月 1 日:报名通道开放

  • 2019 年 3 月 18 日:训练数据集开放

  • 2019 年 4 月 15 日:测试数据集分批开放

  • 2019 年 4 月 16 日:提交通道开放

  • 2019 年 4 月 30 日:提交截止日期

  • 2019 年 5 月 10 日:比赛最终报告提交

  • 2019 年 9 月 20 日:ICDAR 2019 大会召开

参赛报名

报名链接地址: http://rrc.cvc.uab.es/?ch=12

报名链接二维码: 

感兴趣的小伙伴们可以通过以上两种方式报名参加比赛,一起瓜分 15000 美金!

信息来源:美团

点击阅读原文查看 深度学习在美团点评的应用

登录查看更多
5

相关内容

ICDAR是一个非常成功的旗舰会议系列,是文献分析界研究人员、科学家和实践者的最大和最重要的国际会议。该会议得到了IAPR-TC 10/11的认可,成立于近30年前。第15届文件分析与识别国际会议(ICDAR 2019)由澳大利亚悉尼科技大学(UTS)主办,并在悉尼国际会议中心(ICC)举行。接受的论文由会议出版服务(CPS)出版,并提交给IEEE Xplore数字图书馆。官网链接:http://icdar2019.org/
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【紫冬快讯】夺冠!自动化所团队拔得CVPR2019 UG2+人脸识别竞赛头筹
中国科学院自动化研究所
9+阅读 · 2019年6月22日
【紫冬分享】自动化所团队获PRCV2018 美图短视频实时分类挑战赛冠军
中国科学院自动化研究所
10+阅读 · 2018年11月30日
文本识别 OCR 浅析:特征篇
开源中国
16+阅读 · 2018年1月6日
OCR技术浅析
机器学习研究会
40+阅读 · 2017年12月8日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
Arxiv
7+阅读 · 2017年12月28日
Arxiv
3+阅读 · 2017年11月12日
VIP会员
相关VIP内容
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
69+阅读 · 2020年6月10日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
Top
微信扫码咨询专知VIP会员