ICPR 2022 | 多模态字幕识别竞赛正式启动!

2022 年 3 月 12 日 CVer

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

ICPR 2022 Challenge: Multimodal Subtitle Recognition


参赛通知


视频通过视觉和音频等传递丰富的信息。视频理解一直是学术界和工业界的热门研究课题。


融合多模态信息也是一个具有挑战性和有意义的研究课题。在本次竞赛当中,我们专注于从视频中提取字幕。字幕是文字来源于访谈节目或电视剧等类的视频。字幕是视频数据中最重要的文本信息之一,因为字幕包含人们交谈内容的信息。字幕识别广泛用于推荐、检索和视频理解系统。为了更好的促进字幕识别的发展,我们在ICPR 2022上举办多模态字幕识别竞赛,欢迎大家报名参赛。


一、比赛时间


1. 注册报名:2022.03.07

2. 训练集公布:2022.03.12

3. 开发阶段:2022.03.12 – 2022.04.22

4. 评测阶段:2022.04.22 – 2022.05.07

5. 验证集公布:2022.04.22

6. 结果提交截止:2022.05.07

7. 方法描述截止:2022.05.12

8. 评测结果公布:2022.05.13


二、注册和提交方式


本次比赛的注册和提交CodaLab网站上开展,具体提交细节请参考竞赛网站(icprmsr.github.io)。


三、比赛内容


本次比赛分为三个赛道分别为:


1.使用音频模态标注的字幕信息在视觉模态中提取字幕

在这个任务中,只有音频提供的字幕信息。参赛者需设计一个字幕识别的OCR模型。参赛者可以使用自知业界开源开放数据集对OCR模型进行预训练,然后通过音频模态提供的字幕信息微调模型。提交的结果将在视觉模态的测试集上使用CER指标的结果进行排名。


2.使用视觉模态标注的字幕信息在音频模态中提取字幕

在这个任务中,只有视觉模态提供的字幕信息。参赛者需设计一个字幕识别的ASR模型。与任务一相同,参赛者可以使用指定开放数据集对ASR模型进行预训练,然后通过视觉模态提供的字幕信息微调模型。提交的结果将在音频模态的测试集上使用CER指标的结果进行排名。


3.使用视觉模态和音频模态标注的字幕信息提取视频中的字幕

在这个任务中,我们将提供音频模态和视觉模态标注的字幕信息。参赛者需利用这个两个模态的字幕信息设计一个字幕识别的模型。与任务一,二相同,参赛允许使用公开数据集进行预训练,然后对模型进行微调。提交结果将在同时具备视觉和音频模态的测试集上使用CER指标的结果进行排名。


四、组织方


主办方:腾讯科技有限公司、华南理工大学、香港中文大学

数据支持方:数据堂


五、联系方式


比赛网站:https://icprmsr.github.io/

联系邮箱:lattehuang@tecent.com


竞赛交流群:

 

登录查看更多
0

相关内容

International Conference on Pattern Recognition是IAPR的旗舰会议、国际模式识别协会和模式识别领域的首场会议,包括计算机视觉、图像、声音、语音、传感器模式处理和机器智能。ICPR2020是这一系列的第25个项目,从开始到现在已经50岁了。ICPR 2020将是一个为期6天的活动,包括研讨会、辅导、主要会议、研究成果展示、科学竞赛和展览。它将汇集世界范围内该领域的顶尖研究人员,并为与会者提供互动和培养新思想和合作的机会。官网链接:https://www.micc.unifi.it/icpr2020/
中科院自动化所徐波团队最新《视觉-语言预训练》综述
专知会员服务
66+阅读 · 2022年2月23日
[ICCV2021]自适应多模态选取框架用于视频理解
专知会员服务
17+阅读 · 2021年10月30日
专知会员服务
65+阅读 · 2021年10月15日
专知会员服务
18+阅读 · 2021年9月23日
【CVPR2020】多模态社会媒体中危机事件分类
专知会员服务
54+阅读 · 2020年4月18日
史上最大多模态图文数据集发布!
夕小瑶的卖萌屋
2+阅读 · 2021年11月3日
2020语言与智能技术竞赛-事件抽取方案整理(第一波
深度学习自然语言处理
20+阅读 · 2020年7月12日
竞赛方案|VideoNet视频内容识别挑战赛
极市平台
14+阅读 · 2019年9月8日
字节跳动 2019 ICME 双赛道冠军团队方案分享
PaperWeekly
50+阅读 · 2019年8月12日
2019语言与智能技术竞赛报名开启
中国计算机学会
16+阅读 · 2019年2月26日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月17日
Arxiv
1+阅读 · 2022年4月15日
Challenges for Open-domain Targeted Sentiment Analysis
How to Fine-Tune BERT for Text Classification?
Arxiv
13+阅读 · 2019年5月14日
VIP会员
相关资讯
史上最大多模态图文数据集发布!
夕小瑶的卖萌屋
2+阅读 · 2021年11月3日
2020语言与智能技术竞赛-事件抽取方案整理(第一波
深度学习自然语言处理
20+阅读 · 2020年7月12日
竞赛方案|VideoNet视频内容识别挑战赛
极市平台
14+阅读 · 2019年9月8日
字节跳动 2019 ICME 双赛道冠军团队方案分享
PaperWeekly
50+阅读 · 2019年8月12日
2019语言与智能技术竞赛报名开启
中国计算机学会
16+阅读 · 2019年2月26日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员