ICDAR是一个非常成功的旗舰会议系列,是文献分析界研究人员、科学家和实践者的最大和最重要的国际会议。该会议得到了IAPR-TC 10/11的认可,成立于近30年前。第15届文件分析与识别国际会议(ICDAR 2019)由澳大利亚悉尼科技大学(UTS)主办,并在悉尼国际会议中心(ICC)举行。接受的论文由会议出版服务(CPS)出版,并提交给IEEE Xplore数字图书馆。官网链接:http://icdar2019.org/

VIP内容

主题: Graph-based Methods in Pattern Recognition and Document Image Analysis

简介: 模式识别和文档图像分析中的许多任务被公式化为图形匹配问题。尽管问题具有NP难性,但快速准确的收敛已在模式识别的广泛应用中取得了重大进展。因此,学习基于图的表示形式和相关技术是真正兴趣。在本教程中,我们将介绍用于获得不同应用程序的图形表示的许多方法。之后,我们将解释用于在图域中识别,分类,检测和许多其他任务的基于图的不同算法,方法和技术。我们将介绍最近的趋势,包括图卷积网络和图中的消息传递,重点介绍在各种模式识别问题中的应用,例如化学分子分类和网络图形表示中的检测。此外,除了这些算法在文档图像分析和识别(尤其是模式识别)领域的不同应用之外,还将提供相关经验。

嘉宾介绍: DUTTA Anjan是位于巴塞罗那计算机视觉中心的P-SPHERE项目下的Marie-Curie博士后。他于2014年获得巴塞罗那自治大学(UAB)的计算机科学博士学位。他是IJCV,IEEE TCYB,IEEE TNNLS,PR,PRL等期刊的定期审稿人,并经常担任BMVC,ICPR,ACPR和ICFHR等各种科学会议的程序委员会委员。他最近的研究兴趣围绕视觉对象的基于图形的表示和解决计算机视觉,模式识别和机器学习中各种任务的基于图形的算法。

Luqman Muhammad Muzzamil博士是文档图像分析,模式识别和计算机视觉的研究科学家。自2015年11月以来,卢克曼目前在拉罗谢尔大学(法国)的L3i实验室担任研究工程师。Luqman曾在波尔多生物信息学中心(波尔多生物信息中心)担任研究工程师,并在拉罗谢尔大学(法国)的L3i实验室担任Jean-Marc Ogier教授的博士后研究员。 Luqman拥有FrançoisRabelais的图尔大学(法国)和巴塞罗那的Autonoma大学(西班牙)的计算机科学博士学位。他的博士学位论文由Jean-Yves Ramel教授和Josep Llados教授共同指导。他的研究兴趣包括结构模式识别,文档图像分析,基于相机的文档分析和识别,图形识别,机器学习,计算机视觉,增强现实和仿生学。

成为VIP会员查看完整内容
0
23

最新内容

This paper presents our proposed methods to ICDAR 2021 Robust Reading Challenge - Integrated Circuit Text Spotting and Aesthetic Assessment (ICDAR RRC-ICTEXT 2021). For the text spotting task, we detect the characters on integrated circuit and classify them based on yolov5 detection model. We balance the lowercase and non-lowercase by using SynthText, generated data and data sampler. We adopt semi-supervised algorithm and distillation to furtherly improve the model's accuracy. For the aesthetic assessment task, we add a classification branch of 3 classes to differentiate the aesthetic classes of each character. Finally, we make model deployment to accelerate inference speed and reduce memory consumption based on NVIDIA Tensorrt. Our methods achieve 59.1 mAP on task 3.1 with 31 FPS and 306M memory (rank 1), 78.7\% F2 score on task 3.2 with 30 FPS and 306M memory (rank 1).

0
0
下载
预览

最新论文

This paper presents our proposed methods to ICDAR 2021 Robust Reading Challenge - Integrated Circuit Text Spotting and Aesthetic Assessment (ICDAR RRC-ICTEXT 2021). For the text spotting task, we detect the characters on integrated circuit and classify them based on yolov5 detection model. We balance the lowercase and non-lowercase by using SynthText, generated data and data sampler. We adopt semi-supervised algorithm and distillation to furtherly improve the model's accuracy. For the aesthetic assessment task, we add a classification branch of 3 classes to differentiate the aesthetic classes of each character. Finally, we make model deployment to accelerate inference speed and reduce memory consumption based on NVIDIA Tensorrt. Our methods achieve 59.1 mAP on task 3.1 with 31 FPS and 306M memory (rank 1), 78.7\% F2 score on task 3.2 with 30 FPS and 306M memory (rank 1).

0
0
下载
预览
Top