CNCC技术论坛 | OCR之人工智能历久弥新

2018 年 10 月 21 日 中国计算机学会
OCR是一个发展了超过半个世纪的课题,已经成为人工智能获得成功应用的典型范例。近几年,深度学习技术和互联网应用相结合,即对如手写识别等传统应用提出更高要求,又对以拍照和网图为特点的新应用提出需求,为OCR带来了新挑战和新机遇。


时间:2018年10月27日 下午 13:30 - 15:20 

地点:杭州国际博览中心会议区 会议室 403


OCR(光学字符识别)是一个发展了超过半个世纪的课题,见证并伴随着人工智能一起历经潮起潮落。已经成为人工智能获得成功应用的典型范例,也是识别技术创新的标准试验场。近几年,深度学习技术和互联网应用相结合,即对如手写识别等传统应用提出更高要求,又对以拍照和网图为特点的新应用提出需求,为OCR带来了新挑战和新机遇。如何把握当今OCR应用和技术的特点,更好解决具体问题。本技术论坛邀请五位分别来自研究所、高校和企业的OCR专家。一起从OCR的理论与技术,多个垂直领域的实践,现存的难点和未来重点等角度开展讨论,与大家一起坐谈OCR浪潮。


美团点评在本届计算机大会上与中国科学院自动化研究所刘成林老师、华南理工大学金连文老师、商汤科技旷章辉研究员共同举办“CNCC技术论坛|OCR之人工智能历久弥新”。下面让我们来提前一睹各位嘉宾的风采~ (文末有彩蛋哦~)


主席





刘成林


简介:研究员,工学博士。研究领域:模式识别、机器学习、神经网络、图像处理、文字识别、文档分析。现任中国科学院自动化研究所副所长,模式识别国家重点实验室主任,中国科学院大学人工智能学院副院长。



王栋


简介:美团外卖技术部资深总监,2009年博士毕业于清华大学人工智能实验室,研究机器学习算法及计算机视觉的中层语义表示问题。毕业后先后任职于hulu及优酷,主要从事网络视频中的搜索、推荐、广告等流量变现。多次带队或参与TRECVID/KDDCUP等国际机器算法竞赛并取得第一。2011年带领团队搭建出世界上第一个实用的视频人脸标注系统。 


特邀讲者





金连文


1991年毕业于中国科技大学无线电系获学士学位,1996年于华南理工大学获博士学位。2006入选教育部新世纪优秀人才。目前为华南理工大学二级教授,博士生导师,兼任中国图像图形学学会常务理事、中国图象图形学学会“文档图像分析与识别专委会”主任、CCF计算机视觉专委会委员、CCF人机交互专委会委员等职。发表SCI期刊论文50余篇(其中ESI高引论文4篇),主流国际会议论文100余篇,获得发明专利授权43项,作为主要成员荣获省部级科技奖励5次。


演讲题目:基于深度学习的文字识别:现状及展望


摘要:文字作为信息记录、交流与传播的最重要载体,是我们感知这个世界最重要的手段,是人工智能视觉感知的一只重要的“眼睛”。在此报告中,我将简要介绍深度学习在文字识别领域的应用情况及主要技术现状,具体介绍联机及脱机手写体文字识别、场景文字检测与识别、古籍文献OCR等方面的主要研究进展及一些典型方法,并对目前存在的主要问题、技术挑战、及未来发展趋势进行讨论。 



旷章辉


商汤高级研究员,2009-2014年就读香港大学计算机系,获博士学位。 2014年6月到2015年1月,在香港联想集团任staff researcher; 2015年2月加入商汤科技,任高级研究员,负责图像视频解析与搜索研发工作,研究兴趣包括通用物体检测与识别,自然场景文字检测与识别,商品识别等。


演讲题目:Boosting up Scene Text Detectors with Guided CNN


摘要:Deep CNNs have achieved great success in text detection. Most of existing methods attempt to improve accuracy with sophisticated network design, while paying less attention on speed. In this paper, we propose a general framework for text detection called Guided CNN to achieve the two goals simultaneously. The proposed model consists of one guidance sub-network, where a guidance mask is learned from the input image itself, and one primary text detector, where every convolution and non-linear operation are conducted only in the guidance mask. The guidance sub-network filters out non-text regions coarsely, greatly reducing the computation complexity. At the same time, the primary text detector focuses on distinguishing between text and hard non-text regions and regressing text bounding boxes, achieving a better detection accuracy. A novel training strategy, called background-aware block-wise random synthesis, is proposed to further boost up the performance. We demonstrate that the proposed Guided CNN is not only effective but also efficient with two state-of-the-art methods, CTPN and EAST, as backbones. On the challenging benchmark ICDAR 2013, it speeds up CTPN by 2.9 times on average, while improving the F-measure by 1.5%. On ICDAR 2015, it speeds up EAST by 2.0 times while improving the F-measure by 1.0%. 



张睿


现任美团外卖事业部研究员。1993年和1996年于大连理工大学获学士、硕士学位,2003年于清华大学获博士学位。专注于事图像识别、机器学习等技术方向。之前曾在百度和阿里巴巴担任资深算法工程师和高级专家,在文字和文档图像识别的多个领域从事算法研发和应用实践。


演讲题目:中文文字识别从经典机器学习到深度神经网络


摘要:介绍从上次人工智能高潮以来OCR,尤其是中文OCR的发展历程,包括了基于经典机器学习和基于深度学习的算法介绍以及他们之间的关系。并分享目前中文OCR应用于产业现状及遇到的问题和一些解决方案。

~~~~文末彩蛋~~~~


美团点评为各位参加本次 ”CNCC技术论坛|OCR之人工智能历久弥新“ 的参会者准备了超值精美礼品。那就是由美团算法团队20余位一线工程师耗时一年多编写的《美团机器学习实践》,该书是业界第一本大型互联网公司机器学习实践图书,同时也是美团技术丛书的第一本。只要参加本次技术论坛,就有机会获得礼品哦~ 


请牢记时间和地点:10月27日下午13:30 杭州国际博览中心会议区 会议室 403 

咱们不见不散~~




中国计算机学会 


微信号:ccfvoice           

长按识别二维码关注我们

CCF推荐

精品文


点击“阅读原文”报名参会


登录查看更多
5

相关内容

OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
【CCL 2019】结合规则蒸馏的情感原因发现方法
专知会员服务
22+阅读 · 2019年11月27日
【CCL 2019】刘康、韩先培:做失败科研的10个方法
专知会员服务
27+阅读 · 2019年11月12日
分布式智能计算系统前沿
中国计算机学会
19+阅读 · 2019年10月8日
CNCC技术论坛 | 知识图谱引领认知智能+
中国计算机学会
22+阅读 · 2019年9月15日
CNCC技术论坛丨新型持久内存系统与安全
中国计算机学会
7+阅读 · 2019年9月15日
CCAI 2019|视觉语音语言多模态论坛嘉宾介绍
中国人工智能学会
12+阅读 · 2019年9月3日
CNCC技术论坛 | 计算机视觉行业的挑战与契机
中国计算机学会
6+阅读 · 2018年10月21日
CNCC技术论坛 | 知识图谱赋能数字经济
中国计算机学会
4+阅读 · 2018年9月28日
CNCC技术论坛|自然语言生成:机器写作背后的技术
中国计算机学会
6+阅读 · 2018年9月19日
CNCC2017技术论坛 | 知识图谱遇见社交媒体
中国计算机学会
7+阅读 · 2017年11月8日
Arxiv
10+阅读 · 2019年2月19日
Arxiv
3+阅读 · 2017年11月12日
Arxiv
3+阅读 · 2012年11月20日
VIP会员
相关VIP内容
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
【CCL 2019】结合规则蒸馏的情感原因发现方法
专知会员服务
22+阅读 · 2019年11月27日
【CCL 2019】刘康、韩先培:做失败科研的10个方法
专知会员服务
27+阅读 · 2019年11月12日
相关资讯
分布式智能计算系统前沿
中国计算机学会
19+阅读 · 2019年10月8日
CNCC技术论坛 | 知识图谱引领认知智能+
中国计算机学会
22+阅读 · 2019年9月15日
CNCC技术论坛丨新型持久内存系统与安全
中国计算机学会
7+阅读 · 2019年9月15日
CCAI 2019|视觉语音语言多模态论坛嘉宾介绍
中国人工智能学会
12+阅读 · 2019年9月3日
CNCC技术论坛 | 计算机视觉行业的挑战与契机
中国计算机学会
6+阅读 · 2018年10月21日
CNCC技术论坛 | 知识图谱赋能数字经济
中国计算机学会
4+阅读 · 2018年9月28日
CNCC技术论坛|自然语言生成:机器写作背后的技术
中国计算机学会
6+阅读 · 2018年9月19日
CNCC2017技术论坛 | 知识图谱遇见社交媒体
中国计算机学会
7+阅读 · 2017年11月8日
相关论文
Arxiv
10+阅读 · 2019年2月19日
Arxiv
3+阅读 · 2017年11月12日
Arxiv
3+阅读 · 2012年11月20日
Top
微信扫码咨询专知VIP会员