CNCC2018 | OCR之人工智能历久弥新技术论坛在杭州举行

2018 年 11 月 7 日 中国计算机学会
各位来自研究所、高校和企业的OCR专家,分别从OCR的理论与技术,多个垂直领域的实践,现存的难点和未来重点等角度开展讨论,一起与同学们坐谈OCR浪潮。


2018中国计算机大会(CNCC2018)于10月25~27日在杭州国际博览中心举办,这是由中国计算机学会(CCF)主办的国内最大规模的业界学术盛会,邀请了近400位国内外计算机领域知名专家、企业家到会演讲,有来自近1000家企事业单位的7000多名专业人士参会参展。



美团点评在本届大会上与中国科学院自动化研究所联合举办了“OCR之人工智能历久弥新”技术论坛,深入探讨了人工智能的重要应用领域——OCR(Optical Character Recognition,光学字符识别)的最新进展。这次论坛也是美团点评科协今年的重要活动之一。


中国科学院自动化研究所副所长、模式识别国家重点实验室主任、中国科学院大学人工智能学院副院长刘成林担任论坛主席,美团点评外卖技术部资深总监王栋博士担任共同主席。本次论坛同时邀请到了华南理工大学教授、中国图像图形学学会常务理事金连文,商汤高级研究员旷章辉博士,以及美团外卖事业部研究员张睿博士。各位来自研究所、高校和企业的OCR专家,分别从OCR的理论与技术,多个垂直领域的实践,现存的难点和未来重点等角度开展讨论,一起与同学们坐谈OCR浪潮。


论坛的时间安排在了10月27日最后一天的下午,但现场依旧坐无虚席。


中科院自动化所 刘成林

美团点评 王栋博士


论坛由中科院自动化所刘成林和美团点评王栋博士共同主持。刘成林做了开场,首先阐释了论坛题目的立意,OCR技术的发展史就是人工智能发展历程的缩影和写照。


在半个多世纪的发展中,伴随着AI技术的不断进步,OCR领域也涌现出了大量的高效算法。近几年随着深度学习的发展,文字识别技术也有了很大的突破性进展。但文字识别领域还有大量的问题有待解决,应用方面也有很大的拓展空间。王栋博士主持了整个演讲过程,对每位演讲者的内容做出了精准的高度概括,承上启下。


华南理工大学 金连文


华南理工大学的金连文带来了题目为《基于深度学习的文字识别:技术现状及发展趋势》的学术报告。报告介绍了深度学习在文字识别领域的应用情况和主要技术现状,包括联机及脱机手写体文字识别、场景文字检测与识别、古籍文献OCR等方面的主要研究进展及一些典型方法。报告围绕文字识别领域的最新科研进展、数据集信息做了全面的总结,并针对目前存在的主要问题、技术挑战、及未来发展趋势进行讨论。金连文也提出了文字识别领域目前面临的众多挑战:中文及多语言场景文字识别性能仍有待提升,金融票据的识别,教育文档的识别,古籍文档图像识别,以及医疗病例的手写识别与理解。 最后,他为大家展示了自主研发的无约束联机手写识别、自然场景图像文字OCR和手写文档OCR的实时Demo演示。Demo中演示的效果令现场观众赞叹不已。


商汤科技 旷章辉


来自商汤科技的高级研究员旷章辉博士做了题目为《Boosting up Scene Text Detectors with Guided CNN》的学术报告。报告具体分享了最近研发的一种高效文字检测方法,现有的场景文字检测往往都要扫描整张图片来检测文字,但文字区域实际上仅仅占了图片的极小部分区域。为了提高文字检测效率,报告中提出的名为“Guided CNN”的文字检测算法,将图片分割为文字区域和非文字区域,针对文字区域进行高效的文字检测。这种方法确保了文字检测精度的同时,也大幅度提高了文字检测的速度。这篇报告的工作于2018年9月发表在英国机器视觉大会(BMVC,British Machine Vision Conference)上。


美团点评 张睿


最后一位是来自美团点评外卖事业部张睿博士,带来了题目为《中文文字识别:从经典机器学习到深度神经网络》的学术报告。报告介绍了从上次人工智能高潮以来OCR的发展历程,尤其提到了中文OCR中经典机器学习算法和深度学习算法之间的关系,这也是张睿首次在学术界公开这个观点。报告同时结合美团外卖在实际业务中遇到的应用和场景,分享了中文OCR在互联网产业应用,遇到的问题和解决方案,包括在低质量环境下证照识别的解决方案,中文街景招牌复杂排版的解决方案等。张睿最后也抛出了来自工业界的三点思考与各位同学共勉:一、要具有工匠精神,做实应用场景;二、公开数据集是连接工业界与产业界的桥梁,自然场景的数据集需要按场景细分;三、专用AI的效果明显优于通用AI,如何快速实现专用定制是企业面临的挑战。


美团点评技术学院还为本次论坛设置了一个小惊喜,论坛临近结束时在现场随机抽取了3位幸运同学,赠与《美团机器学习实践》算法书。本书由美团算法团队20余位一线工程师耗时一年多编写,是业界第一本大型互联网公司机器学习实践图书,同时也是美团技术丛书的第一本~


最后,以刘成林的精彩点评来结束本文:OCR是一个发展超过半个世纪的课题,见证并伴随着人工智能一起经历潮起潮落,已经成为人工智能获得成功应用的典范案例,也是识别技术创新的标准试验场。深度学习带来的技术突破和互联网应用的大批量涌现,对手写识别、场景文字识别等新应用提出了新的需求,也为OCR带来了新挑战和新机遇。刘成林希望所有从事OCR研究的同仁们,在科研和应用的道路上不断探索、推陈出新、理论与实践相结合,在文字识别领域做出丰硕的成果。


中国计算机学会 


微信号:ccfvoice           

长按识别二维码关注我们

CCF推荐


精品文


点击“阅读原文”加入CCF。



登录查看更多
1

相关内容

OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
2019年人工智能行业现状与发展趋势报告,52页ppt
专知会员服务
121+阅读 · 2019年10月10日
CNCC技术论坛 | 知识图谱引领认知智能+
中国计算机学会
22+阅读 · 2019年9月15日
CNCC技术论坛 | 计算机视觉行业的挑战与契机
中国计算机学会
6+阅读 · 2018年10月21日
CNCC技术论坛 | 知识图谱赋能数字经济
中国计算机学会
4+阅读 · 2018年9月28日
CNCC技术论坛|自然语言生成:机器写作背后的技术
中国计算机学会
6+阅读 · 2018年9月19日
OCR技术浅析
机器学习研究会
40+阅读 · 2017年12月8日
CNCC2017技术论坛 | 知识图谱遇见社交媒体
中国计算机学会
7+阅读 · 2017年11月8日
2017人工智能创新公司50强出炉 旷视(Face++)上榜
Megvii旷视科技
3+阅读 · 2017年7月10日
Arxiv
31+阅读 · 2018年11月13日
Arxiv
29+阅读 · 2018年4月6日
Arxiv
5+阅读 · 2018年3月30日
VIP会员
相关VIP内容
2019年人工智能行业现状与发展趋势报告,52页ppt
专知会员服务
121+阅读 · 2019年10月10日
相关资讯
CNCC技术论坛 | 知识图谱引领认知智能+
中国计算机学会
22+阅读 · 2019年9月15日
CNCC技术论坛 | 计算机视觉行业的挑战与契机
中国计算机学会
6+阅读 · 2018年10月21日
CNCC技术论坛 | 知识图谱赋能数字经济
中国计算机学会
4+阅读 · 2018年9月28日
CNCC技术论坛|自然语言生成:机器写作背后的技术
中国计算机学会
6+阅读 · 2018年9月19日
OCR技术浅析
机器学习研究会
40+阅读 · 2017年12月8日
CNCC2017技术论坛 | 知识图谱遇见社交媒体
中国计算机学会
7+阅读 · 2017年11月8日
2017人工智能创新公司50强出炉 旷视(Face++)上榜
Megvii旷视科技
3+阅读 · 2017年7月10日
Top
微信扫码咨询专知VIP会员