2018中国计算机大会(CNCC2018)于10月25~27日在杭州国际博览中心举办,这是由中国计算机学会(CCF)主办的国内最大规模的业界学术盛会,邀请了近400位国内外计算机领域知名专家、企业家到会演讲,有来自近1000家企事业单位的7000多名专业人士参会参展。
美团点评在本届大会上与中国科学院自动化研究所联合举办了“OCR之人工智能历久弥新”技术论坛,深入探讨了人工智能的重要应用领域——OCR(Optical Character Recognition,光学字符识别)的最新进展。这次论坛也是美团点评科协今年的重要活动之一。
中国科学院自动化研究所副所长、模式识别国家重点实验室主任、中国科学院大学人工智能学院副院长刘成林担任论坛主席,美团点评外卖技术部资深总监王栋博士担任共同主席。本次论坛同时邀请到了华南理工大学教授、中国图像图形学学会常务理事金连文,商汤高级研究员旷章辉博士,以及美团外卖事业部研究员张睿博士。各位来自研究所、高校和企业的OCR专家,分别从OCR的理论与技术,多个垂直领域的实践,现存的难点和未来重点等角度开展讨论,一起与同学们坐谈OCR浪潮。
论坛的时间安排在了10月27日最后一天的下午,但现场依旧坐无虚席。
中科院自动化所 刘成林
美团点评 王栋博士
论坛由中科院自动化所刘成林和美团点评王栋博士共同主持。刘成林做了开场,首先阐释了论坛题目的立意,OCR技术的发展史就是人工智能发展历程的缩影和写照。
在半个多世纪的发展中,伴随着AI技术的不断进步,OCR领域也涌现出了大量的高效算法。近几年随着深度学习的发展,文字识别技术也有了很大的突破性进展。但文字识别领域还有大量的问题有待解决,应用方面也有很大的拓展空间。王栋博士主持了整个演讲过程,对每位演讲者的内容做出了精准的高度概括,承上启下。
华南理工大学 金连文
华南理工大学的金连文带来了题目为《基于深度学习的文字识别:技术现状及发展趋势》的学术报告。报告介绍了深度学习在文字识别领域的应用情况和主要技术现状,包括联机及脱机手写体文字识别、场景文字检测与识别、古籍文献OCR等方面的主要研究进展及一些典型方法。报告围绕文字识别领域的最新科研进展、数据集信息做了全面的总结,并针对目前存在的主要问题、技术挑战、及未来发展趋势进行讨论。金连文也提出了文字识别领域目前面临的众多挑战:中文及多语言场景文字识别性能仍有待提升,金融票据的识别,教育文档的识别,古籍文档图像识别,以及医疗病例的手写识别与理解。 最后,他为大家展示了自主研发的无约束联机手写识别、自然场景图像文字OCR和手写文档OCR的实时Demo演示。Demo中演示的效果令现场观众赞叹不已。
商汤科技 旷章辉
来自商汤科技的高级研究员旷章辉博士做了题目为《Boosting up Scene Text Detectors with Guided CNN》的学术报告。报告具体分享了最近研发的一种高效文字检测方法,现有的场景文字检测往往都要扫描整张图片来检测文字,但文字区域实际上仅仅占了图片的极小部分区域。为了提高文字检测效率,报告中提出的名为“Guided CNN”的文字检测算法,将图片分割为文字区域和非文字区域,针对文字区域进行高效的文字检测。这种方法确保了文字检测精度的同时,也大幅度提高了文字检测的速度。这篇报告的工作于2018年9月发表在英国机器视觉大会(BMVC,British Machine Vision Conference)上。
美团点评 张睿
最后一位是来自美团点评外卖事业部的张睿博士,带来了题目为《中文文字识别:从经典机器学习到深度神经网络》的学术报告。报告介绍了从上次人工智能高潮以来OCR的发展历程,尤其提到了中文OCR中经典机器学习算法和深度学习算法之间的关系,这也是张睿首次在学术界公开这个观点。报告同时结合美团外卖在实际业务中遇到的应用和场景,分享了中文OCR在互联网产业应用,遇到的问题和解决方案,包括在低质量环境下证照识别的解决方案,中文街景招牌复杂排版的解决方案等。张睿最后也抛出了来自工业界的三点思考与各位同学共勉:一、要具有工匠精神,做实应用场景;二、公开数据集是连接工业界与产业界的桥梁,自然场景的数据集需要按场景细分;三、专用AI的效果明显优于通用AI,如何快速实现专用定制是企业面临的挑战。
美团点评技术学院还为本次论坛设置了一个小惊喜,论坛临近结束时在现场随机抽取了3位幸运同学,赠与《美团机器学习实践》算法书。本书由美团算法团队20余位一线工程师耗时一年多编写,是业界第一本大型互联网公司机器学习实践图书,同时也是美团技术丛书的第一本~
最后,以刘成林的精彩点评来结束本文:OCR是一个发展超过半个世纪的课题,见证并伴随着人工智能一起经历潮起潮落,已经成为人工智能获得成功应用的典范案例,也是识别技术创新的标准试验场。深度学习带来的技术突破和互联网应用的大批量涌现,对手写识别、场景文字识别等新应用提出了新的需求,也为OCR带来了新挑战和新机遇。刘成林希望所有从事OCR研究的同仁们,在科研和应用的道路上不断探索、推陈出新、理论与实践相结合,在文字识别领域做出丰硕的成果。
中国计算机学会
长按识别二维码关注我们
CCF推荐
【精品文章】
点击“阅读原文”,加入CCF。