第十五届中国计算机大会(CNCC2018)将于 2018 年 10 月 25-27 日在杭州国际博览中心举行。本届大会以“大数据推动数字经济(Big Data Drives the Digital Economy)”为主题,探讨计算技术领域最新进展与未来发展趋势。届时将有十五位国内外计算机领域知名学者、专家、企业家到会做特邀报告,同时还将举办60场技术论坛和20场活动。大会详情和报名信息请戳 http://cncc2018.ccf.org.cn/。
在本届计算机大会上,美团点评与中国科学院自动化研究所、华南理工大学、商汤科技共同举办了主题为“OCR之人工智能历久弥新”的CNCC技术论坛。下面让我们来提前一睹各位嘉宾的风采。(文末有彩蛋哦~)
OCR(图像文字识别)是一个发展了超过半个世纪的课题,见证并伴随着人工智能一起历经潮起潮落。已经成为人工智能获得成功应用的典型范例,也是识别技术创新的标准试验场。不久前,美团技术团队公众号也发表了一篇《深度学习在OCR中的应用》的文章,感兴趣的同学可以阅读一下。
近几年,深度学习技术和互联网应用相结合,即对如手写识别等传统应用提出更高要求,又对以拍照和网图为特点的新应用提出需求。为OCR带来了新挑战和新机遇。如何把握当今OCR应用和技术的特点,更好解决具体问题。本技术论坛邀请五位分别来自研究所、高校和企业的OCR专家。一起从OCR的理论与技术,多个垂直领域的实践,现存的难点和未来重点等角度开展讨论,与大家一起座谈OCR浪潮。
/ 主席 /
刘成林
研究员,工学博士。研究领域:模式识别、机器学习、神经网络、图像处理、文字识别、文档分析。现任中国科学院自动化研究所副所长,模式识别国家重点实验室主任,中国科学院大学人工智能学院副院长。
/ 共同主席 /
王栋
美团外卖技术部资深总监,2009年博士毕业于清华大学人工智能实验室,研究机器学习算法及计算机视觉的中层语义表示问题。毕业后先后任职于Hulu及优酷,主要从事网络视频中的搜索、推荐、广告等流量变现。多次带队或参与TRECVID/KDD Cup等国际机器算法竞赛并取得第一。2011年带领团队搭建出世界上第一个实用的视频人脸标注系统。
时间:2018年10月27日 下午 13:30 - 15:20
地点:杭州国际博览中心会议区 会议室 403
> > 点击报名 < <
演讲议题一:基于深度学习的文字识别:现状及展望
金连文
1991年毕业于中国科技大学无线电系获学士学位,1996年于华南理工大学获博士学位。2006入选教育部新世纪优秀人才。目前为华南理工大学二级教授,博士生导师,兼任中国图像图形学学会常务理事、中国图象图形学学会“文档图像分析与识别专委会”主任、CCF计算机视觉专委会委员、CCF人机交互专委会委员等职。发表SCI期刊论文50余篇(其中ESI高引论文4篇),主流国际会议论文100余篇,获得发明专利授权43项,作为主要成员荣获省部级科技奖励5次。
内容简介
文字作为信息记录、交流与传播的最重要载体,是我们感知这个世界最重要的手段,是人工智能视觉感知的一只重要的“眼睛”。在此演讲中,演讲者将简要介绍深度学习在文字识别领域的应用情况及主要技术现状,具体介绍联机及脱机手写体文字识别、场景文字检测与识别、古籍文献OCR等方面的主要研究进展及一些典型方法,并对目前存在的主要问题、技术挑战、及未来发展趋势进行讨论。
演讲议题二:Boosting up Scene Text Detectors with Guided CNN
旷章辉
商汤高级研究员,2009-2014年就读香港大学计算机系,获博士学位。 2014年6月到2015年1月,在香港联想集团任staff researcher; 2015年2月加入商汤科技,任高级研究员,负责图像视频解析与搜索研发工作,研究兴趣包括通用物体检测与识别,自然场景文字检测与识别,商品识别等。
内容简介
Deep CNNs have achieved great success in text detection. Most of existing methods attempt to improve accuracy with sophisticated network design, while paying less attention on speed. In this paper, we propose a general framework for text detection called Guided CNN to achieve the two goals simultaneously. The proposed model consists of one guidance sub-network, where a guidance mask is learned from the input image itself, and one primary text detector, where every convolution and non-linear operation are conducted only in the guidance mask. The guidance sub-network filters out non-text regions coarsely, greatly reducing the computation complexity. At the same time, the primary text detector focuses on distinguishing between text and hard non-text regions and regressing text bounding boxes, achieving a better detection accuracy. A novel training strategy, called background-aware block-wise random synthesis, is proposed to further boost up the performance. We demonstrate that the proposed Guided CNN is not only effective but also efficient with two state-of-the-art methods, CTPN and EAST, as backbones. On the challenging benchmark ICDAR 2013, it speeds up CTPN by 2.9 times on average, while improving the F-measure by 1.5%. On ICDAR 2015, it speeds up EAST by 2.0 times while improving the F-measure by 1.0%.
演讲议题三:中文文字识别从经典机器学习到深度神经网络
张睿
现任美团外卖事业部研究员。1993年和1996年于大连理工大学获学士、硕士学位,2003年于清华大学获博士学位。专注于事图像识别、机器学习等技术方向。之前曾在百度和阿里巴巴担任资深算法工程师和高级专家,在文字和文档图像识别的多个领域从事算法研发和应用实践。
内容简介
演讲者将介绍从上次人工智能高潮以来OCR,尤其是中文OCR的发展历程,包括基于经典机器学习和基于深度学习的算法介绍以及他们之间的关系。演讲中还会分享中文OCR在互联网产业的应用,遇到的问题和解决方案,包括在低质量环境下证照识别的解决方案,中文街景招牌复杂排版的解决方案等。最后,演讲者还会结合产业应用分享对中文OCR现状的一些思考。
美团点评为各位参加本次 ”CNCC技术论坛|OCR之人工智能历久弥新“ 同学准备了超值精美礼品。那就是由美团算法团队20余位一线工程师耗时一年多编写的《美团机器学习实践》,该书是业界第一本大型互联网公司机器学习实践图书,同时也是美团技术丛书的第一本。只要参加本次技术论坛,就有机会获得礼品哦~
请牢记时间和地点:10月27日下午13:30 杭州国际博览中心会议区会议室403,咱们不见不散~~
欲了解更多活动细节,请点击最下方的“阅读原文”查看。