分享背景
▼
唇语识别,即通过运动的嘴唇,识别其说话内容。通过LSTM模型将CNN抽取出来的图片特征进行时序建模,最后引入Seq2Seq的翻译模型将发音转换成汉子。此次分享,会先简单介绍现有的英文唇语识别的一些工作(《Lip Reading Sentences in the Wild》 和《LipNet: sentence level lipreading》),随后对中文唇语识别展开详细讨论。
《Lip Reading Sentences in the Wild》
论文地址:https://arxi
v.org/abs/16 11.05358
《LipNet:sentence level lipreading》
论文地址:https://arxi
v.org/abs/16 11.01599v1
分享主题
▼
基于深度学习的中文唇语识别
分享人简介
▼
戴锡笠,电子科技大学计算机系二年级博士生,他的研究方向在于计算机视觉,移动计算,深度学习。曾于海康威视研究院实习,研究内容为基于序列的行人再检索。
分享时间
▼
北京时间10月18日(周三) 20:00
参与方式
▼
扫描海报二维码,点击底部菜单
如果你觉得活动不错,欢迎点赞并转发本文~
▼▼▼