分享主题:基于深度学习的中文唇语识别
分享人:戴锡笠,电子科技大学计算机系二年级博士生,他的研究方向在于计算机视觉,移动计算,深度学习。曾于海康威视研究院实习,研究内容为基于序列的行人再检索。
唇语识别,即通过运动的嘴唇,识别其说话内容。通过 LSTM 模型将 CNN 抽取出来的图片特征进行时序建模,最后引入 Seq2Seq 的翻译模型将发音转换成汉子。此次分享,会先简单介绍现有的英文唇语识别的一些工作(《Lip Reading Sentences in the Wild》 和《LipNet: sentence level lipreading》),随后对中文唇语识别展开详细讨论。
10 月 13 日(周五)晚 20:00,AI 研习社微信群
▷ 观看完整回顾大概需要 50 分钟
新人福利
关注 AI 研习社(okweiwu),回复 1 领取
【超过 1000G 神经网络 / AI / 大数据,教程,论文】
后台回复 “我要进群” 加入 AI 技术讨论群
AI研习社青年学术分享会往期分享
▼▼▼