电子科大PhD：基于深度学习的中文唇语识别 | 学术青年分享会 - 专知

会员服务 ·

0

电子科大PhD：基于深度学习的中文唇语识别 | 学术青年分享会

2017 年 10 月 16 日 AI研习社 不灵叔

分享背景

▼

唇语识别，即通过运动的嘴唇，识别其说话内容。通过LSTM模型将CNN抽取出来的图片特征进行时序建模，最后引入Seq2Seq的翻译模型将发音转换成汉子。此次分享，会先简单介绍现有的英文唇语识别的一些工作（《Lip Reading Sentences in the Wild》和《LipNet： sentence level lipreading》），随后对中文唇语识别展开详细讨论。

《Lip Reading Sentences in the Wild》

论文地址：https://arxiv.org/abs/1611.05358

《LipNet：sentence level lipreading》

论文地址：https://arxiv.org/abs/1611.01599v1

分享主题

▼

基于深度学习的中文唇语识别

分享人简介

▼

戴锡笠，电子科技大学计算机系二年级博士生，他的研究方向在于计算机视觉，移动计算，深度学习。曾于海康威视研究院实习，研究内容为基于序列的行人再检索。

分享时间

▼

北京时间10月18日（周三） 20:00

参与方式

▼

扫描海报二维码，点击底部菜单

如果你觉得活动不错，欢迎点赞并转发本文~

▼▼▼

登录查看更多

8

相关内容

深度学习

机器学习的一个分支，它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

基于深度学习的主题模型研究，中文综述，29页pdf，计算机学报

基于深度学习的主题模型研究，中文综述，29页pdf，计算机学报

专知会员服务

124+阅读 · 2020年5月20日

基于深度学习的行人重识别研究进展，自动化学报

基于深度学习的行人重识别研究进展，自动化学报

专知会员服务

39+阅读 · 2019年12月5日

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

专知会员服务

84+阅读 · 2019年11月20日

【会议推荐】CV101大会：基于深度学习的⽂字识别----- 现状及展望，金连文，华南理工大学二级教授。（附PPT）

【会议推荐】CV101大会：基于深度学习的⽂字识别----- 现状及展望，金连文，华南理工大学二级教授。（附PPT）

专知会员服务

27+阅读 · 2019年11月19日

【CCL 2019】句法分析前沿动态综述，上海科技大学屠可伟博士

【CCL 2019】句法分析前沿动态综述，上海科技大学屠可伟博士

专知会员服务

26+阅读 · 2019年11月12日

【CCL 2019】多模态--基于视觉的跨模态文本生成，复旦大学副教授魏忠钰

【CCL 2019】多模态--基于视觉的跨模态文本生成，复旦大学副教授魏忠钰

专知会员服务

74+阅读 · 2019年11月12日

知识图谱与语义理解，百度研究院王海峰院长，CCKS-2019：知识智能

知识图谱与语义理解，百度研究院王海峰院长，CCKS-2019：知识智能

专知会员服务

60+阅读 · 2019年10月25日

文档分析与识别技术回顾与反思，中国科学院自动化研究所刘成林研究员，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

文档分析与识别技术回顾与反思，中国科学院自动化研究所刘成林研究员，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

专知会员服务

38+阅读 · 2019年10月24日

深度学习视频中多目标跟踪：论文综述

深度学习视频中多目标跟踪：论文综述

专知会员服务

94+阅读 · 2019年10月13日

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

专知会员服务

33+阅读 · 2019年9月15日

SFFAI11 报名通知 | 图像分割专题

SFFAI11 报名通知 | 图像分割专题

人工智能前沿讲习班

9+阅读 · 2018年11月26日

SFFAI报名通知 | 神经机器翻译 & 关系抽取

SFFAI报名通知 | 神经机器翻译 & 关系抽取

人工智能前沿讲习班

9+阅读 · 2018年10月25日

直播 | 今晚八点！听清华博士孙奕帆介绍行人再识别论文及最新相关进展

直播 | 今晚八点！听清华博士孙奕帆介绍行人再识别论文及最新相关进展

AI科技评论

4+阅读 · 2017年12月21日

今晚直播 | 基于生成模型的事件流研究 + NIPS 2017 论文解读

今晚直播 | 基于生成模型的事件流研究 + NIPS 2017 论文解读

PaperWeekly

5+阅读 · 2017年12月20日

清华大学冯珺：基于强化学习的关系抽取和文本分类 | 实录·PhD Talk

清华大学冯珺：基于强化学习的关系抽取和文本分类 | 实录·PhD Talk

PaperWeekly

11+阅读 · 2017年11月23日

今晚8点：基于强化学习的关系抽取和文本分类 | PhD Talk #18

今晚8点：基于强化学习的关系抽取和文本分类 | PhD Talk #18

PaperWeekly

4+阅读 · 2017年11月22日

【回顾】基于深度学习的中文唇语识别

【回顾】基于深度学习的中文唇语识别

AI研习社

7+阅读 · 2017年10月20日

IJCAI 2017提名最佳学生论文作者解读 | 学术青年分享会

IJCAI 2017提名最佳学生论文作者解读 | 学术青年分享会

AI研习社

3+阅读 · 2017年10月11日

直播 | 搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

直播 | 搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

AI科技评论

4+阅读 · 2017年10月10日

【直播】搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

【直播】搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

AI研习社

3+阅读 · 2017年10月9日

Transformer based Grapheme-to-Phoneme Conversion

Arxiv

6+阅读 · 2020年4月14日

Syllable-Based Sequence-to-Sequence Speech Recognition with the Transformer in Mandarin Chinese

Arxiv

5+阅读 · 2018年6月4日

Multimodal Sentiment Analysis To Explore the Structure of Emotions

Arxiv

19+阅读 · 2018年5月25日

Image Captioning

Arxiv

11+阅读 · 2018年5月13日

Viscovery: Trend Tracking in Opinion Forums based on Dynamic Topic Models

Arxiv

5+阅读 · 2018年5月1日

Object Tracking in Satellite Videos Based on a Multi-Frame Optical Flow Tracker

Arxiv

5+阅读 · 2018年4月25日

DAiSEE: Towards User Engagement Recognition in the Wild

Arxiv

5+阅读 · 2018年4月12日

$ρ$-hot Lexicon Embedding-based Two-level LSTM for Sentiment Analysis

Arxiv

6+阅读 · 2018年3月21日

Application of Rényi and Tsallis Entropies to Topic Modeling Optimization

Arxiv

6+阅读 · 2018年2月28日

Depth-Gated LSTM

Arxiv

4+阅读 · 2015年8月25日

VIP会员

相关主题

长短期记忆网络

相关VIP内容

基于深度学习的主题模型研究，中文综述，29页pdf，计算机学报

基于深度学习的主题模型研究，中文综述，29页pdf，计算机学报

专知会员服务

124+阅读 · 2020年5月20日

基于深度学习的行人重识别研究进展，自动化学报

基于深度学习的行人重识别研究进展，自动化学报

专知会员服务

39+阅读 · 2019年12月5日

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

专知会员服务

84+阅读 · 2019年11月20日

【会议推荐】CV101大会：基于深度学习的⽂字识别----- 现状及展望，金连文，华南理工大学二级教授。（附PPT）

【会议推荐】CV101大会：基于深度学习的⽂字识别----- 现状及展望，金连文，华南理工大学二级教授。（附PPT）

专知会员服务

27+阅读 · 2019年11月19日

【CCL 2019】句法分析前沿动态综述，上海科技大学屠可伟博士

【CCL 2019】句法分析前沿动态综述，上海科技大学屠可伟博士

专知会员服务

26+阅读 · 2019年11月12日

【CCL 2019】多模态--基于视觉的跨模态文本生成，复旦大学副教授魏忠钰

【CCL 2019】多模态--基于视觉的跨模态文本生成，复旦大学副教授魏忠钰

专知会员服务

74+阅读 · 2019年11月12日

知识图谱与语义理解，百度研究院王海峰院长，CCKS-2019：知识智能

知识图谱与语义理解，百度研究院王海峰院长，CCKS-2019：知识智能

专知会员服务

60+阅读 · 2019年10月25日

文档分析与识别技术回顾与反思，中国科学院自动化研究所刘成林研究员，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

文档分析与识别技术回顾与反思，中国科学院自动化研究所刘成林研究员，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

专知会员服务

38+阅读 · 2019年10月24日

深度学习视频中多目标跟踪：论文综述

深度学习视频中多目标跟踪：论文综述

专知会员服务

94+阅读 · 2019年10月13日

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

【文献综述】基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,昆山杜克大学李明博士

专知会员服务

33+阅读 · 2019年9月15日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型基准综述

《自适应训练辅助系统概念导论及其在空战指挥官加速培训中的应用》125页

【剑桥博士论文】多智能体学习中的神经多样性

以色列-伊朗空战：短暂而激烈冲突的启示

相关资讯

SFFAI11 报名通知 | 图像分割专题

SFFAI11 报名通知 | 图像分割专题

人工智能前沿讲习班

9+阅读 · 2018年11月26日

SFFAI报名通知 | 神经机器翻译 & 关系抽取

SFFAI报名通知 | 神经机器翻译 & 关系抽取

人工智能前沿讲习班

9+阅读 · 2018年10月25日

直播 | 今晚八点！听清华博士孙奕帆介绍行人再识别论文及最新相关进展

直播 | 今晚八点！听清华博士孙奕帆介绍行人再识别论文及最新相关进展

AI科技评论

4+阅读 · 2017年12月21日

今晚直播 | 基于生成模型的事件流研究 + NIPS 2017 论文解读

今晚直播 | 基于生成模型的事件流研究 + NIPS 2017 论文解读

PaperWeekly

5+阅读 · 2017年12月20日

清华大学冯珺：基于强化学习的关系抽取和文本分类 | 实录·PhD Talk

清华大学冯珺：基于强化学习的关系抽取和文本分类 | 实录·PhD Talk

PaperWeekly

11+阅读 · 2017年11月23日

今晚8点：基于强化学习的关系抽取和文本分类 | PhD Talk #18

今晚8点：基于强化学习的关系抽取和文本分类 | PhD Talk #18

PaperWeekly

4+阅读 · 2017年11月22日

【回顾】基于深度学习的中文唇语识别

【回顾】基于深度学习的中文唇语识别

AI研习社

7+阅读 · 2017年10月20日

IJCAI 2017提名最佳学生论文作者解读 | 学术青年分享会

IJCAI 2017提名最佳学生论文作者解读 | 学术青年分享会

AI研习社

3+阅读 · 2017年10月11日

直播 | 搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

直播 | 搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

AI科技评论

4+阅读 · 2017年10月10日

【直播】搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

【直播】搜狗研究员：基于LSTM-RNN的语音声学建模技术 | 学术青年分享会

AI研习社

3+阅读 · 2017年10月9日

相关论文

Transformer based Grapheme-to-Phoneme Conversion

Arxiv

6+阅读 · 2020年4月14日

Syllable-Based Sequence-to-Sequence Speech Recognition with the Transformer in Mandarin Chinese

Arxiv

5+阅读 · 2018年6月4日

Multimodal Sentiment Analysis To Explore the Structure of Emotions

Arxiv

19+阅读 · 2018年5月25日

Image Captioning

Arxiv

11+阅读 · 2018年5月13日

Viscovery: Trend Tracking in Opinion Forums based on Dynamic Topic Models

Arxiv

5+阅读 · 2018年5月1日

Object Tracking in Satellite Videos Based on a Multi-Frame Optical Flow Tracker

Arxiv

5+阅读 · 2018年4月25日

DAiSEE: Towards User Engagement Recognition in the Wild

Arxiv

5+阅读 · 2018年4月12日

$ρ$-hot Lexicon Embedding-based Two-level LSTM for Sentiment Analysis

Arxiv

6+阅读 · 2018年3月21日

Application of Rényi and Tsallis Entropies to Topic Modeling Optimization

Arxiv

6+阅读 · 2018年2月28日

Depth-Gated LSTM

Arxiv

4+阅读 · 2015年8月25日

大家都在搜

CMU博士论文

无人机集群

国防科技创新

软件无线电

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员