【预告】常青藤名校嘉宾来了！一周4场学术公开课，干货太多完全听不过来……

会员服务 ·

【预告】常青藤名校嘉宾来了！一周4场学术公开课，干货太多完全听不过来……

2017 年 9 月 29 日 AI研习社

预祝大家国庆 + 中秋快乐~

言归正传

假期出门游玩回来

记得继续关注

学术青年分享会

接下来

是一大波预告

▼▼

10 月 10 日 10:30

主题：端到端自动驾驶与自动驾驶前沿研究内容

分享内容：本次分享会嘉宾将会通过解读这篇被 CVPR2017 收录的论文《End-to-end Learning of Driving Models from Large-scale Video Datasets》来介绍自动驾驶前沿的研究内容。本次工作的核心是定义了如何从视觉的角度通过深度学习来实现自动驾驶，并且与英伟达、CMU 的 ALVINN 的工作不同，不仅仅在路况简单的情况下可以实现 “车道跟随”(lane following)，而且可以处理更复杂的环境，例如城市、商业区等。现有的深度学习的方法往往由于数据的原因被限制在固定的场景下，他们使用大规模众筹 (crowd-sourced) 视频数据，从而让模型可以更好地泛化。他们沿着 ALVINN 的道路尝试了端到端 (end-to-end) 的训练方式，这样的模型探索了端到端自动驾驶的可能性，同时隐含地学习出图像中关键的信息，并且加入了 LSTM 来进行对时间序列的建模，从而可以利用驾驶者的历史信息。他们还尝试了用其他 task 来增强主 task，用语义分割网络来对主要驾驶网络进行调整，发现对主要的 task 有部分效果提升。

分享人：许华哲，UC Berkeley 博士，师从 Prof. Trevor Darrell。对计算机视觉、自动驾驶、强化学习感兴趣。本科毕业于清华大学电子工程系。

10 月 11 日 20:00

主题：基于 LSTM-RNN 的语音声学建模技术

分享内容：LSTM-RNN 可以对长时序列信息进行建模，广泛应用于语音识别声学模型建模中。此次主要介绍近期 LSTM 的一些研究进展包括 LC-BLSTM，2D-LSTM 等。其中 LC-BLSTM 采用了双向 LSTM 结构，并在训练和解码时加入了数帧的未来信息来控制延时，解决了普通双向 LSTM 无法用于实时语音识别的问题；而 2D-LSTM 在时间和频域两个维度上进行循环，同时保存时间轴与频域轴的序列信息，Google 和微软都在大规模语音识别任务上验证了这类 2D-LSTM 结构的有效性。

分享人：张弼弘，2017 年 4 月毕业于西北工业大学并获得硕士学位。研究方向是语音识别声学建模，深度学习，机器学习。目前就职于搜狗。

10 月 12 日 20:00

主题：神经霍克斯过程：一个基于神经网络的自调节多变量点过程

分享内容：对连续时间上的离散事件进行建模，一直是一个非常重要的研究方向：发现事件中广泛而复杂的影响关系，可以帮助我们准确地预测未来事件的类型和发生时间。在这篇 NIPS 文章中，作者设计了一个基于神经网络的点过程模型，并通过一个 continuous-time LSTM 增强了该模型在连续时间上的表达和泛化能力。实验结果充分证实了所提出的模型的良好性能。

分享人：梅洪源，JHU CS 系二年级博士生，导师 Jason Eisner 教授。研究兴趣在于机器学习和自然语言处理。在此之前，他曾在芝加哥大学自然科学学院获得硕士学位，并在华中科技大学电子信息工程系获得学士学位。他曾在微软研究院和丰田技术研究所实习。

10 月 13 日 20:00

主题：Beyond Universal Saliency: Personalized Saliency Prediction with Multi-task CNN

分享内容：显著性检测是计算机视觉中长期存在的问题。现有的大部分研究都集中在探索用户间普遍存在的显著性模型，即缺乏对个体在性别、年龄、习惯上差异的重视。在这篇 IJCAI 文章中，作者首次提出了个人显著性预测任务，并建立了首个个人显著性数据库，同时提出基于卷积神经网络的多任务个人显著性预测模型（Multi-Task Convolutional Neural Network），实验结果验证了模型的良好的性能。

分享人：徐衍钰，上海科技大学信息学院三年级博士生，导师为高盛华教授。2011 年本科毕业于大连理工大学。主要研究方向为计算机视觉，例如显著性分析、人脸对齐等。

报名方式

扫描二维码备注「学术青年分享会」立即报名活动

记得马住来看~

登录查看更多

相关内容

长短期记忆网络

关注 120

长短期记忆网络(LSTM)是一种用于深度学习领域的人工回归神经网络(RNN)结构。与标准的前馈神经网络不同，LSTM具有反馈连接。它不仅可以处理单个数据点(如图像)，还可以处理整个数据序列(如语音或视频)。例如，LSTM适用于未分段、连接的手写识别、语音识别、网络流量或IDSs(入侵检测系统)中的异常检测等任务。

CVPR 2020 最佳论文与最佳学生论文！

专知会员服务

36+阅读 · 2020年6月17日

【新书】图神经网络导论，清华大学刘知远老师著作

专知会员服务

368+阅读 · 2020年6月12日

【CVPR2020】从未标记的视频中学习视频对象分割，Learning Video Object Segmentation from Unlabeled Videos

专知会员服务

36+阅读 · 2020年3月12日

【哈工大】基于抽取的高考作文生成

专知会员服务

37+阅读 · 2020年3月10日