【18-17期VALSE在线学术报告通知及参与方式】

会员服务 ·

【18-17期VALSE在线学术报告通知及参与方式】

2018 年 6 月 7 日 VALSE

报告嘉宾：赵行（MIT）

报告时间：2018年06月13日（星期三）晚上20:00（北京时间）

报告题目：像素之声-图像和声音的跨模态自监督学习

主持人：施柏鑫（北京大学）

报告人简介：

赵行本科毕业于浙江大学，于麻省理工媒体实验室完成硕士论文，现为麻省理工计算机与人工智能实验室博士生。主要研究方向为场景解析，视频识别，和跨模态学习。

个人主页：

http://www.mit.edu/~hangzhao/

报告摘要：

深度学习的出现使得利用不同模式信号之间的学习变得容易。但同时，由于神经网络对数据的需求，标注大量的跨模态的数据非常困难。在最近的工作中，我们利用了视频中图像和声音的内在关联性，进行一系列的自监督学习。主要的应用有特征学习，声音识别，声音分离，声源在图像中的定位等。

参考文献：

[1] Soundnet: Learning sound representations from unlabeled video, Aytar, Yusuf and Vondrick, Carl and Torralba, Antonio, NIPS 2016.

[2] The Sound of Pixels, Zhao, Hang and Gan, Chuang and Rouditchenko, Andrew and Vondrick, Carl and McDermott, Josh and Torralba, Antonio, arXiv:1804.03160 (In Submission)

18-17期VALSE在线学术报告参与方式：

长按或扫描下方二维码，关注”VALSE“微信公众号（valse_wechat），后台回复”17期“，获取直播地址。

特别鸣谢本次Webinar主要组织者：

VOOC责任委员：施柏鑫（北京大学）

VODB协调理事：彭玺（四川大学）

活动参与方式：

1、VALSE Webinar活动依托在线直播平台进行，活动时讲者会上传PPT或共享屏幕，听众可以看到Slides，听到讲者的语音，并通过聊天功能与讲者交互；

2、为参加活动，请关注VALSE微信公众号：valse_wechat 或加入VALSE QQ群（目前A、B、C、D、E、F、G群已满，除讲者等嘉宾外，只能申请加入VALSE H群，群号：701662399）；

*注：申请加入VALSE QQ群时需验证姓名、单位和身份，缺一不可。入群后，请实名，姓名身份单位。身份：学校及科研单位人员T；企业研发I；博士D；硕士M。

3、在活动开始前5分钟左右，讲者会开启直播，听众点击直播链接即可参加活动，支持安装Windows系统的电脑、MAC电脑、手机等设备；

4、活动过程中，请不要说无关话语，以免影响活动正常进行；

5、活动过程中，如出现听不到或看不到视频等问题，建议退出再重新进入，一般都能解决问题；

6、建议务必在速度较快的网络上参加活动，优先采用有线网络连接；

7、VALSE微信公众号会在每周一推送上一周Webinar报告的总结及视频（经讲者允许后），每周四发布下一周Webinar报告的通知及直播链接。

登录查看更多

相关内容

VALSE研讨会

关注 0

VALSE 发起于 2011年，是 Vision And Learning Seminar 的简写，取“华尔兹舞”之意。目的是为全球计算机视觉、模式识别、机器学习、多媒体技术等相关领域的华人青年学者提供一个平等、自由的学术交流舞台。官网：http://valser.org/

【高能所】如何做好⼀份学术报告& 简单介绍LaTeX 的使用

专知会员服务

94+阅读 · 2020年5月16日

【报告】知识图谱中的关联搜索，南京大学计算机科学与技术系副教授| 程龚

专知会员服务

126+阅读 · 2019年12月14日

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

专知会员服务

127+阅读 · 2019年11月30日

【CCL 2019】2019信息检索趋势，山东大学教授任昭春博士

专知会员服务

30+阅读 · 2019年11月12日

【CCL 2019】信息抽取前沿动态，中科院自动化模式识别国家重点实验室助理研究员陈玉博博士

专知会员服务

85+阅读 · 2019年11月12日

【CCL 2019】社会媒体处理前沿综述，哈尔滨工业大学助理研究员丁效

专知会员服务

42+阅读 · 2019年11月12日

社交机器人的挑战性问题，清华大学计算机系黄民烈副教授，SMP 2019 前沿技术讲习班第十五期（CIPS ATT 15）

专知会员服务

21+阅读 · 2019年10月23日

面向大数据的粒计算理论与方法，山西大学梁吉业教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

40+阅读 · 2019年10月22日

图卷积神经网络在计算金融等交叉学科领域的应用研究，复旦大学魏忠钰副教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

41+阅读 · 2019年10月21日

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

专知会员服务

32+阅读 · 2019年10月12日

VALSE Webinar 特别专题之产学研共舞VALSE

VALSE

7+阅读 · 2019年9月19日

VALSE Webinar 19-24期去雨去雾专题

VALSE

23+阅读 · 2019年9月12日

VALSE Webinar 19-16期云深可知处：视觉SLAM

VALSE

12+阅读 · 2019年7月4日

落地 | VALSE 2019 极市展台面基、PPT分享、丰富抽奖就在合肥等着你~

极市平台

9+阅读 · 2019年4月11日

VALSE Webinar 19-08期图像匹配与配准：历久而弥新

VALSE

11+阅读 · 2019年4月4日

VALSE Webinar 19-07期迁移学习与领域适配

VALSE

5+阅读 · 2019年3月28日

VALSE Webinar 19-05期自动机器学习 AutoML

VALSE

8+阅读 · 2019年2月28日

VALSE Webinar 19-04期弱监督图像理解专题

VALSE

9+阅读 · 2019年2月21日

VALSE Webinar 19-01期元学习专题研讨

VALSE

13+阅读 · 2018年12月27日

【领域报告】主动学习年度进展|VALSE2018

深度学习大讲堂

15+阅读 · 2018年6月12日

Towards a Human-like Open-Domain Chatbot

Arxiv

14+阅读 · 2020年1月27日

A Survey on Distributed Machine Learning

Arxiv

45+阅读 · 2019年12月20日

End to end learning and optimization on graphs

Arxiv

7+阅读 · 2019年5月31日

Object Hallucination in Image Captioning

Arxiv

3+阅读 · 2019年3月29日

Image Captioning based on Deep Reinforcement Learning

Arxiv

9+阅读 · 2018年9月13日

Two Stream 3D Semantic Scene Completion

Arxiv

4+阅读 · 2018年7月16日

Generalization without systematicity: On the compositional skills of sequence-to-sequence recurrent networks

Arxiv

3+阅读 · 2018年6月6日

One-at-a-time: A Meta-Learning Recommender-System for Recommendation-Algorithm Selection on Micro Level

Arxiv

3+阅读 · 2018年5月30日

Image Captioning

Arxiv

11+阅读 · 2018年5月13日

Mining on Manifolds: Metric Learning without Labels

Arxiv

6+阅读 · 2018年3月29日

VIP会员