本文约5566字,建议阅读10分钟
本文介绍
了12月30日
晚19:30上海财经大学博士生、美团算法工程师联袂带来的IJCAI第六场!
12月30日 19:30~20:30
AI TIME特别邀请上海财经大学博士生、美团算法工程师,开启IJCAI第六场!
扫码关注AITIME哔哩哔哩官方账号
观看直播
链接:https://live.bilibili.com/21813994
旷骐:
上海财经大学数理统计学博士一年级研究生,研究方向为强化学习、分位数回归。
基于非递减分位数网络的值分布强化学习及其高效探索方法
内容简介:
尽管值分布强化学习在过去几年中得到了广泛的研究,但仍然存在两方面未能解决问题:一是如何保证估计出来的分位数函数的有效性,二是如何有效地利用估计出来的分布信息。本文试图为这两个类问题的深入研究提供一些新的观点。我们首先提出一个非递减分位数函数网络,以保证得到的分位数估计的单调性,其次设计一个基于值分布强化学习的探索方法,该方法充分利用了学习到的分位数函数的信息。在本文中,我们讨论了我们的方法在理论上的必要性,并且通过在Atari 2600游戏中优异表现,证实了实践中方法的有效性。
苏金明:
美团算法工程师,毕业于北京航空航天大学。目前主要研究兴趣包括场景理解、三维重建等相关领域,在计算机视觉及人工智能领域知名期刊会议T-IP、J-STSP、ICCV、IJCAI等发表多篇论文,担任T-PAMI、CVPR、ICCV等期刊会议审稿人。
个人主页:http://jinmingsu.net/
内容简介:
近年来,随着深度神经网络和自动驾驶的快速发展,车道检测取得了很大进展。然而,仍存在三个主要问题:表征车道线、建模场景和车道线之间的结构关系以及支持车道线的更多属性(例如实例和类型)。为解决以上问题,提出了一种新型的结构信息引导的框架。在该框架中,我们首先引入一种新的车道表示来表征每个车道线实例,然后提出一种自上而下的消失点引导锚机制来产生密集的锚,有效地捕获各种车道线。接着使用多级结构约束来提升车道线的感知。在此过程中,引入二值分割的像素级感知来提升锚周围的特征并自下而上地恢复车道细节,引入车道级关系来建模车道线之间结构关系,引入图像级注意力从场景角度自适应地关注图像的不同区域。在结构信息的帮助下,锚被有效地分类和回归以获得精确的车道线位置和形状。在公共数据集上的大量实验表明,提出的方法在精度和速度上优于当前的先进方法。本次报告分享的内容发表在IJCAI 2021。
直播结束后我们会邀请讲者在微信群中与大家答疑交流,请添加“AI TIME小助手(微信号:AITIME_HY)”,回复“IJCAI”,将拉您进“IJCAI会议交流群”!
合作伙伴:智谱·AI、中国工程院知领直播、学堂在线、蔻享学术、Ever链动