周末快乐~
下周一回来
记得继续关注
AI研习社公开课
接下来
是一大波预告
▼▼
11 月 06 日 20:00
主题:AlphaGo Zero and Deep Learning
分享内容:解析AlphaGo Zero如何将白板学习、Resnet、MCTS等技术,将Polic Network和Value Network组合框架下使用Self-play解决零经验下自学习过程。介绍目前最新的深度学习方式如何将机器感知向机器认知方向的演进,目前Mercy博士团队应用深度学习的最新研究方向分享。由于演讲人多年担任SCI期刊编委,对学术论文撰写经验进行分享。
分享人:王强博士,本科毕业于西安交通大学计算机科学与技术专业,后获得卡内基梅隆大学软件工程专业硕士学位、机器人博士学位。美国货币监理署(OCC)审计专家库成员、IBM商业价值研究院院士及纽约Thomas J. Watson研究院主任研究员。IEEE高级会员,并担任了2008、2009、2013及未来2018年CVPR的论文评委,同时是PAMI和TIP两个全球顶级期刊的编委。王强博士在国际顶级期刊发表了90多篇论文,并多次在ICCV,CVPR等大会做论文分享。其主要研究领域图像理解、机器学习、智能交易、金融反欺诈及风险预测等。
11 月 08 日 20:00
主题:强化学习与策略评估
分享内容:强化学习(Reinforcement learning)在近几年收到越来越多的关注,对于强化学习的理论探讨也一直是研究热点。这次分享,我们将一起探讨强化学习的理论框架。在此基础上,策略评估(policy evaluation)是强化学习中最基础也是最重要的一个组成部分,其收敛性质的分析对于理解和改进这一类算法非常重要。但是如果只停留在一些非常理想化的假设下,得到的结果往往难以令人信服。在这次要分享的一个工作中,我们将给出一类策略评估算法在一些更贴近实际的假定下(RL天然的数据不独立同分布性,步长多种设置方式等 )的收敛速率分析结果,从而更加确切的回答了关于这一类算法收敛性质的疑问,并且提供了解决类似问题的一个可用的理论工具。
分享人:汪跃,北京交通大学数学系三年级博士生,专业为概率论与数理统计,导师是马志明院士。 他的研究兴趣在于机器学习、优化算法、强化学习的算法设计和算法理论分析。 在此之前,他于2015年在北京交通大学理学院院获得学士学位。 他现在微软亚洲研究院机器学习组实习。
11 月 10 日 20:00
主题:AI小白的机器学习入门之路
分享内容:随着机器学习的行业应用越来越广泛,行业前景越来越广阔,越来越多的小伙伴也开始关注这方面的知识学习,同时也遇到了很多学习方面的问题。
0基础如何入门机器学习?有哪些学习经验可供借鉴?学习过程中又可能遇到哪些“坑”?AI研习社邀请硕士在读的清华大学陈丹阳同学介绍她的AI学习之路。作为航天专业的她,当初为何选择机器学习?学习过程中又有哪些经验分享,又是如何加入商汤科技的?
分享人:陈丹阳,北京航空航天大学学士,质量与可靠性工程专业。清华大学硕士,自动化展业,目前在商汤实习,主要做服饰的识别检测与分类。
报名方式
扫描二维码备注「公开课」立即报名活动
记得马住来看~
复旦Ph.D沈志强:用于目标检测的DSOD模型(ICCV 2017)
如果你觉得活动不错,欢迎点击报名~
▼▼▼