本书介绍了用于视频理解的深度学习技术。在深度学习基础部分,作者涵盖了机器学习流程和符号表示、用于空间和时间特征学习的2D和3D卷积神经网络。对于动作识别,作者首先介绍了经典的图像分类框架,然后详细阐述了基于图像和基于剪辑的2D/3D CNN网络如何用于动作识别。对于动作检测,作者详细讲解了滑动窗口、基于提议的检测方法、单阶段和双阶段方法、空间和时间动作定位,并介绍了相关数据集。在视频字幕生成部分,作者展示了基于语言的模型以及如何进行视频字幕生成的序列到序列学习。对于无监督特征学习,作者讨论了从有监督学习转向无监督学习的必要性,并介绍了如何设计更好的替代训练任务来学习视频表示。最后,本书介绍了诸如对比学习和基于变换器的掩码图像/视频建模等最新的自训练流程。本书提供了前瞻性的研究方向,旨在促进深度学习领域的视频理解研究成果的发展。

背面书评

本书介绍了用于视频理解的深度学习技术。在深度学习基础部分,作者涵盖了机器学习流程和符号表示、用于空间和时间特征学习的2D和3D卷积神经网络。对于动作识别,作者首先介绍了经典的图像分类框架,然后详细阐述了基于图像和基于剪辑的2D/3D CNN网络如何用于动作识别。对于动作检测,作者详细讲解了滑动窗口、基于提议的检测方法、单阶段和双阶段方法、空间和时间动作定位,并介绍了相关数据集。在视频字幕生成部分,作者展示了基于语言的模型以及如何进行视频字幕生成的序列到序列学习。对于无监督特征学习,作者讨论了从有监督学习转向无监督学习的必要性,并介绍了如何设计更好的替代训练任务来学习视频表示。最后,本书介绍了诸如对比学习和基于变换器的掩码图像/视频建模等最新的自训练流程。本书提供了前瞻性的研究方向,旨在促进深度学习领域的视频理解研究成果的发展。 * 提供视频理解的深度学习技术概述; * 涵盖动作识别、动作定位、视频字幕生成等重要主题; * 介绍最前沿和最新的视频理解技术。

关于作者

吴祖轩于2020年获得马里兰大学计算机科学博士学位。他目前是复旦大学计算机科学学院的副教授,并曾任职于Facebook AI研究科学家。他的研究兴趣包括深度学习和大规模视频理解。由于其研究成果卓越,他曾获得2022年AI 2000最具影响力学者奖、2019年微软研究院博士奖学金(全球仅10人)和2017年Snap博士奖学金(全球仅10人)。 姜育刚是复旦大学计算机科学学院的长江学者特聘教授。他的研究主要集中在多媒体、计算机视觉和稳健与可信赖的人工智能领域。作为上海智能视觉计算协同创新中心主任和复旦视觉与学习实验室(FVL)的负责人,他领导了一支致力于稳健与可信视觉分析的研究团队。他在顶级期刊和会议上发表了大量论文,引用次数超过25000次,H指数为79。他的研究成果对移动视觉搜索/识别和高速铁路基础设施的缺陷检测等应用产生了重大影响。他的工作获得了众多奖项,包括首届2014年ACM中国新星奖、2015年ACM SIGMM新星奖、多项最佳论文奖,以及来自中国自然科学基金会、教育部和上海市政府的各种荣誉。他拥有香港城市大学的计算机科学博士学位,并曾在哥伦比亚大学工作三年,之后于2011年加入复旦大学。他是国际模式识别学会(IAPR)和IEEE的当选会士。

成为VIP会员查看完整内容
48

相关内容

机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【新书】大语言模型:导论,531页pdf
专知会员服务
70+阅读 · 9月20日
【新书】生成式人工智能模型,419页pdf
专知会员服务
98+阅读 · 9月3日
【新书】深度学习的数学和架构,552页pdf
专知会员服务
141+阅读 · 4月25日
【2023新书】深度学习科学,362页pdf
专知会员服务
112+阅读 · 2023年12月21日
【2023新书】多媒体数据处理与计算,197页pdf
专知会员服务
52+阅读 · 2023年10月31日
【2023新书】机器学习凸优化,379页pdf
专知会员服务
124+阅读 · 2023年5月3日
【新书】分布式强化学习,280页pdf
专知会员服务
152+阅读 · 2021年12月19日
【新书】基于物理的深度学习,220页pdf
专知会员服务
157+阅读 · 2021年9月15日
【2021新书】深度学习计算机视觉,320页pdf
专知会员服务
191+阅读 · 2021年5月20日
【干货书】高级应用深度学习,294页pdf
专知会员服务
153+阅读 · 2020年6月20日
【2022新书】深度学习归一化技术,117页pdf
专知
24+阅读 · 2022年11月25日
【干货书】深度学习全面指南,307页pdf
专知
31+阅读 · 2022年1月6日
【新书】分布式强化学习,280页pdf
专知
21+阅读 · 2021年12月19日
【干货书】高维统计学,572页pdf
专知
15+阅读 · 2021年12月3日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年4月30日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2008年12月31日
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
407+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2023年3月26日
Arxiv
147+阅读 · 2023年3月24日
Arxiv
21+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【新书】大语言模型:导论,531页pdf
专知会员服务
70+阅读 · 9月20日
【新书】生成式人工智能模型,419页pdf
专知会员服务
98+阅读 · 9月3日
【新书】深度学习的数学和架构,552页pdf
专知会员服务
141+阅读 · 4月25日
【2023新书】深度学习科学,362页pdf
专知会员服务
112+阅读 · 2023年12月21日
【2023新书】多媒体数据处理与计算,197页pdf
专知会员服务
52+阅读 · 2023年10月31日
【2023新书】机器学习凸优化,379页pdf
专知会员服务
124+阅读 · 2023年5月3日
【新书】分布式强化学习,280页pdf
专知会员服务
152+阅读 · 2021年12月19日
【新书】基于物理的深度学习,220页pdf
专知会员服务
157+阅读 · 2021年9月15日
【2021新书】深度学习计算机视觉,320页pdf
专知会员服务
191+阅读 · 2021年5月20日
【干货书】高级应用深度学习,294页pdf
专知会员服务
153+阅读 · 2020年6月20日
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年4月30日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员