【新书】深度学习视频理解，194页pdf - 专知VIP

会员服务 ·

35

深度学习 · 视频理解 · 书籍 ·

2024 年 8 月 9 日

【新书】深度学习视频理解，194页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本书介绍了用于视频理解的深度学习技术。在深度学习基础部分，作者涵盖了机器学习流程和符号表示、用于空间和时间特征学习的2D和3D卷积神经网络。对于动作识别，作者首先介绍了经典的图像分类框架，然后详细阐述了基于图像和基于剪辑的2D/3D CNN网络如何用于动作识别。对于动作检测，作者详细讲解了滑动窗口、基于提议的检测方法、单阶段和双阶段方法、空间和时间动作定位，并介绍了相关数据集。在视频字幕生成部分，作者展示了基于语言的模型以及如何进行视频字幕生成的序列到序列学习。对于无监督特征学习，作者讨论了从有监督学习转向无监督学习的必要性，并介绍了如何设计更好的替代训练任务来学习视频表示。最后，本书介绍了诸如对比学习和基于变换器的掩码图像/视频建模等最新的自训练流程。本书提供了前瞻性的研究方向，旨在促进深度学习领域的视频理解研究成果的发展。

背面书评

本书介绍了用于视频理解的深度学习技术。在深度学习基础部分，作者涵盖了机器学习流程和符号表示、用于空间和时间特征学习的2D和3D卷积神经网络。对于动作识别，作者首先介绍了经典的图像分类框架，然后详细阐述了基于图像和基于剪辑的2D/3D CNN网络如何用于动作识别。对于动作检测，作者详细讲解了滑动窗口、基于提议的检测方法、单阶段和双阶段方法、空间和时间动作定位，并介绍了相关数据集。在视频字幕生成部分，作者展示了基于语言的模型以及如何进行视频字幕生成的序列到序列学习。对于无监督特征学习，作者讨论了从有监督学习转向无监督学习的必要性，并介绍了如何设计更好的替代训练任务来学习视频表示。最后，本书介绍了诸如对比学习和基于变换器的掩码图像/视频建模等最新的自训练流程。本书提供了前瞻性的研究方向，旨在促进深度学习领域的视频理解研究成果的发展。 * 提供视频理解的深度学习技术概述； * 涵盖动作识别、动作定位、视频字幕生成等重要主题； * 介绍最前沿和最新的视频理解技术。

关于作者

吴祖轩于2020年获得马里兰大学计算机科学博士学位。他目前是复旦大学计算机科学学院的副教授，并曾任职于Facebook AI研究科学家。他的研究兴趣包括深度学习和大规模视频理解。由于其研究成果卓越，他曾获得2022年AI 2000最具影响力学者奖、2019年微软研究院博士奖学金（全球仅10人）和2017年Snap博士奖学金（全球仅10人）。姜育刚是复旦大学计算机科学学院的长江学者特聘教授。他的研究主要集中在多媒体、计算机视觉和稳健与可信赖的人工智能领域。作为上海智能视觉计算协同创新中心主任和复旦视觉与学习实验室（FVL）的负责人，他领导了一支致力于稳健与可信视觉分析的研究团队。他在顶级期刊和会议上发表了大量论文，引用次数超过25000次，H指数为79。他的研究成果对移动视觉搜索/识别和高速铁路基础设施的缺陷检测等应用产生了重大影响。他的工作获得了众多奖项，包括首届2014年ACM中国新星奖、2015年ACM SIGMM新星奖、多项最佳论文奖，以及来自中国自然科学基金会、教育部和上海市政府的各种荣誉。他拥有香港城市大学的计算机科学博士学位，并曾在哥伦比亚大学工作三年，之后于2011年加入复旦大学。他是国际模式识别学会（IAPR）和IEEE的当选会士。

成为VIP会员查看完整内容

52

相关内容

深度学习

机器学习的一个分支，它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【新书】大语言模型：导论，531页pdf

【新书】大语言模型：导论，531页pdf

专知会员服务

77+阅读 · 2024年9月20日

【新书】生成式人工智能模型，419页pdf

【新书】生成式人工智能模型，419页pdf

专知会员服务

112+阅读 · 2024年9月3日

【新书】深度学习的数学和架构，552页pdf

【新书】深度学习的数学和架构，552页pdf

专知会员服务

153+阅读 · 2024年4月25日

【2023新书】深度学习科学，362页pdf

【2023新书】深度学习科学，362页pdf

专知会员服务

114+阅读 · 2023年12月21日

【2023新书】多媒体数据处理与计算，197页pdf

【2023新书】多媒体数据处理与计算，197页pdf

专知会员服务

55+阅读 · 2023年10月31日

【2023新书】机器学习凸优化，379页pdf

【2023新书】机器学习凸优化，379页pdf

专知会员服务

125+阅读 · 2023年5月3日

【新书】分布式强化学习，280页pdf

【新书】分布式强化学习，280页pdf

专知会员服务

160+阅读 · 2021年12月19日

【新书】基于物理的深度学习，220页pdf

【新书】基于物理的深度学习，220页pdf

专知会员服务

160+阅读 · 2021年9月15日

【2021新书】深度学习计算机视觉，320页pdf

【2021新书】深度学习计算机视觉，320页pdf

专知会员服务

194+阅读 · 2021年5月20日

【干货书】高级应用深度学习，294页pdf

【干货书】高级应用深度学习，294页pdf

专知会员服务

154+阅读 · 2020年6月20日

【2023新书】医学影像人工智能前沿，300页pdf

【2023新书】医学影像人工智能前沿，300页pdf

专知

32+阅读 · 2023年4月9日

【2022新书】深度学习归一化技术，117页pdf

【2022新书】深度学习归一化技术，117页pdf

专知

28+阅读 · 2022年11月25日

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知

46+阅读 · 2022年11月5日

【干货书】基于深度学习的机器人感知与认知，638页pdf

【干货书】基于深度学习的机器人感知与认知，638页pdf

专知

17+阅读 · 2022年7月30日

【2022新书】应用深度学习：工具、技术与实现，355页pdf

【2022新书】应用深度学习：工具、技术与实现，355页pdf

专知

42+阅读 · 2022年7月26日

【Manning新书】可解释人工智能: 构建可解释机器学习系统，144页pdf

【Manning新书】可解释人工智能: 构建可解释机器学习系统，144页pdf

专知

11+阅读 · 2022年1月28日

【干货书】深度学习全面指南，307页pdf

【干货书】深度学习全面指南，307页pdf

专知

31+阅读 · 2022年1月6日

【新书】分布式强化学习，280页pdf

【新书】分布式强化学习，280页pdf

专知

22+阅读 · 2021年12月19日

【干货书】高维统计学，572页pdf

【干货书】高维统计学，572页pdf

专知

19+阅读 · 2021年12月3日

【新书】深度学习搜索，Deep Learning for Search，327页pdf

【新书】深度学习搜索，Deep Learning for Search，327页pdf

专知

85+阅读 · 2020年1月19日

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

33+阅读 · 2015年12月31日

面向交互式问答的省略恢复技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于记忆学习与免疫系统的仿生控制研究

国家自然科学基金

6+阅读 · 2015年12月31日

基因表达专题讲习班

国家自然科学基金

2+阅读 · 2015年4月30日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于机器学习的人脑MR图像结构区域层次化自动标记方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

477+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

VIP会员

相关主题

相关VIP内容

【新书】大语言模型：导论，531页pdf

【新书】大语言模型：导论，531页pdf

专知会员服务

77+阅读 · 2024年9月20日

【新书】生成式人工智能模型，419页pdf

【新书】生成式人工智能模型，419页pdf

专知会员服务

112+阅读 · 2024年9月3日

【新书】深度学习的数学和架构，552页pdf

【新书】深度学习的数学和架构，552页pdf

专知会员服务

153+阅读 · 2024年4月25日

【2023新书】深度学习科学，362页pdf

【2023新书】深度学习科学，362页pdf

专知会员服务

114+阅读 · 2023年12月21日

【2023新书】多媒体数据处理与计算，197页pdf

【2023新书】多媒体数据处理与计算，197页pdf

专知会员服务

55+阅读 · 2023年10月31日

【2023新书】机器学习凸优化，379页pdf

【2023新书】机器学习凸优化，379页pdf

专知会员服务

125+阅读 · 2023年5月3日

【新书】分布式强化学习，280页pdf

【新书】分布式强化学习，280页pdf

专知会员服务

160+阅读 · 2021年12月19日

【新书】基于物理的深度学习，220页pdf

【新书】基于物理的深度学习，220页pdf

专知会员服务

160+阅读 · 2021年9月15日

【2021新书】深度学习计算机视觉，320页pdf

【2021新书】深度学习计算机视觉，320页pdf

专知会员服务

194+阅读 · 2021年5月20日

【干货书】高级应用深度学习，294页pdf

【干货书】高级应用深度学习，294页pdf

专知会员服务

154+阅读 · 2020年6月20日

热门VIP内容

开通专知VIP会员享更多权益服务

模型提取攻击与防御的系统综述：最新进展与展望

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

【CMU博士论文】用于物理模拟的高效深度学习模型

大模型解决方案白皮书：社交陪伴场景全流程落地指南

相关资讯

【2023新书】医学影像人工智能前沿，300页pdf

【2023新书】医学影像人工智能前沿，300页pdf

专知

32+阅读 · 2023年4月9日

【2022新书】深度学习归一化技术，117页pdf

【2022新书】深度学习归一化技术，117页pdf

专知

28+阅读 · 2022年11月25日

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知

46+阅读 · 2022年11月5日

【干货书】基于深度学习的机器人感知与认知，638页pdf

【干货书】基于深度学习的机器人感知与认知，638页pdf

专知

17+阅读 · 2022年7月30日

【2022新书】应用深度学习：工具、技术与实现，355页pdf

【2022新书】应用深度学习：工具、技术与实现，355页pdf

专知

42+阅读 · 2022年7月26日

【Manning新书】可解释人工智能: 构建可解释机器学习系统，144页pdf

【Manning新书】可解释人工智能: 构建可解释机器学习系统，144页pdf

专知

11+阅读 · 2022年1月28日

【干货书】深度学习全面指南，307页pdf

【干货书】深度学习全面指南，307页pdf

专知

31+阅读 · 2022年1月6日

【新书】分布式强化学习，280页pdf

【新书】分布式强化学习，280页pdf

专知

22+阅读 · 2021年12月19日

【干货书】高维统计学，572页pdf

【干货书】高维统计学，572页pdf

专知

19+阅读 · 2021年12月3日

【新书】深度学习搜索，Deep Learning for Search，327页pdf

【新书】深度学习搜索，Deep Learning for Search，327页pdf

专知

85+阅读 · 2020年1月19日

相关基金

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

33+阅读 · 2015年12月31日

面向交互式问答的省略恢复技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于记忆学习与免疫系统的仿生控制研究

国家自然科学基金

6+阅读 · 2015年12月31日

基因表达专题讲习班

国家自然科学基金

2+阅读 · 2015年4月30日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于机器学习的人脑MR图像结构区域层次化自动标记方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

477+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员