【哥伦比亚大学博士论文】面向计算机视觉中实际约束条件的模型适应通用框架，140页pdf - 专知VIP

会员服务 ·

14

计算机视觉 · 深度学习 ·

2024 年 2 月 8 日

【哥伦比亚大学博士论文】面向计算机视觉中实际约束条件的模型适应通用框架，140页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

近期在深度学习模型方面的进步在各种计算机视觉任务中展示了令人印象深刻的能力，这鼓励了将这些模型整合到真实世界的视觉系统中，例如智能设备。这种整合带来了新的挑战，因为模型需要满足复杂的真实世界要求。本论文致力于构建实用的深度学习模型，我们关注视觉系统中的两个主要挑战：数据效率和变异性。我们通过提供一个通用的模型适应框架来解决这些问题，该框架扩展了模型的实用功能。

在论文的第一部分，我们探索了用于高效表示的模型适应方法。我们阐述了不同类型的高效数据表示的好处，包括来自视频编解码器的压缩视频模态、低比特特征以及稀疏化的帧和文本。通过使用这种高效的表示，系统复杂性如数据存储、处理和计算可以大大减少。我们系统地研究了提取、学习和利用这些表示的各种方法，提出了新方法来使机器学习模型适应它们。提出的方法包括一个具有粗到细蒸馏训练策略的压缩域视频识别模型、一个针对低比特视频和语言理解的任务特定特征压缩框架，以及一个可学习的令牌稀疏化方法，用于稀疏化人类可解释的视频输入。我们展示了在各种应用中以更实用和高效的方式表示视觉数据的新视角。论文的第二部分关注开放环境挑战，我们探索了模型适应新的、未见过的类别和领域。我们考察了当前识别模型中的实际限制，并引入了各种方法来增强模型在处理开放识别场景中的能力。这包括一个用于管理新类别和异常值的负面设想框架，以及一个用于处理未见领域数据的多域转换方法。我们的研究显示了一条朝向模型在真实世界应用中通过多样化数据环境导航的有希望的轨迹。

https://academiccommons.columbia.edu/doi/10.7916/hz0n-pa15

成为VIP会员查看完整内容

25

相关内容

计算机视觉

计算机视觉

计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【博士论文】面向计算机视觉中实践约束的模型适应通用框架，140页pdf

【博士论文】面向计算机视觉中实践约束的模型适应通用框架，140页pdf

专知会员服务

25+阅读 · 2024年2月21日

【牛津大学博士论文】组合优化和接触追踪的模仿学习，229页pdf

【牛津大学博士论文】组合优化和接触追踪的模仿学习，229页pdf

专知会员服务

28+阅读 · 2023年11月14日

【MIT博士论文】垂直领域生成式模型，107页pdf

【MIT博士论文】垂直领域生成式模型，107页pdf

专知会员服务

68+阅读 · 2023年11月13日

【牛津大学博士论文】多模态深度学习在计算机视觉及其应用，138页pdf

【牛津大学博士论文】多模态深度学习在计算机视觉及其应用，138页pdf

专知会员服务

64+阅读 · 2023年11月7日

【伯克利博士论文】视觉和机器人的可扩展表示，125页pdf

【伯克利博士论文】视觉和机器人的可扩展表示，125页pdf

专知会员服务

32+阅读 · 2023年9月27日

【芝加哥博士论文】深度生成模型:设计、改进和应用，149页pdf

【芝加哥博士论文】深度生成模型:设计、改进和应用，149页pdf

专知会员服务

48+阅读 · 2023年9月11日

【伯克利博士论文】多模态长视频理解，126页pdf

【伯克利博士论文】多模态长视频理解，126页pdf

专知会员服务

49+阅读 · 2023年9月3日

【斯坦福博士论文】面向医学图像分析的标签高效机器学习，214页pdf

【斯坦福博士论文】面向医学图像分析的标签高效机器学习，214页pdf

专知会员服务

57+阅读 · 2023年6月9日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

113+阅读 · 2022年10月6日

【博士论文】具有关系和上下文信息的因子分解模型，178页pdf

专知会员服务

35+阅读 · 2021年9月13日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

专知

9+阅读 · 2023年4月12日

【MIT博士论文】情感理解的计算框架，200页pdf

【MIT博士论文】情感理解的计算框架，200页pdf

专知

0+阅读 · 2023年4月9日

【牛津大学博士论文】深度学习在基于结构的药物发现中的应用，362页pdf

【牛津大学博士论文】深度学习在基于结构的药物发现中的应用，362页pdf

专知

1+阅读 · 2023年4月8日

【牛津大学博士论文】风险敏感且鲁棒的基于模型的强化学习与规划，201页pdf

【牛津大学博士论文】风险敏感且鲁棒的基于模型的强化学习与规划，201页pdf

专知

4+阅读 · 2023年4月7日

【斯坦福博士论文】深度学习核编译为局部感知数据流，109页pdf

【斯坦福博士论文】深度学习核编译为局部感知数据流，109页pdf

专知

5+阅读 · 2023年4月5日

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知

45+阅读 · 2022年11月5日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

【干货书】《机器学习动力系统与控制》，572页pdf

【干货书】《机器学习动力系统与控制》，572页pdf

专知

35+阅读 · 2022年1月8日

深度多模态表示学习综述论文，22页pdf

深度多模态表示学习综述论文，22页pdf

专知

33+阅读 · 2020年6月21日

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

视觉信息的局部特征表示及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于部件结构的图像协同分割方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

三维空间中基于图结构的人体姿态估计算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

复杂场景下目标跟踪的表观建模研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

VIP会员

相关主题

计算机视觉

相关VIP内容

【博士论文】面向计算机视觉中实践约束的模型适应通用框架，140页pdf

【博士论文】面向计算机视觉中实践约束的模型适应通用框架，140页pdf

专知会员服务

25+阅读 · 2024年2月21日

【牛津大学博士论文】组合优化和接触追踪的模仿学习，229页pdf

【牛津大学博士论文】组合优化和接触追踪的模仿学习，229页pdf

专知会员服务

28+阅读 · 2023年11月14日

【MIT博士论文】垂直领域生成式模型，107页pdf

【MIT博士论文】垂直领域生成式模型，107页pdf

专知会员服务

68+阅读 · 2023年11月13日

【牛津大学博士论文】多模态深度学习在计算机视觉及其应用，138页pdf

【牛津大学博士论文】多模态深度学习在计算机视觉及其应用，138页pdf

专知会员服务

64+阅读 · 2023年11月7日

【伯克利博士论文】视觉和机器人的可扩展表示，125页pdf

【伯克利博士论文】视觉和机器人的可扩展表示，125页pdf

专知会员服务

32+阅读 · 2023年9月27日

【芝加哥博士论文】深度生成模型:设计、改进和应用，149页pdf

【芝加哥博士论文】深度生成模型:设计、改进和应用，149页pdf

专知会员服务

48+阅读 · 2023年9月11日

【伯克利博士论文】多模态长视频理解，126页pdf

【伯克利博士论文】多模态长视频理解，126页pdf

专知会员服务

49+阅读 · 2023年9月3日

【斯坦福博士论文】面向医学图像分析的标签高效机器学习，214页pdf

【斯坦福博士论文】面向医学图像分析的标签高效机器学习，214页pdf

专知会员服务

57+阅读 · 2023年6月9日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

113+阅读 · 2022年10月6日

【博士论文】具有关系和上下文信息的因子分解模型，178页pdf

专知会员服务

35+阅读 · 2021年9月13日

热门VIP内容

开通专知VIP会员享更多权益服务

【ICCV2025】基于奖励引导解码的多模态大语言模型控制

【CMU博士论文】基于深度学习的高效贝叶斯实验设计

《数据安全国家标准体系（2025版）》征求意见稿

2025年中国AI算力基础设施发展趋势洞察

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

专知

9+阅读 · 2023年4月12日

【MIT博士论文】情感理解的计算框架，200页pdf

【MIT博士论文】情感理解的计算框架，200页pdf

专知

0+阅读 · 2023年4月9日

【牛津大学博士论文】深度学习在基于结构的药物发现中的应用，362页pdf

【牛津大学博士论文】深度学习在基于结构的药物发现中的应用，362页pdf

专知

1+阅读 · 2023年4月8日

【牛津大学博士论文】风险敏感且鲁棒的基于模型的强化学习与规划，201页pdf

【牛津大学博士论文】风险敏感且鲁棒的基于模型的强化学习与规划，201页pdf

专知

4+阅读 · 2023年4月7日

【斯坦福博士论文】深度学习核编译为局部感知数据流，109页pdf

【斯坦福博士论文】深度学习核编译为局部感知数据流，109页pdf

专知

5+阅读 · 2023年4月5日

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知

45+阅读 · 2022年11月5日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

【干货书】《机器学习动力系统与控制》，572页pdf

【干货书】《机器学习动力系统与控制》，572页pdf

专知

35+阅读 · 2022年1月8日

深度多模态表示学习综述论文，22页pdf

深度多模态表示学习综述论文，22页pdf

专知

33+阅读 · 2020年6月21日

相关基金

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

视觉信息的局部特征表示及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于部件结构的图像协同分割方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

三维空间中基于图结构的人体姿态估计算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

复杂场景下目标跟踪的表观建模研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员