摘要: 图像异常检测是计算机视觉领域的一个热门研究课题, 其目标是在不使用真实异常样本的情况下, 利用现有的正常样本构建模型以检测可能出现的各种异常图像, 在工业外观缺陷检测, 医学图像分析, 高光谱图像处理等领域有较高的研究意义和应用价值. 本文首先介绍了异常的定义以及常见的异常类型. 然后, 本文根据在模型构建过程中有无神经网络的参与, 将图像异常检测方法分为基于传统方法和基于深度学习两大类型, 并分别对相应的检测方法的设计思路、优点和局限性进行了综述与分析. 其次, 梳理了图像异常检测任务中面临的主要挑战. 最后, 对该领域未来可能的研究方向进行了展望.

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200956

成为VIP会员查看完整内容
0
12

相关内容

摘要: 随着互联网上多媒体数据的爆炸式增长,单一模态的检索已经无法满足用户需求,跨模态检索应运而生。跨模态检索旨在以一种模态的数据去检索另一种模态的相关数据,其核心任务是数据特征提取和不同模态间数据的相关性度量。文中梳理了跨模态检索领域近期的研究进展,从传统方法、深度学习方法、手工特征的哈希编码方法以及深度学习的哈希编码方法等角度归纳论述了跨模态检索领域的研究成果。在此基础上,对比分析了各类算法在跨模态检索常用标准数据集上的性能。最后,分析了跨模态检索研究存在的问题,并对该领域未来发展趋势以及应用进行了展望。

http://www.jsjkx.com/CN/10.11896/jsjkx.200800165

成为VIP会员查看完整内容
0
19

对话系统作为人机交互的重要方式,有着广泛的应用前景。现有的对话系统专注于解决语义一致性和内容丰富性等问题,对于提高人机交互以及产生人机共鸣方向的研究关注度不高。如何让生成的语句在具有语义相关性的基础上更自然地与用户交流是当前对话系统面临的主要问题之一。首先对对话系统进行了整体情况的概括。接着介绍了情感对话系统中的对话情绪感知和情感对话生成两大任务,并分别调研归纳了相关方法。对话情绪感知任务大致分为基于上下文和基于用户信息两类方法。情感对话生成的方法包括规则匹配算法、指定情感回复的生成模型和不指定情感回复的生成模型,并从情绪数据类别和模型方法等方面进行了对比分析。然后总结整理了两大任务下数据集的特点和链接便于后续的研究,并归纳了当前情感对话系统中不同的评估方法。最后对情感对话系统的工作进行了总结和展望。

http://fcst.ceaj.org/CN/abstract/abstract2684.shtml

成为VIP会员查看完整内容
0
28

摘要: 人脸亲子关系验证即通过给定的不同人的两幅人脸图像判断其是否具有亲子关系, 是计算机视觉和机器学习领域中一个重要的研究问题, 在丢失儿童寻找、社会媒体分析、图像自动标注等领域具有广泛的应用价值. 随着人脸亲子关系验证问题受到越来越多的关注, 其在多个方面都得到了相应的发展, 本文对人脸亲子关系验证方法做了综述整理. 首先, 简要介绍了人脸亲子关系验证在近十年的研究现状, 随后对问题进行了定义并讨论其面临的挑战. 接下来, 汇总了常用的亲子数据库, 对数据库属性做了详细的总结和对比. 然后, 对人脸亲子关系验证方法进行了分类总结、对比, 以及不同方法的性能表现. 最后, 展望了人脸亲子关系验证今后可能的研究方向.

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c201023

成为VIP会员查看完整内容
0
15

摘要: 作为人工智能领域的一个重要分支, 智能规划被广泛应用于机器人、工业生产、商业应用等领域。时态规划是智能规划的前沿子领域。本文从时态特征、规划方法、应用等三个角度出发, 对时态规划进行综述。与规划能力相比, 时态特征的发展已足够成熟; 基于启发式的状态空间搜索是目前的最佳选择; 研究人员仍在寻找更多更好的应用场景。本文旨在用通俗易懂的方式帮助入门学者快速认识时态规划。

成为VIP会员查看完整内容
0
30

摘要: 当前,以网络数据为代表的跨媒体数据呈现爆炸式增长的趋势,呈现出了跨模态、跨数据源的复杂关联及动态演化特性,跨媒体分析与推理技术针对多模态信息理解、交互、内容管理等需求,通过构建跨模态、跨平台的语义贯通与统一表征机制,进一步实现分析和推理以及对复杂认知目标的不断逼近,建立语义层级的逻辑推理机制,最终实现跨媒体类人智能推理。文中对跨媒体分析推理技术的研究背景和发展历史进行概述,归纳总结视觉-语言关联等任务的关键技术,并对研究应用进行举例。基于已有结论,分析目前跨媒体分析领域所面临的关键问题,最后探讨未来的发展趋势。

http://www.jsjkx.com/CN/10.11896/jsjkx.210200086

成为VIP会员查看完整内容
0
30

摘要: 图像修复是计算机视觉领域中极具挑战性的研究课题。近年来,深度学习技术的发展推动了图像修复性能的显著提升,使得图像修复这一传统课题再次引起了学者们的广泛关注。文章致力于综述图像修复研究的关键技术。由于深度学习技术在解决“大面积缺失图像修复”问题时具有重要作用并带来了深远影响,文中在简要介绍传统图像修复方法的基础上,重点介绍了基于深度学习的修复模型,主要包括模型分类、优缺点对比、适用范围和在常用数据集上的性能对比等,最后对图像修复潜在的研究方向和发展动态进行了分析和展望。

http://www.jsjkx.com/CN/10.11896/jsjkx.210100048

成为VIP会员查看完整内容
0
30

随着信息技术的快速发展,网络攻击逐渐呈现多阶段、分布式和智能化的特性,单一的防火墙、入侵检测系统等传统网络防御措施不能很好地保护开放环境下的网络系统安全。网络攻击模型作为一种攻击者视角的攻击场景表示,能够综合描述复杂多变环境下的网络攻击行为,是常用的网络攻击分析与应对工具之一。本文首先介绍主要网络攻击模型,包括传统树、图、网结构模型和现代杀伤链、ATT&CK、钻石模型等;然后再对网络攻击模型的分析与应用进行说明,其中以求解攻击指标为目的的分析过程主要包括概率框架、赋值方法和求解方法,基于生命周期的攻击模型应用则包括了攻击者视角和防守者视角的应用过程;最后总结了网络攻击模型及其分析应用的现有挑战与未来方向。

http://www.sicris.cn/CN/abstract/abstract862.shtml

成为VIP会员查看完整内容
1
22

近年来,三维人脸识别研究取得了较大进展.相比 二维人脸识别,三维人脸识别更具有优势,主要特点是在识 别中利用了三维形状数据.该文首先根据三维形状数据的 来源,将三维人脸识别分为基于彩色图像的三维人脸识别、 基于高质 量 三 维 扫 描 数 据 的 三 维 人 脸 识 别、基 于 低 质 量 RGBGD图像的三维人脸识别,分别阐述了各自具有代表性 的方法及其优缺点;其次分析了深度学习在三维人脸识别 中的应用方式;然后分析了三维人脸数据与二维图像在双 模态人脸识别中的融合方法,并介绍了常用的三维人脸数 据库;最后 讨 论 了 三 维 人 脸 识 别 面 临 的 主 要 困 难 及 发 展 趋势.

http://jst.tsinghuajournals.com/CN/Y2021/V61/I1/77

成为VIP会员查看完整内容
0
22

我们生活在一个由大量不同模态内容构建而成的多媒体世界中,不同模态信息之间具有高度的相关性和互补性,多模态表征学习的主要目的就是挖掘出不同模态之间的共性和特性,产生出可以表示多模态信息的隐含向量.该文章主要介绍了目前应用较广的视觉语言表征的相应研究工作,包括传统的基于相似性模型的研究方法和目前主流的基于语言模型的预训练的方法.目前比较好的思路和解决方案是将视觉特征语义化然后与文本特征通过一个强大的特征抽取器产生出表征,其中Transformer[1]作为主要的特征抽取器被应用表征学习的各类任务中.文章分别从研究背景、不同研究方法的划分、测评方法、未来发展趋势等几个不同角度进行阐述.

http://www.jos.org.cn/jos/ch/reader/view_abstract.aspx?file_no=6125&flag=1

成为VIP会员查看完整内容
0
80

摘要: 行人重识别是近年来计算机视觉领域的热点问题, 经过多年的发展, 基于可见光图像的一般行人重识别技术已经趋近成熟. 然而, 目前的研究多基于一个相对理想的假设, 即行人图像都是在光照充足的条件下拍摄的高分辨率图像. 因此虽然大多数的研究都能取得较为满意的效果, 但在实际环境中并不适用. 多源数据行人重识别即利用多种行人信息进行行人匹配的问题. 除了需要解决一般行人重识别所面临的问题外, 多源数据行人重识别技术还需要解决不同类型行人信息与一般行人图片相互匹配时的差异问题, 如低分辨率图像、红外图像、深度图像、文本信息和素描图像等. 因此, 与一般行人重识别方法相比, 多源数据行人重识别研究更具实用性, 同时也更具有挑战性. 本文首先介绍了一般行人重识别的发展现状和所面临的问题, 然后比较了多源数据行人重识别与一般行人重识别的区别, 并根据不同数据类型总结了5 类多源数据行人重识别问题, 分别从方法、数据集两个方面对现有工作做了归纳和分析. 与一般行人重识别技术相比, 多源数据行人重识别的优点是可以充分利用各类数据学习跨模态和类型的特征转换. 最后, 本文讨论了多源数据行人重识别未来的发展.

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190278

成为VIP会员查看完整内容
0
24
小贴士
相关VIP内容
专知会员服务
19+阅读 · 8月13日
专知会员服务
28+阅读 · 5月21日
专知会员服务
15+阅读 · 5月20日
专知会员服务
30+阅读 · 5月4日
专知会员服务
30+阅读 · 3月11日
专知会员服务
30+阅读 · 3月9日
专知会员服务
22+阅读 · 2020年12月28日
专知会员服务
22+阅读 · 2020年12月16日
专知会员服务
80+阅读 · 2020年12月3日
专知会员服务
24+阅读 · 2020年11月2日
相关资讯
图像修复研究进展综述
专知
5+阅读 · 3月9日
小目标检测技术研究综述
专知
4+阅读 · 2020年12月7日
多模态视觉语言表征学习研究综述
专知
10+阅读 · 2020年12月3日
领域知识图谱研究综述
专知
9+阅读 · 2020年8月2日
实体关系抽取方法研究综述
专知
5+阅读 · 2020年7月19日
深度学习可解释性研究进展
专知
10+阅读 · 2020年6月26日
全面梳理:图像配准综述
极市平台
4+阅读 · 2019年12月13日
【综述】迁移自适应学习十年进展
专知
33+阅读 · 2019年11月26日
计算机视觉方向简介 | 目标检测最新进展总结与展望
计算机视觉life
6+阅读 · 2018年10月28日
相关论文
Gregory Yauney,David Mimno
0+阅读 · 9月15日
Qi Li,Luoyi Fu,Xinbing Wang,Chenghu Zhou
0+阅读 · 9月14日
Abhilash Nandy,Soumya Sharma,Shubham Maddhashiya,Kapil Sachdeva,Pawan Goyal,Niloy Ganguly
0+阅读 · 9月13日
One-Class Classification: A Survey
Pramuditha Perera,Poojan Oza,Vishal M. Patel
6+阅读 · 1月8日
Jianzhu Guo,Xiangyu Zhu,Chenxu Zhao,Dong Cao,Zhen Lei,Stan Z. Li
5+阅读 · 2020年3月17日
A Survey on The Expressive Power of Graph Neural Networks
Ryoma Sato
5+阅读 · 2020年3月9日
Yu Cao,Meng Fang,Baosheng Yu,Joey Tianyi Zhou
5+阅读 · 2019年11月13日
Deep Learning in Video Multi-Object Tracking: A Survey
Gioele Ciaparrone,Francisco Luque Sánchez,Siham Tabik,Luigi Troiano,Roberto Tagliaferri,Francisco Herrera
35+阅读 · 2019年7月31日
Maria-Florina Balcan,Yi Li,David P. Woodruff,Hongyang Zhang
3+阅读 · 2018年10月18日
Hongshen Chen,Xiaorui Liu,Dawei Yin,Jiliang Tang
10+阅读 · 2018年1月11日
Top