https://www.ccf.org.cn/Focus/2023-11-29/798503.shtml

视觉系统是大脑神经系统的一个重要组成部分,人类从外界获得的信息约丷丰严以 上来自于视觉系统。视皮层及直接关联区域约占大脑皮层的三分之一,不仅负责视觉 信息的提取、处理和整合,同时也是学习、记忆、决策和情感等高级脑功能形成的基 础。相比于计算机视觉算法,人脑视觉系统在很多方面有独特的优势,例如人脑可以 毫不费力地识别成千上万种物体,但是物体识别对于机器视觉来说却是一个富有挑战 性的难题。生物视觉系统经过数亿年的进化,其中的眼睛、视觉通路和视皮层等结构、 功能和工作机制都非常精妙,能够在消耗极少能量的同时快速完成许多复杂任务。生 物视觉系统会在复杂的外界环境中提取出有意义的模式,而包含丰富时空信息的脉冲 信号是视觉系统信息处理的基础。如何有效借鉴生物巧妙的视觉系统,实现低功耗、 低延迟和高鲁棒性的类脑视觉计算是人工智能发展的重要途径之一。为实现更具生物视觉系统特性的高效机器视觉,将围绕脉冲视觉中的编码及处理 展开研究。首先探索视网膜编码视觉刺激的工作机理这个科学问题,再面向仿生物 视网膜的视觉传感器研究如何构建基于脉冲的超高速视觉算法。本文的主要贡献点包括:

提出了基于卷积神经网络的简单刺激单细胞编码模型,揭示了卷积神经网络与 生物视网膜环路的相似性,可精确预测视网膜对白噪声和自然图片刺激的脉冲 响应。无论是在不同细胞数据之间的迁移学习,还是在不同统计特性的刺激 之间迁移,具有良好视网膜响应预测性能的乃乎乎模型都表现出了较好的泛化能 力。此外,在模拟单个细胞编码功能时,随着网络层数或是神经元个数的增加 网络性能会趋于饱和。相比传统生物物理模型,模型拟合性能对数据样本量和 噪声的影响都更加鲁棒。揭示了一个三层的卷积神经网络可相当于一个视网膜 神经元。

提出了基于卷积循环神经网络的复杂刺激群体细胞编码模型,揭示了网络的循 环连接结构是影响视网膜编码的关键因素,可高精度地预测大规模视网膜神经 节细胞对动态自然场景的响应,并同时学习出各个神经节细胞感受野的形状与 位置。所提出的卷积循环编码网络除了在结构上更加接近视网膜,还可以使用 更少的参数学习出精度更高的编码模型。这一模型不仅具有生物学价值,而且 对设计新一代脉冲视觉模型、芯片乃至研制视网膜假体都具有重要意义。

提出了基于短时程可塑性模型的脉冲视觉图像重构算法,仿照大脑中的短时程 可塑性机制动态记录脉冲流的时间特性,在不受统计时间窗口长度的限制下,既保留脉冲相机低时间延迟的特性,又可获得低噪声、少动态模糊的高质量重 构图像。所提出方法可根据脉冲相机产生的脉冲流特性,动态调整神经元的状 态,从而推导出场景像素值。此外,还分析了如何权衡地减少静态区域的噪声 和动态区域的模糊,及如何减少脉冲相机读出信号时产生的噪声。实验表明, 所提出的重构算法在主观和定量的评价结果上都优于现有的脉冲相机重构算 法。 提出了超高速脉冲视觉检测跟踪框架,能够以无监督地方式直接处理脉冲流信 息,在线动态调节脉冲神经网络状态以实现对多个超高速目标的连续跟踪。通 过依次引入动态适应层、运动估计模块和基于脉冲神经元的物体检测跟踪层, 构建了三个面向脉冲视觉的多目标检测跟踪算法。其中第一种算法的复杂度较 低,主要面向类似于监控或者定点监测等相机固定的高速场景。而后两种算法 中包含基于脉冲神经元的运动估计模块,可以适用于包含相机自运动的场景。这些基于脉冲信号的检测跟踪算法可便于移植至神经形态计算平台,同时发挥 神经形态视觉传感器与计算平台的低功耗、低延迟优势。

综合对生物视觉系统工作机理的探索,与面对脉冲视觉的超高速视觉算法的研 发,设计了一套超高速脉冲视觉演示验证系统。从系统实现的角度对上述面向脉冲 视觉的创新性方法及其特点和适用范围进行了整理和归纳,以便用户可以根据具体的 场景需求获取超高速场景中的关键信息,如进行超高速运动/变化过程的科学观测,超 高速运动目标的追踪等。最后,以超高速目标打击和高速激光追踪作为本工作所提出 系统的典型应用案例,介绍如何实现从本文方法到实际超高速应用的技术转化。

成为VIP会员查看完整内容
19

相关内容

计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【博士论文】高性能并发图计算优化技术研究
专知会员服务
29+阅读 · 2023年12月13日
《多智能体系统中的目标管理》莱特州立大学博士论文
专知会员服务
61+阅读 · 2022年11月25日
【博士论文】基于深度学习的单目场景深度估计方法研究
【博士论文】多视光场光线空间几何模型研究
专知会员服务
21+阅读 · 2021年12月6日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
28+阅读 · 2021年12月3日
专知会员服务
55+阅读 · 2020年12月20日
【博士论文】解耦合的类脑计算系统栈设计
专知会员服务
29+阅读 · 2020年12月14日
【博士论文】辨识性特征学习及在细粒度分析中的应用
专知会员服务
29+阅读 · 2020年12月10日
哈工大韩纪庆教授《语音信号处理(第3版)》出版
【优青论文】视觉问答技术研究
计算机研究与发展
13+阅读 · 2018年9月21日
【优青论文】深度神经网络压缩与加速综述
计算机研究与发展
14+阅读 · 2018年9月20日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
A Survey of Large Language Models
Arxiv
326+阅读 · 2023年3月31日
VIP会员
相关VIP内容
【博士论文】高性能并发图计算优化技术研究
专知会员服务
29+阅读 · 2023年12月13日
《多智能体系统中的目标管理》莱特州立大学博士论文
专知会员服务
61+阅读 · 2022年11月25日
【博士论文】基于深度学习的单目场景深度估计方法研究
【博士论文】多视光场光线空间几何模型研究
专知会员服务
21+阅读 · 2021年12月6日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
28+阅读 · 2021年12月3日
专知会员服务
55+阅读 · 2020年12月20日
【博士论文】解耦合的类脑计算系统栈设计
专知会员服务
29+阅读 · 2020年12月14日
【博士论文】辨识性特征学习及在细粒度分析中的应用
专知会员服务
29+阅读 · 2020年12月10日
微信扫码咨询专知VIP会员