美海军正通过投资深度学习分类技术,弥补声学环境分类领域的创新不足,旨在提升本舰声学监测(OSAM)系统效能。基于海军水面作战中心卡德洛克分部(NSWCCD)数据,研究采用梅尔尺度短时傅里叶变换与小波变换声景数据进行建模,并与城市环境声景数据进行对比分析。结果表明:卷积神经网络能有效实现舰船声景分类(准确率达99%),其舰船数据处理效能甚至优于城市环境声景分类。

图3.1 手工标注的舰船完整音频.wav文件片段(Audacity软件界面展示)​

当前人工智能技术关注度达到空前水平,亚马逊Alexa与谷歌助手等日常化机器学习(ML)产品普及,使公众更直观认知AI潜力。美国国防部尤其重视将AI/ML技术应用于传统认为不可解或成本过高的难题。计算机科学领域特别是ML与深度学习技术的进步,为海军舰船声学监测提供创新契机。舰载传感器产生的海量原始数据已超越现有声学特征分析方法的处理能力,亟需开发能充分挖掘数据价值的新方法。

OSAM作为海上作战关键子系统,其声学特征感知能力直接影响作战环境掌控。特定任务(尤其是水下行动)要求舰船保持隐蔽性,这要求精确掌握自身声学特征。噪声强度监测与异常声学信号识别的精度,直接决定任务成败——战术层面更关乎舰船安危。微观层面,先进声学监测技术能提升舰员生活质量:通过降低设备操作员认知负荷、减少误报率,增强态势感知能力并提高平台安全性。声学监测技术的持续优化还将促进新特征信号的发现与解析,强化海军声学域作战能力。

在AI技术被寄望解决传统难题的背景下,神经网络对人类未察觉模式的识别能力引发工业界(尤其是国防部门)高度关注。尽管AI蕴含巨大潜力,仍需持续优化ML技术方法以保持技术领先优势。本声景分类项目兼具双重使命:一是探索舰船声景分类这一特殊课题,二是验证卷积神经网络(CNN)在此场景的有效性。通过对比深度学习技术处理通用环境声景与舰船声学数据的效能差异,项目将揭示声景特征细微差异下的分类技术挑战,为后续研究提供基准。

本研究基于Andrew Pfau在论文《基于深度卷积神经网络的水下声景多标签分类研究》[1]所奠定的理论基础。项目采用的舰船声景分类技术(包括卷积神经网络架构设计与部分数据输入管道)均源自其水下声景研究成果。Pfau的论文论证了定制化CNN在水下舰船声学分类中相较传统CNN的优越性能,而本研究旨在扩展该定制CNN在不同声景分类中的应用,重点评估人工智能与深度学习技术在本舰声学监测(OSAM)中的可行性。

利用海军水面作战中心卡德洛克分部(NSWCCD)提供的音频数据,通过六类独特声景实现舰船声态分类。原始音频数据将分别进行短时傅里叶变换(STFT)与连续小波变换(CWT)处理。分类器将基于两种变换后的舰船声学数据训练,并将其效能与坦佩雷大学音频研究组发布的STFT/CWT城市环境声景数据[2]进行对比,以明确:(1)何种时序表征更适用于舰船音频分类;(2)舰船声景分类与多样化城市声景分类的差异性。

本研究致力于解答以下问题:

  1. CNN结合STFT声学数据能否可靠分类舰船声景?
  2. CNN结合小波变换声学数据能否可靠分类舰船声景?
  3. STFT与小波变换音频数据的分类性能差异如何?
  4. 该差异(若存在)是否同样体现于城市环境声景数据?
  5. 舰船数据与城市环境数据的分类技术性能对比结果如何?

通过训练CNN模型处理STFT与小波变换音频数据,基于准确率等统计指标评估模型性能。此对比分析将验证深度学习在声学域的适用性,并为后续舰船声景分类与OSAM模型优化提供基础。研究主要贡献包括:
• 首次将深度学习技术应用于舰船声学环境分类,其中小波变换声学数据的应用为新兴研究方向;

• 构建处理原始音频数据与小波变换的代码库;

• 开发PCA主成分分析与t-SNE聚类可视化框架,供后续研究使用。

第二章系统综述声景分类方法,聚焦梅尔尺度STFT与Morlet小波变换技术;第三章详述受前人研究启发的数据处理流程、CNN架构与分类方法;第四章对方法性能进行量化分析;第五章总结研究成果,并基于结论提出未来研究方向。

成为VIP会员查看完整内容
2

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《反潜战中的效能评估研究​》最新77页报告
专知会员服务
11+阅读 · 5月19日
红外弱小目标处理研究获进展
中科院之声
18+阅读 · 2017年11月19日
雷达海面目标识别技术研究进展
科技导报
21+阅读 · 2017年11月13日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
461+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
168+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员