本文是一篇计算机论文,本文围绕海战场目标识别深度学习模型的测试展开,并提出了多项创新性方法,为未来在复杂环境中应用智能无人装备提供了技术基础和理论支持。随着海战场环境的日益复杂化,进一步对海战场目标识别深度学习展开测试和优化,仍然是未来关键研究方向之一。
第一章 绪论
1.1 研究背景、目的与意义
1.1.1 研究背景
人工智能(Artificial Intelligence,AI)作为人类有史以来最具有颠覆性、彻底性的技术,对世界经济、政治、军事和社会生产等产生深远影响。近十年来,深度学习(Deep Learning,DL)/深度神经网络(Deep Neural Networks,DNN)为代表的人工智能技术在不同应用领域得到长足发展,如计算机视觉、自然语言处理、决策推理、医疗诊断和无人驾驶等领域,逐渐成为人工智能领域的关键技术。在某些方面,DNN的能力达到甚至超过人类水平[1]。
在新形势下,为了抓住新的工业革命历史机遇,世界各主要国家纷纷制定相应的发展战略,2019年2月美国总统特朗普签署《美国人工智能计划》行政命令,作为指导美国人工智能发展的战略框架。2019年10月俄罗斯总统普京签署并通过了《2030年前国家人工智能发展战略》,旨在加快人工智能发展进程,提高俄罗斯在世界人工智能领域的独立性、创新性。党的二十大提出“坚持机械化信息化智能化融合发展”“研究掌握信息化智能化战争特点规律”等部署。这些战略的提出标志着人工智能技术已经上升至国家竞争的战略层面上来。
1.2 国内外研究现状
论文以海战场目标识别深度学习模型的测试技术为研究对象,本部分主要从测试充分性理论研究现状、智能软件测试技术研究现状两个方面展开,并指出目前存在的问题。
1.2.1 测试充分性理论研究现状
在传统的软件测试中,测试充分性用来度量一个测试数据集T是否能验证软件P满足其需求,当该测试数据集T满足准则C时,则认为其相对于C是充分的[7]。其中,测试覆盖率是衡量测试充分性的重要指标之一,它包括路径覆盖、语句覆盖、块覆盖、分支判定覆盖等。与传统软件的面向过程或对象的编程范式不同,DNN内部逻辑结构在很大程度上是由训练数据塑造的,使得传统的软件测试覆盖指标并不能直接应用于DNN的测试。于是,研究人员开始尝试提出适用于DNN测试的覆盖指标。基于测试充分性理论的测试技术如表1.1所示。
第二章 相关背景知识
2.1 卷积神经网络
2.1.1 卷积神经网络思想
在生物学上,感受野(Receptive Field)是指在视觉神经系统中,神经元只接受特定刺激区域内的信号。受感受野的机理启发,研究人员提出了一种具有局部感知能力的卷积神经网络[48](Convolutional Neural Network,CNN),它可以广泛应用图像识别、目标检测和语义分割等计算机视觉任务。
2.1.2 卷积神经网络结构
通常,CNN由输入层、卷积层、池化层、激活层、全连接层和输出层交错、堆叠而成。CNN的整体结构如图2.1所示。
2.2 常见的数据集
目标识别常用的数据集有ImageNet[13]、The PASCAL Visual Object Classes[49](PASCAL VOC)、Open Images Dataset[50]和Common Objects in Context[51](MS COCO)等。它们的出现,为以深度学习为代表的人工智能技术发展提供强大的数据支撑。
(1)ImageNet数据集
ImageNet是当时世界上最大的计算机视觉图像识别研究的可视化数据库,由美国斯坦福大学的人工智能科学家Feifei Li于2009年在计算机视觉与模式识别(CVPR)会议上发布,该数据集包含约1500万张图片,20000类,图像可按照场景或物体进行分类,包括城市、乡村、海滩、沙漠、海洋、交通工具、动物和植物等。ImageNet数据集一般可用于图像分类、图像分割、目标检测、视频目标检测和场景分类等任务,它的出现极大地推动了深度学习和计算机视觉的研究进步,特别是对卷积神经网络CNN的发展有着深远的影响。然而ImageNet数据集并不完美,其标签存在大量噪声,且其本身是一个单标签基准的数据集。
(2)PASCAL VOC数据集
PASCAL VOC是一个世界范围的计算机视觉挑战赛。从2005年到2012年期间每年都会举行一场关于图像识别的挑战赛,它极大地推动了图像识别、目标检测等计算机视觉任务的研究,如R-CNN和YOLO系列目标检测模型都是基于该挑战赛及其数据集推出的。PASCAL VOC数据集常见的版本是VOC2007和VOC2012,数据集中的目标可分为4个大类和20个小类,基本涵盖了生活中典型的对象,如人类、猫、狗、轮船、飞机、汽车等。
第三章 海战场目标识别数据集构建技术 ....................... 21
3.1 数据集介绍 .............................. 21
3.2 数据集图像采集 ................................. 22
第四章 海战场目标识别模型蜕变测试技术 ......................... 47
4.1 深度膨胀卷积变分编码器 ........................ 4
4.1.1 从 VAE 到 DC-VAE ......................... 47
4.1.2 DC-VAE网络结构 ............................. 52
第五章 海战场目标识别模型蜕变测试技术验证 ................. 64
5.1 实验准备 ............................. 64
5.1.1 实验环境配置 ........................... 64
5.1.2 实验度量指标 .............................. 64
第五章 海战场目标识别模型蜕变测试技术验证
5.1 实验准备
5.1.1 实验环境配置
海战场目标识别模型蜕变测试技术实验验证代码主要在Windows10操作系统环境下使用Python语言编写,并基于常见的深度学习框架Pytorch实现,用到的Python库有Matplotlib、numpy、opencv-python和ultralytics等,训练阶段使用两块NVIDIA Quadro RTX 8000显卡完成,具体的软硬件实验环境如表5.1所示。
第六章 总结与展望
6.1 论文总结
深度学习模型由于其复杂的内部结构和不透明的运行机制,导致在其应用过程中常伴随着难以预见的风险。在战场环境下,这些风险因环境的复杂性、不确定性及对抗性而被进一步放大,使得智能无人装备领域的人工智能应用长期面临“难以信任”的问题。因此,本文围绕海战场环境下的目标识别深度学习模型测试展开,旨在发现模型在复杂环境中精度下降和安全性方面的挑战。具体研究内容如下:
(1)构建了适用于海战场目标识别的专用数据集,并采用了多种数据采集和处理技术,包括Python爬虫获取数据以及视频资源帧提取等。为了解决数据集样本不足和类别不平衡问题,提出了基于传统数据增强方法和拉普拉斯滤波器的数据增强技术。相比于传统方法,拉普拉斯滤波器能更好地保留图像细节,在噪声环境下有效提升数据质量。
(2)传统软件测试方法难以直接应用于深度学习模型,特别是在海战场环境中,受光照、天气和海况等因素影响,目标识别模型面临诸多挑战。为此,本文提出了基于深度膨胀卷积变分自编码器(DC-VAE)算法的蜕变测试方法和构建复杂多样的蜕变关系,生成了大量符合实际海战场环境的衍生测试用例。实验验证了这些衍生样本的高质量和真实性,为模型提供了多样化的测试场景。
(3)基于DC-VAE算法的Meta-VAE蜕变测试框架,为测试用例的生成、评估和判定提供了系统化的流程。框架通过自动化生成衍生测试用例,减少了人工干预,提升了测试效率和测试覆盖率。实验结果表明,蜕变测试技术能够有效检测出模型在实际应用中潜在的缺陷,提高了模型在复杂海战场环境中的鲁棒性和可靠性。
参考文献(略)