一种深度神经网络SAR遮挡目标识别方法研究

发布时间:2015-05-28 11:32:01 论文编辑:lgg
未来战争必然是侦察与反侦察技术的对抗,合成孔径雷达(syntheticapertureradar,SAR)作为一种新型微波遥感成像系统,具有全天候、全天时和强投射等优点,同时特殊的成像机制也导致存在大量部分遮挡的SAR目标图像亟待处理,而对部分遮挡SAR目标的识别则是其中最为关键的技术难题。首先对SAR图像做预处理,然后提取预处理后SAR目标的小波域低频子带图像作为训练数据,最后利用深层稀疏编码模型进一步提取SAR遮挡目标的有效特征向量作为目标的特征以完成目标识别。采用MSTAR数据库中的3类目标进行目标遮挡模拟及识别实验。结果表明,新方法可以综合利用遮挡目标的局部和整体结构信息以提高目标的正确识别率,是一种有效的SAR遮挡目标特征提取和目标识别方法。
在部分遮挡条件下,目标仅含有部分空间结构,而待识别目标的空间结构信息是目标的关键信息。快速模板匹配算法依赖于较好的目标分割,然而目标的遮挡改变了其空间结构信息,从部分遮挡目标和噪声中提取目标的结构实现分割是不可靠的。基于隐马尔科夫模型(HiddenMarkovModel,HMM)的SAR图像部分遮挡目标的识别算法避开了遮挡SAR目标整体结构信息的损失,采用目标的局部散射特征作为训练数据,训练分类器实现SAR遮挡目标的识别。随着支持向量机(SupportVectorMachine,SVM)在目标分类、识别任务中优良的表现,文献提出了一种基于SAR遮挡目标散射特征的SVM识别算法,识别性能较隐马尔科夫模型识别算法有了一定的提高。然而,目标的散射特征是SAR图像的局部峰值,这两种方法均忽视了SAR图像丰富的纹理、结构信息,而且这些局部特征受斑点噪声的影响极大。
深度神经网络是目前机器学习的前沿热门,具有非常好的目标信息表示能力,能够有效提取目标的纹理、结构特征,已广泛应用于对图像的识别、降噪、降维等方面。文献结合稀疏编码(sparsecoding)和堆叠降噪编码网络(SDA),提出一种基于深度神经网络的光学图像降噪和盲修复算法,利用半监督学习输入图像的深层特征,重建随机“污染”目标。
鉴于深度神经网络具有从大量随机“污染”图像中学习目标深层特征的能力,本文尝试将深度神经网络应用于SAR遮挡目标的识别任务中,充分利用SAR遮挡目标的局部峰值和整体结构特征,提出了一种利用深度神经网络的SAR遮挡目标识别算法。

 

1基于深度神经网络的SAR图像遮挡目标识别

 

本文提出的特征提取和目标识别算法的流程,共包含4个过程:
(1)输入数据准备,其中关键是对SAR遮挡目标的模拟。提取原始图像中目标的峰值点,并利用对峰值点的遮挡模拟SAR遮挡目标作为输入向量。
(2)图像预处理。提取SAR目标的小波低频子带图像作为输入,并对子带图像中目标切片做正则化调整,提高目标数据的可判决性。(3)特征提取。利用深度神经网络提取预处理后的遮挡目标切片的深层抽象信息作为SAR遮挡目标的特征向量。(4)识别分类。结合深度网络模型和实验中多目标识别任务,文中采用softmax回归分类器对特征向量张成的低维特征空间上实现目标识别,并输出识别结果。

 

2 SAR遮挡目标的模拟

 

2.1实验数据集
本文实验中使用的图像数据是由美国国防高级研究规划局(DARPA)MSTAR工作组公开的MSTAR图像公共数据库,它由实测的SAR地面静止军用目标数据组成。实验中选用其中的三类七个型号SAR目标:BMP2(装甲车)、BMP70(装甲车)、T72(主战坦克)进行实验。每类实验目标都包含有大量不同方位和俯视角的图像,方位角覆盖范围是0~360°,方位间隔为1°。图像成像分辨率是0.3m×0.3m,大小均为128×128。
实验样本和测试样本的种类和数目如表1所示,同类不同型号的目标在配备上有些差异。所有训练图像和测试图像分别是SAR雷达在俯视角为17°和15°下得到的成像切片数据,图像数目分别为698和1365。三类SAR目标的训练图像在90°方位角(正北方向)下的实际图像。

 

2.2 SAR遮挡目标的模拟
由于目前尚没有公开的实测SAR遮挡目标数据库,因此该领域的研究都是建立在对SAR目标数据库的目标遮挡模拟的基础上。SAR雷达作为一种主动遥感成像系统,不能完整的表述目标的整体形状,只能表现为具有稀疏性的散射中心分布,且SAR目标对姿态变化、尺度变化、平移等非常敏感。由于SAR图像的峰值中心(同时在方位向和距离向表现为局部极大值的像素点)实质上就是目标的散射中心特征,因此本文采用对目标峰值点的遮挡来模拟SAR目标的遮挡。
具体流程如下:依照光栅扫描的顺序逐个搜索图像峰值点,若某像素点的灰度值大于或等于其八邻域内的最大像素值,则该点标记为峰值点,并对其灰度值和坐标进行记录;否则继续搜索,直至完成对所有像素点的判断。由于成像方位角不同,即便预处理将目标旋转到统一标准方位,但同一类型的目标仍会具有不同的峰值点数目。
本文实验中为更加准确真实的模拟实际SAR目标遮挡、防止“伪峰值”,统一将记录得到的所有峰值点按灰度值降序排列,取序列前面最大的固定数目峰值作为目标散射特征,并将这些特征点灰度值统一置为零以模拟遮挡目标数据。

 

3图像预处理

 

首先以原始SAR图像目标中心裁剪形成新的目标图像,尺寸为64×64,可在减少背景杂波干扰的同时提高运算速度,对新图像I(x,y)进行离散小波分解(采用haar母小波函数),将I(x,y)分解成4个子带图像。小波变换具有很好的能量集中性,低频子图像包含了目标图像大部分的能量,而高频子图像仅包含少量的目标能量。针对SAR图像,目标的低频分量包含了大部分的目标判别信息表现了其“概貌”,高频部分表现了其细节及大量噪声。小波分解使得图像数据量减少,但同时也就造成图像分辨率的下降,因此本文采用1级小波分解。
对SAR目标图像做正则化调整。SAR目标的平移、旋转、尺度变换及不均匀散射都会对SAR图像的特征提取及识别分类产生极大的影响,因此预处理能有效地提高识别算法的性能。本文采用的目标正则化预处理主要包括以下步骤:(1)按式1将斜距图像转换为地距图像,减小入射角的影响。式中S、G分别表示斜距和地距,为入射角;(2)估计方位角信息及切片图像旋转。实验中统一采用90°作为标准旋转目标切片;(3)图像标准化。按式2对形成的图像做归一化处理,使得归一化后的图像均值为0,方差为1。设~x是输入x的归一化图像,X是x的均值,X是x的标准差,M、N分别表示原图像的行数和列数。

 

4特征提取及目标识别

 

4.1特征提取
作为深层稀疏编码模型的输入数据,通过第一层编码器获得第一隐层的状态为,深层稀疏编码就是通过约束求取原始数据的近似表示,这种近似可以通过约束隐层神经元的稀疏性得到,如式7。由于深度学习结构具有强大的函数表达能力,能有效地从少数样本中学习多变函数的本质。因此本文提出了一种基于深层稀疏编码提取SAR图像目标特征的算法。将每一幅小波域低频子带图像按照纵向扫描顺序排成列向量作为原始样本ix,每次输入m幅n维SAR目标子带图像构成一个训练样本矩阵1 2TnXx xx,这种稀疏约束使得大部分隐层神经元的状态为0,即对输入没有响应,从而学习“最感兴趣”的目标特征,这种结构正是人脑工作的方式。

 

4.2目标识别
利用Softmax回归进行分类识别。在深层稀疏编码模型的顶层上添加了一个输出层,构成一个Softmax分类器,Softmax回归模型是Logistic回归模型在多类分类问题上的扩展。由于实验中只对三类SAR目标处理,对m个样本构成的训练集在Softmax回归中将测试目标x归为类别j的概率为式中若输出结果j等于标签(i)y则1iy j,否则为零;而表示大于零的权重衰减项,惩罚过大的参数值并使得代价函数变成严格的凸函数,这样就保证了通过梯度下降可以收敛到全局最优的唯一解。

 

5仿真实验及结果分析

 

为进一步分析算法对SAR遮挡目标的识别性能,实验分两组进行:(1)采用单训练集的输入数据,即训练集中仅有只包括原始图像的数据,共698幅SAR图像;(2)采用多训练集的输入数据,即训练集由原始图像和模拟遮挡图像(遮挡率20%~80%)构成。为保持实验对比性,两组实验训练数据集均为1396幅SAR图像,测试集SAR图像数目为1365,详情见表1。以下实验中所有(1)代表为单数据测试集实验,(2)代表多数据测试集实验,不再赘述。为兼顾计算复杂度和识别效果,本文实验采用含有六个隐藏层的深度神经网络结构。
两组实验在不同遮挡率下的识别结果和混淆矩阵如表2~5所示。从中可以明显看出,BMP2和T72两类目标相互误识别率较高,因为两者具有更多的相似性信息,即峰值特征分布比较相似;BTR70随着遮挡率的增加更多的被误识别为BMP2,因此BTR70相比于T72与BMP2具有更多的相似性信息。
在两种测试数据集下,本文算法对各类目标的识别率随遮挡率变化的曲线图。整体来说,遮挡对3类目标的影响为BMP2最小,T72次之,BTR70最大。在两种测试数据集下,不同算法对所有3类目标的平均识别率随遮挡率变化的曲线图,其中HMM-50表示文献[中使用50个散射中心应用HMM得到的识别结果。
两组实验中,在较低遮挡率下(20%、40%),文献算法具有100%左右的识别率,明显高于其他方法,这是由于文献仅考虑表征目标本质特征的散射中心作为输入数据,过滤了大量具有共性特征的其他像素点,如一致的背景、阴影杂波干扰。其他算法都采用整幅图像作为输入数据,一定程度上削弱了目标的区分性信息。
本文提出的算法识别率要优于基于SVM和KNN(K近邻)两种分类器的算法,因为基于分类器的两种算法直接对整幅预处理后SAR图像进行识别,而本文提出的基于深层稀疏编码的SAR遮挡目标识别算法是利用深度神经网络从整幅SAR图像中学习目标的深层抽象信息,再利用这些信息完成目标识别,这样就极大地过滤掉了大量无用的共有信息,保留了目标的区分性信息。随着目标遮挡率的增加,达到60%、80%甚至更高时,文献的识别率急剧下降至70%左右,这是由于此时的散射特征已经大部分被遮挡,属于无效信息,仅依靠这些信息必然会导致分类失败。此时目标之间的区分性信息大大减少,其他像素点表示的目标信息较少,因此本文提出的算法与基于分类器的两种识别算法基本一致。
对比单训练集和多训练集的识别结果,整体上采用多训练集的SAR遮挡目标识别结果要明显好于单训练集,尤其是目标遮挡率较高时,如遮挡率达到80%时,本文算法采用多训练集的平均识别率仍可以达到92.60%,而此时单训练集只能保持83.15%左右。这是由于在训练集中随机包含了各种遮挡率的训练样本,而本文提出的深度神经网络SAR遮挡目标识别算法能够从目标的各种变化中学习目标的本质特征,从而更好的对测试集SAR目标进行识别分类。
以上实验都是基于Intel(R)Core(TM)2DuoCPUP84002.26GHz,2.93GB内存的计算机,仿真软件Matlab 2010a上进行的。

 

6结语

 

本文提出了一种利用深度神经网络的遮挡SAR目标特征提取和识别算法,实验中首先对SAR图像做正则化处理,并进一步提取图像的低频小波变换成分大大减少了计算量。采用遮挡目标峰值点的方法模拟
SAR目标部分遮挡,通过模拟对目标不同遮挡率的情况下,分别采用本文算法对3类SAR目标识别进行了大量实验,并同其他算法作了比较,结果证明新方法有效克服了HMM等传统算法仅关注目标局部特征的不足,而深度神经网络比SVM能更好的利用SAR图像丰富的纹理特征以及高分辨结构特征。新方法兼顾了遮挡目标的局部特征和全局特征,具有更好的SAR遮挡目标识别能力。

 

参考文献:(略)