软件工程博士论文代写范文:智能和网络的图像研究

发布时间:2026-04-10 11:37:19 论文编辑:miaomiao

目录

中文摘要

Abstract

这是一篇软件工程博士论文代写范文, 隐藏图像恢复;高位比特修复;群智能;凸壳;标签矩阵;深度神经网络;为论点进行的博士论文代写,本文是以基于图像的信息隐藏为基础,从受到噪声攻击的载密图像中提取的隐藏图像。由于隐藏图像也受到破坏,导致隐藏图像也含有很多噪声。因此,本文以隐藏图像的噪声为研究对象,尝试利用群智能、深度神经网络等方法结合图像的局部和全局特征,构建从比特级到像素级的隐藏图像进行恢复模型,有利于秘密信息的还原和保护。

第 1 章 绪论

1.1 研究背景及意义21 世纪数字化浪潮下,信息和网络技术的蓬勃发展使互联网深度融入社会生活与商业活动。“互联网+”时代产生了更加多元化、海量化的网络数据,这些数据以不同的形式呈现,如视频、图像、音频、文字等。同时,不同地区的数据资源时刻通过互联网进行传送,实现全球范围内的资源共享。然而,网络的高度开放性与其安全防护的脆弱性形成鲜明对比,致使系统频繁遭受恶意攻击,引发个人隐私泄露、金融欺诈乃至国家机密失窃等严重后果。频发的数据泄露与网络犯罪事件,在彰显互联网便利性的同时,也急剧推动了公众对数据安全的关切。研究者提出了多种解决方案。数据加密技术作为信息保护的基石,依托密码学原理,通过数学/物理方法将敏感信息转换为不可读的密文,阻止未授权方获取明文[1]。尽管加密能隐藏信息内容,但其生成的异常密文形态反而可能暴露秘密信息的存在,可能诱发攻击者更有针对性的破解或破坏行为,加剧信息被窃或损毁的风险。相较之下,若能彻底隐匿信息传输的痕迹,将大幅提升安全性——这正是信息隐藏技术诞生的核心动因[2]。

1.2 国内外研究现状关于数字图像的恢复技术,可以分为:基于空域和频域的方法、基于深度学习的方法以及隐藏图像恢复方法。基于空域和频域的方法是比较早期提出的一些方法,包括空域滤波技术、基于频域变化的图像恢复技术以及基于图像特征相关性的恢复方法等。基于深度学习技术由一个从数据中学习数据中的特征,将学习到的知识应用到新的数据中。深度学习是将网络中的层数增加,使网络能够学习更加深层的特征信息,能够更准确表达复杂的信息。


博士论文代写软件工程博士论文代写范文:智能和网络的图像研究


数字图像容易受到各种类型噪声的影响,包括高斯噪声、斑点噪声、椒盐噪声和泊松噪声。由于不同采集技术获得的图像,也可能会受到噪声的干扰,导致图像不够清晰。还有其它多种因素,如环境条件和传输系统可以污染图像噪声。在应用空域和频域滤波技术进行图像复原时,需要对退化函数有一定的了解,以便在复原过程中利用退化函数的逆来恢复原始图像。退化过程包括原始图像、退化函数以及添加到其中的噪声;而复原过程包括估计退化函数和应用其逆函数。

(1)基于空域的图像恢复方法在空间域恢复算法中,是利用像素候选之间的相关性去除某个区域的噪声。在空间域中,滤波操作直接应用于图像矩阵;而在频域滤波中,首先将图像矩阵映射到相应的变换系数,然后进行进一步的阈值处理。根据滤波过程中选择像素候选的方式,滤波器可以分为局部滤波器和非局部滤波器。图像去噪算法的基本原理是:噪声在像素间是不相关的,而真实信号的像素强度则相互关联。

(2)基于频域的图像恢复方法与空间域滤波技术的方法不同,变换域方法利用了信号的稀疏性,即信号可以由较少的非零系数表示,或者图像可以表示为少数高值系数的线性展开,这一特性使其成为一种非常适用于一维和二维域的数字信号处理工具。

1.3 评价指标针对图像恢复的问题,已经研究了很多不同的评价方法。目前仍旧需要从主观的视觉上判断,也会通过定量的指标进行比较。从主观视觉上分析,可以通过观察图像的纹理、边缘等进行判别,但是主观视觉分析,难免会造成较大的误差。从而结合定量分析,虽然当前有很多的图像恢复评价方法和指标,但是其中峰值信噪比和结构相似性(Structural Similarity,SSIM)仍是最主要的评价。PSNR 是从像素之间的关系进行比较,而 SSIM 则是考虑到整幅图像的结构。因此,论文在进行实验分析时,既从主观视觉效果上分析,也采用客观指标 PNSR 和 SSIM 进行定量分析,计算公式分别为公式 1.2 和 1.3。为了验证算法的有效性,使用最常用的、主流图像评价指标: PSNR 和 SSIM。PSNR 越大,表示恢复的图像效果越好。SSIM 越接近 1,表示恢复后的图像与原图在亮度、对比度和结构上越相近。

1.4 论文研究内容本文研究的是针对隐藏图像从遭受噪声干扰的载体提取后,导致隐藏图像被破坏,针对隐藏图像的噪声进行建模和恢复。待隐藏图像通过最低有效位(Least SignificantBit, LSB)的方式嵌入到载体图像,载密图像在信道上传输而受到噪声攻击,使用噪声检测方法识别载密图像中的噪声点,根据隐藏图像的像素位是否从载密图像的噪声点中提取,将提取的位分成被修改和未被修改两类。若是从载密图像中噪声点提取,则将该位标记为不可信位;否则,标记为可信位。通过可信位和不可信位计算出提取的隐藏图像中的噪声。对图像去噪的问题,很多专家提出了不同的方法。已有的去噪算法除去高斯噪声、脉冲噪声、随机噪声等都取得了较好的效果,提高了图像的视觉效果,但是对被破坏的隐藏图像效果却不理想,恢复图像纹理存在严重的模糊的问题和过平滑现象。论文将从隐藏图像的局部和全局特征进行研究,根据噪声的特点,利用凸壳、群智能、深度神经网络等方法相结合恢复含有噪声的隐藏图像。论文主要研究内容如下:

(1)基于高位修复和生物共生搜索的隐藏图像恢复算法由于图像像素的高位在这个像素的比重非常大,若能够准确的恢复不可信像素的高位,则对后续剩余的不可信像素恢复有很大的益处。因此,提出了一种高位修复和生物共生搜索的隐藏恢复算法。首先对计算不可信像素邻域的可信像素点,若存在可信像素点且能构成凸壳,不可信像素处在凸壳中,说明可信像素与不可信像素具有强的相关性,则根据凸壳的区域是否为平滑还是纹理,采用不同的条件对不可信像素的高位进行修复,保证高位修复的准确性。当位修复失效时,使用生物共生搜索算法——通过候选值初始化种群,以候选值与邻域可信像素值的方差构建适应度函数,经迭代优化生成像素修复最优解,实现图像不可信像素的恢复。

(2)基于插值和社交网络搜索的隐藏图像恢复算法根据图像可信点的密度,将图像分成若干大小相同的块。由于图像中在不同密度的噪声攻击后,提取的隐藏图像可信像素的数量不一样,块越小,块内像素的相关性越高,反之,相关性就降低。因此,根据图像可信像素的密度采用不同的分块大小。待分块完成后,再根据块内可信像素的密度对块中凸壳区域的不可信像素进行估计。如果块内可信点多,则采用自然邻近插值方法,否则使用双样条曲线插值方法。然后再根据估值和候选值恢复凸壳内的不可信像素。处于块内凸壳外的不可信像素,则引入社交网络,以不可信像素的邻域中的可信像素为参考,利用社交网络搜索在不可信像素的候选值中找出最优解,恢复不可信像素。相较于一些著名的滤波算法,提出的算法能够取得更好的修复效果,较好地保持了图像整体结构完整性。

(3)基于标签矩阵和条件生成对抗网络的隐藏图像恢复算法由于提取的隐藏图像中噪声分布是未知的,一般的网络可能难以学习到有效的图像特征。特别是当噪声浓度高的情况下,直接采用 GAN 都难以生成相似的图像。在数据集制作过程中发现可信像素点能够反映出图像的结构。因此,提出一种结合标签矩阵和 CGAN 的隐藏图像恢复算法。将从被污染的隐藏图像中提取出可信像素制作成标签矩阵,再与隐藏图像一起输入到 CGAN 中,引导神经网络生成一个可接受的合成图像。将合成的图像作为恢复噪声点的参考;找出与待修复的隐藏图像中的不可信点,使用合成图像中对应位置的像素值作为参考依据,然后在噪声像素的候选值中选择与参考值最接近的一个来修复不可信像素点。实验结果表明,相比已有的方法,该算法能够取得较好的性能。

(4)融合 FCA 与 CNN-Transformer 的隐藏图像恢复算法由于提取的隐藏图像中每一个像素点都可能与原始像素存在差异,而经典的Transformer 网络模型采用的是自注意力机制,难以较好地恢复被破坏的隐藏。

1.5 论文组织结构针对隐藏图像恢复的问题,本文采用根据隐藏图像噪声的特点。首先,通过高位平面修复与生物共生搜索,从位层面利用凸壳的局部区域特征进行高位修复,再使用共生生物搜索的像素级隐藏图像恢复。然后,将处理范围扩展至基于像素级图像局部结构,引入凸壳界定问题区域,并融合插值与社交网络搜索,实现了局部区域修复。然后从局部块修复转向了全局图像恢复方式,引入标签矩阵作为先验知识结合条件生成对抗网络。最后,结合最小距离可信点凸壳进行不可信像素预估计和深度神经网络学习全局特征的模型,从而在更深层次上实现了局部与全局信息的统一。综上所述,本文研究层层递进,系统地展示基于位修复、凸壳、群智能和深度神经网络等方法完成了隐藏图像恢复任务。

第 2 章 基于高位修复和共生生物搜索的隐藏图像恢复算法

随着信息隐藏技术的广泛应用,含有秘密信息的载密图像在传输过程中易受噪声攻击,导致提取的隐藏图像质量严重退化,其噪声的特殊性使得传统去噪方法取得效果不佳。因此,在充分利用可信像素信息,根据图像凸壳区域的特征对不可行像素的高位修复,并与群智能算法相结合的恢复方式对隐藏图像进行恢复。本章算法的主要贡献为:

(1)提出了一种基于凸壳内像素相关性的高比特位修复方法。在所有像素位中,第 8 位和第 7 位两个高位比特具有更高权重,在像素恢复过程中起到主导作用。对于受损像素,其凸壳内的可信像素将用于修复不可信像素的第 8 位和第 7 位。由于凸壳区域中可信像素具有强相关性,根据凸壳区域的特征,在不同条件下可实现高精度的不可信像素第 8 位和第 7 位修复。同时,通过高比特位修复可增加可信像素数量,这对后续图像修复具有显著优势。

(2)共生生物体搜索技术用于恢复隐藏图像。具体而言,通过将所有不可信位设为’0’或’1’来生成受损像素的所有候选值,其中某个候选值最接近原始像素值。为获取最接近的像素值,首先将候选值初始化为生物种群,随后执行三个阶段的共生生物体搜索以找到最优解(即其中某个候选值),该最优解被视为受损像素的恢复结果。

2.1 基于高位修复和共生生物搜索恢复算法框架基于图像的信息隐藏传送是在发送端将含有隐藏图像的载密图像发送到接收端,隐藏图像被转成一串二进制,然后二进制串通过密钥进行加密处理以便提高安全性。加密的二进制串通过 LSB 方法嵌入到载体图像中,形成了带有秘密信息的载密图像。当载密图像在公共网络上传输时,载密图像可能被一些噪声干扰,如脉冲噪声,随后接收端将隐藏图像从载密图像中提取。由于载密图像被噪声污染,进而会破坏里面存放的秘密信息。因此,提取的隐藏图像也被破坏。为了恢复被破坏的隐藏图像,本文利用可信点和凸壳特征,根据凸壳区域类型对被破坏像素的高位进行修复,然后结合共生生物搜索的恢复隐藏图像。图 2.1 和图 2.2 分别展示了该方法中发送端和接收端的框架结构。

2.2 可信像素定义如果载密图像受到脉冲噪声干扰,从载密像素中提取的隐藏图像就会随之遭受不同程度的破坏,这与噪声密度密切相关。若某个比特位是从受损载密像素中提取的,该位可能被破坏,则认为该位不可信;反之,认为该位为可信。因此,通过像素的不可信位可以计算出该像素的失真值,并进一步判断该像素是否可信。假设从一个秘密像素 p 中提取的 8 个比特表示为 b(p,k) (k=1, 2, ... ,8),张等人[147]提出的比特识别方法可用于区分 p 的可信与不可信比特。在确定 p 的可信与不可信比特后,可进一步推导出这些比特是否可信及其候选值。

若某个不可信像素 p 的高位被破坏,由于高位占比重比较大。为此,首先通过凸壳算法对不可信像素的第 8 位和第 7 位进行修复。待修高位修复完成后,若像素仍不可信,则继续结合生物共生搜索对不可信像素进行恢复。通过这两种方法相结合,最终能有效还原出原始图像。若像素 p 为不可信像素,则将其视为噪声像素,并通过计算其候选值来辅助恢复。候选值的生成方式是将每个不可信位设为“0”或“1”,同时保持可信位不变。图 2.3 为候选值生成的示例。由于 c(p,8)=1 且 c(p,8)=1,可见 b(p,8)和 b(p,4)属于不可信位 ,其余位均为可信位。通过依次将 b(p,8)和 b(p,4)设为“0”或“1”,可得到 p 的四个候选值{20, 28, 148, 156}。显然,其中至少有一个值就是原始像素 p 的真实值。隐藏图像的像素恢复的核心问题在于生成尽可能接近原始像素的数值。

2.3 基于凸壳的高位修复本节将采用凸壳算法恢复像素中不可信的第 8 位和第 7 位。由于像素的第 8 位和第 7 位权重分别为 27∕256 =0.5 和 26∕256 =0.25,两者的权重累加值为 0.75。若能准确恢复这两个位,恢复的像素值就能更接近原始值。因此,精准的修复高比特位对恢复隐藏图像至关重要。

2.4 基于共生生物搜索的隐藏图像恢复通过第 2.3 节中高位修复方法完成修复后,再使用共生生物体搜索算法恢复隐藏图像。共生生物搜索算法是由 Acharya and Mishra[151]等提出,是近年来涌现的众多群体智能算法之一。这类算法在模式识别[152]、图像修复[153]和工程优化问题[154]等领域得到广泛应用。该算法通过 模拟生态系统中种群间的动态关系,精准捕捉自然界生物种群的互动规律。具体而言,生物种群间存在三种核心关联机制:(1)共生关系。一个经典范例是蜜蜂与花朵之间的相互作用。(2)共栖关系。典型例子是海洋中魔鬼鱼与鲨鱼的共栖关系。(3)寄生关系。蚊子与人类宿主之间的联系就是代表性例子。基于共生生物的搜索算法包含三个阶段:互利共生、偏利共生和寄生。该算法常被用作优化工具来解决类似本文研究的问题,因为目标函数在搜索过程中容易陷入局部最优解,但最终仍能找到全局最优解[155]。对于不可信像素 p,其候选值很可能与其原始值相近。因此,可采用生物共生搜索算法生成接近原始值的最优值。算法初始化时以不可信像素 p 的候选值为起点,随后执行三个阶段的共生生物搜索流程。通过方差作为评估函数计算个体适应度——方差越小,适应度越高。该过程持续迭代直至满足终止条件,最终将不可信像素的原始值替换为最优值。所有 p 候选点{r1, r2, ..., rm}用于初始化生态系统中共生生物种群 U。个体数量为m, 种群的最大值和最小值分别为 ub =max(U)和 lb = min(U)。因此,生态系统的研究范围为[lb,ub],最大迭代次数为 Iter = 2m。V 是凸壳内可信像素的集合。

2.5 实验结果比较与分析本节对所提出的方法进行了全面评估。原始图像库 USCSIPI[156]包含 301 张各类图像,如纹理、航拍、杂项和序列等。所有图像均为灰度格式,并将图像格式转换为位图(bmp)。实验中使用了 USCSIPI 数据库的 512×512 尺寸图像的 House 图像作为载体图像,其余图像作为隐藏图像。为实现 LSB 嵌入,隐藏图像通过下采样转换为256×256 尺寸,从而可将隐藏图像嵌入封面图像的两个最低有效位生成载密图像。随后,对载密图像施加 0.1 至 0.5 不同密度的脉冲噪声以生成受损隐写图像。接收端从受损隐写图像中提取隐藏图像。选取 “Lena” 图像作为隐藏图像展示在不同噪声密度下载体图像的直接提取效果。从图 2.5 可以看出,提取的隐藏图像的视觉效果严重失真。因此,采用本章提出的算法来消除提取的隐藏图像中的噪声。

2.6 本章小结本章提出了一种结合高比特位修复与共生生物搜索的复合方法,用于修复从受污染隐写图像中提取的受损密文图像。由于隐藏图像中像素的比特位通过检测后已知是否被破坏,因此,通过计算损失值能够区分可信点与不可信点。本章仅对第 8 位和第7 位不可信比特进行修复,因为当高比特位发生改变时,像素值和图像特征都会出现明显变化。同时,鉴于凸壳内像素具有更强的相关性这一公认规律,因此,采用凸壳技术对不可信高比特位进行修复,以进一步确保修复比例。可信像素数量的增加为更有效地恢复原始图像提供了保障。通过共生生物体搜索技术修复受损隐藏图像。在实验部分,选择某一图像展示视觉效果,并用图像数据库来验证算法的综合性能。经典“Lena”图像被选作测试样本,因其同时包含平滑区域和复杂纹理区域,能直观展示不同算法在不同噪声水平下的视觉质量表现。图像数据库包含多种类型图像,全面评估算法性能。不仅从视觉质量角度分析不同算法效果,还通过 PSNR 和 SSIM 两个量化指标进行对比。结果表明,本算法优于其它主流图像恢复算法。


第3章 基于插值和社交网络搜索的隐藏图像恢复算法

3.1 基于插值和社交网络搜索的恢复流程

3.2 图像分块及凸壳生成

3.3 基于插值的凸壳内像素点恢复

3.4 基于社交网络搜索的凸壳外像素点恢复

3.5 实验结果比较与分析

3.6 本章小结

第4章 基于标签矩阵和条件生成网络的隐藏图像恢复算法

4.1 基于标签矩阵和CGAN方法的总体结构

4.2 标签矩阵提取

4.3 条件生成对抗网络

4.4 隐藏图像恢复过程

4.5 实验结果比较与分析

4.6 本章小结


第 5 章 基于自适应细粒度通道注意力机制和 CNN-Transformer 的隐藏图像恢复算法

上一章展示了深度学习在捕获全局上下文信息方面的巨大潜力,但其本质上是一个端到端的“黑箱”生成过程。当噪声浓度高的情况下,可信点少,导致图像平滑区域存在一定的过度平滑现象。因此,利用凸壳方法在前期阶段对隐藏图像进行预处理,结合卷积神经网络与集成多种注意力机制的堆叠 Transformer 的一种混合深度学习模型。该模型在输入部分,延续了利用凸壳和可信像素进行预处理的思想;在核心网络架构上,编码器通过 CNN 和引入 FCA 的 Swin Transformer,在局部与全局维度上实现更强的特征捕获能力;在输出层,将网络输出的修复图像与前面章节使用的像素候选值相结合,实现了隐藏图像比较精准像素恢复。本章工作的主要贡献有:

(1)由于提取的隐藏图像噪声浓度非常高,在进行网络训练前,利用不可信像素所在凸壳中的像素点,并定义像素的可信度,对不可信像素进行预估计,增强网络可学习的图像特征。

(2)为了提高网络学习的效果,在网络中引入 FCA,通过捕捉不同粒度下全局和局部信息之间的相关性,从而有效地为不同的通道赋予不同的权重,增强网络的学习和表达能力,有效的提高算法网络学习的效果。

5.1 相关技术介绍注意力机制是 Transformer 中非常的重要一部分,Transformer 通过融合注意力机制可以起到更好的捕捉图像不同通道相互间的关系。例如:Transformer 包含的窗口注意力机制可以捕捉图像全局信息,但是计算量较高。而滑动窗口注意力机制不仅可以减少计算,还能提让模型能够学习到跨窗口的信息。这些注意力机制可以捕捉图像通道的全局信息,但是缺乏捕捉通道间的局部交互信息。因此,本章引入自适应细粒度通道注意力机制[173]。Transformer 传统上被用于自然语言处理,侧重于顺序处理。然而,视觉域的图像 比 文 本 具 有 更 多 的 像 素 且 更 复 杂 , 无 法 通 过 序 列 有 效 地 表 示 , 也 不 可 能 将Transformer 直接应用于视觉域。针对这种情况,ViT 是 Transformer 用于图像处理的改进模型,但 ViT 只适用于简单的图像分类,无法处理同一图像内不同尺度的多个目标,因此无法适应多尺度目标。目标,无法适应多尺度视觉域任务。为了降低 Transformer 的计算复杂度,Swin-Transformer 使用小窗口将序列截断为多个短序列,并在小窗口内引入自注意力机制。如果在小窗口内执行 Self-attention,只要窗口大小是固定的,Self-attention 的计算复杂度也是固定的。因此,原始图像的计算复杂度可以降低数十倍,这种小窗口注意力计算模块也被称为窗口标准多重自注意 力 ( Window Standard Multiple Self-Attention, W-MSA ) 模 块 。 在 原 有 的 SwinTransformer 中采用基于窗口注意力机制,这种注意力机制降低了 ViT 中直接计算整幅图像注意力机制的复杂度,不仅可以提升计算效率,还可以将更多的图像输入到Transformer 网络中。但是由于整幅图像被分成若干个窗口,窗口注意力机制只是单独对每个划分的窗口计算对应的注意力权重,但有些特征可能会分布在不同窗口中,导致这些特征无法完整的被网络学习。因此,采用滑动窗口注意力机制可以较好的解决了这一问题。Swin-Transformer引入了移位窗口多头自注意力(SW-MSA)模块,即执行偏移的 W-MSA。如图 5.1(b)所示,第 l-1 层(左侧)采用 W-MSA,第 l 层(右侧)采用 SW-MSA。根据图可知,窗口发生了偏移,窗口数量从 4 个变成了 9 个。对于右边的第二个窗口,它包含了左边的第一个窗口和第二个窗口的一部分,允许两个窗口之间进行信息交换。右边的第5 个窗口包含了左边所有窗口的一部分,实现左侧所有窗口可以相互交换信息,即解决了不同窗口之间不能交换信息的问题。

5.2 融合 FCA 和 CNN-Transformer 恢复方法本文结合 CNN 和含有不同注意力机制的堆叠 Transformer 对隐藏图像进行训练,实现隐藏图像恢复。由于隐藏图像像素的被破坏程度不一,直接采用神经网络卷积操作提取被破坏隐藏的边缘、纹理等高频特征的准确度比较低,导致隐藏图像的恢复效果不理想。通过对隐藏图像进行采样处理,提高网络模型的学习效果,降低网络训练难度,模型整体结构如图 5.2 所示,共包括输入、编码、解码和输出四个部分。在输入部分通过采样操作将尺寸减小,提高网络运行效率。同时,利用对不可信像素进行预处理,提高网络学习的效果。在编码阶段,由下采样、滑动窗口注意力机制和自适应细粒度通道注意力机制的堆叠 Swin Transformer 组成的编码模块。特征图使用融入滑动窗口注意力机制和自适应细粒度通道注意力机制的堆叠 Transformer 进行特征编码,再通过 CNN 下采样得到不同尺度特征图。解码部分是由 4 个包含上采样和残差块组成的模块,将前一层的特征图通过上采样进行放大并与来自同一层解码块的特征图连接一起输入到残差模块。

5.3 实验结果比较与分析本文采用 Bossbase dataset[170]对网络进行训练,该数据集一共包含了 10000 张图片,图像内容多样,涵盖自然景观、建筑、人物等,具有丰富的纹理和细节。随机抽取 1000 张图片作为验证集,其余图片作为训练集,即按 9:1 的比例进行划分训练集和验证集。测试集以 USC-SIPI[156]图像库中的图像样本,该样本包括纹理、航拍、杂项和序列图像等多种类型,共 301 张图片。为了制作隐藏图像的被破坏的数据集,对数据集中的图像都转为灰度图像并将图像大小变化成 256×256。采用 House 图作为载体图像,大小设置为 512×512。采用文献[147]的方法进行嵌入和提取。将隐藏图像作为秘密信息嵌入到载体图像中,形成了载密图像,再对载密图像加入 0.1 到 0.5 的不同浓度的脉冲噪声,然后提取出隐藏图像,获得了含有噪声的隐藏图像。从文献[148]可以知道若载密图像受到 0.4 和 0.5 的脉冲噪声干扰后,提取的隐藏图像噪声浓度分别达到 80%和 90%以上。因此,提取出的隐藏图像包含的噪声比例会提高很多。该模型基于 Pytorch 深度学习框架实现,Python 版本为 3.10。本台台式计算机的硬 件 环 境 为 第 12 代 Intel(R) Core(TM) i7-12700KF3.60 GHz, 32G RAM , GPU 为NVIDIA GeForce RTX 3090,操作系统为 64 位 Windows 11 版本。优化器为 Adam,学习率(lr)设为 2×10−4,迭代次数为 70。为了进一步分析算法性能,将提出的算法与一些经典的算法进行了对比。本文与文献[8]、文献[49, 158, 159]、文献[91]、文献[100]、文献[157]、文献[109, 149, 150, 172]进行对比分析。为了展示图像的恢复效果,选取测试集 USC-SIPI 图像库中的标准测试图像 Pepper 展示 0.1、0.3 和 0.5 噪声密度下恢复的效果,如图 5.5、图 5.7 和图 5.9。为了便于展示恢复的细节,将放大部分结果的局部图像。图 5.5 为加入 0.1 噪声浓度噪声的恢复效果图。从图中可以看出,由于提取的隐藏图像中噪声浓度不是很大,所比较的算法都能恢复出图像中辣椒的整体轮廓。但有些算法恢复的效果还是存在非常明显的噪声,例如:图 5.5 中(b)和(e)有明显的噪声点和斑块。而部分方法的恢复的效果存在不同程度的平滑现象,如:图 5.4(a)、5.4(d)、5.5(h)和 5.5(k)都存在明显的平滑效果。特别是图 5.5(d)平滑的效果非常明显,导致恢复的辣椒边缘非常的模糊。图 5.5(a)和图 5.5(h)的模糊现象也比较明显。图 5.5(k)恢复样将图像放大至原图大小,并且结合被破坏像素的候选值,对隐藏图像的所有噪声像素进行替换,最终实现隐藏图像修复。的效果与原图相比,很多细节被平滑,且图像的整体亮度变得暗淡。图 5.5(c)和图 5.5(i)效果显示整体能够较好的恢复图像,但是图像的纹理存在比较严重的不平滑。图 5.4(j)相比图 5.5(c)和图 5.5(i),纹理细节损失相对减轻,但是图像中的辣椒也存在明显的凹陷和不平滑。图 5.5(g)不仅包含了一些黑白噪声点,而且存在严重的平滑的现象,图像中辣椒变得非常不自然。图 5.5(l)是本文方法恢复的效果。不仅能够基本恢复出图像整体结构,而且图像中辣椒的边缘能完整的保持,图像的其他细节也保持较好。

5.4 本章小结由于传统的去噪难以顾全图像的全局纹理特征,导致图像恢复时对纹理效果非常不理想。基于深度学习的方法能够学习图像的全局和局部的特征,但由于隐藏图像的噪声比普通的噪声复杂,导致采用一般注意力机制的深度学习方法难以较好地恢复。因此,本文提出了采用特征金字塔提取多尺度特征,使用经典的 SwinTransformer 融合自适应细粒度通道注意力机制。在图像输入部分使用最小距离可信点凸壳对图像进行预处理;通过编码阶段学习图像的不同的尺度特征;然后再通过解码阶段恢复出高分辨率的图像。最后结合被破坏像素的候选值进一步恢复隐藏图像。本章算法虽然能够较好的恢复图像的整体结构,且能够克服深度学习在图像恢复任务过度平滑的现象,但是对局部细节保护还存在一些不足,今后继续针对隐藏图像的细节保护进一步研究。

第 6 章 总结与展望

6.1 工作总结

相较于传统的加密技术,信息隐藏是当前保护信息的重要方法。而基于图像的信息隐藏是信息隐藏的一个重要分支,目前很多研究者研究出了无损的信息隐藏恢复方法,能够无损的将隐藏的秘密信息恢复出来,有效的保护信息的完整性。但是含有秘密信息的载体图像在网络上传输,很容易被噪声对载体图像进行攻击,导致提出的隐藏图像也受到破坏。本文是以基于图像的信息隐藏为基础,从受到噪声攻击的载密图像中提取的隐藏图像。由于隐藏图像也受到破坏,导致隐藏图像也含有很多噪声。因此,本文以隐藏图像的噪声为研究对象,尝试利用群智能、深度神经网络等方法结合图像的局部和全局特征,构建从比特级到像素级的隐藏图像进行恢复模型,有利于秘密信息的还原和保护。具体总结如下:

(1)构建了从比特位到像素级的隐藏图像修复方式第二章算法与传统直接在像素层面进行修复的思路不同,提出了一种基于位修复和像素修复相结合的层次化修复方式。该方法从图像位平面的比特位作为切入点,优先恢复对图像结构影响最大的高比特位,即像素的第 7 位和第 8 位。具体而言,通过评估像素失真程度来定位“可信像素”作为修复基准,并结合自然图像的局部相关性先验,在特定约束条件下实现高位推理。为进一步提升精度,将凸壳理论应用于区域划分,以几何最优的方式确保局部区域的内在一致性,为准确修复高位提供保障。而第三章到第五章是采用像素级的修复方式。

(2)采用了由局部至全局的隐藏图像修复思路第二章算法是通过局部模式下的比特位修复结合像素级的隐藏图像恢复模式,由于图像局部区域的相关性在平滑区域更强,纹理区域像素相关性相对较弱。因此,对平滑区域效果提升非常显著,纹理是在约束条件非常强的情况下修复,导致很多纹理区域效果并不理想。第三章是采用图像分块后插值策略,这样通过块中插值方法结合块中可信点凸壳能够提高对块中纹理区域拟合的准确性。第四章是基于图像全局方式对隐藏图像进行修复。第五章是通过图像的局部预估计和全局处理相结合的方式对隐藏图像实现修复的。总而言之,本研究体现为首先在图像的局部区域利用像素间的强相关性进行修复,进而将局部的修复结果和策略扩展到整个图像,实现对隐藏图像全面、系统的恢复。

(3)实现了从群智能到深度学习的算法应用与融合本研究在修复方法上是从群智能优化、插值,再到深度神经网络。具体而言,研究初期针对隐藏图像修复这一复杂的组合优化问题,引入了共生生物搜索(SOS)与社交网络搜索(SNS) 等先进的群智能算法,利用其强大的搜索能力,在像素候选值中寻找最优解。随后,为克服单一算法的局限,本文提出了混合修复框架,将群智能、凸壳计算、自然邻域插值等方法进行协同,依据图像区域中可信点凸壳分别作用于不同区域,实现了从单纯应用算法到有机整合不同方法优势的跨越。面对高噪声密度下全局语义信息严重丢失的挑战,研究使用深度学习,并进行了融合:将可信像素标签矩阵作为先验知识嵌入条件生成对抗网络(CGAN),以引导修复过程。最后构建了融合自适应细粒度通道注意力(FCA)与 Swin Transformer 的架构,使其能同时捕捉局部与全局特征,有效缓解了深度学习模型的过平滑问题,并将几何方法(凸壳)作为深度学习网络的预处理模块,为其提供高质量初始估计。最终达到实现隐藏图像恢复的目的。

(4)提出算法的性能比较本研究中,不仅在视觉上展示了不同方法的修复效果,还通过客观指标 PSNR 和SSIM 对算法进行客观测评。第二章的方法是通过结合位修复和共生生物搜索的方式恢复隐藏图像,是根据图像局部像素之间强相关性。算法能够较好的恢复平滑区域,但是纹理区域像素相关性比较弱,因此,对纹理区域修复时采用了比较强的约束条件。后期使用共生生物搜索,但是以邻域的可信像素为参考,导致纹理区域修复的效果不理想,而且无法考虑图像纹理的变化情况。而第三章通过分块、凸壳和插值的方式提高了纹理区域拟合的效果,但是由于不同块之前也存在一些联系,在块中凸壳外的像素修复时,没有考虑到块之间的联系。因此,难免存在恢复不准确的情况。第四章和第五章都是基于深度神经网络构建的模型。第四章是基于 CGAN 网络,生成的图像纹理结构并不清晰,在 SSIM 指标上没有表现很突出。而第五章通过引入 FCA 后,确实能够对恢复图像的纹理细节有较大的帮助,加上对图像进行了处理,使得两个指标都呈现了较好的效果。虽然通过网络恢复的图像也存在那些细小的特征平滑问题,但是通过候选值基本上可以恢复的原图非常相近。因此,所提出的算法恢复效果优于前三个算法。

6.2 工作展望

在过去的很长一段时间中,对图像恢复的研究一直在进行,虽然取得了很多的成果,但是对含有噪声的隐藏图像恢复还需要继续关注和研究。而本论文在基于群智能和深度学习的隐藏图像恢复领域取得了显著进展,针对特殊噪声的修复提出了多种创新性算法。展望未来,该领域的研究可以从以下几个方向进一步深化和拓展:

(1)由于隐藏信息的嵌入与提取操作直接作用于像素的位,将这些位按规则重新排列构成位平面,然后计算出隐藏图像的像素。像素的高两位承载了图像绝大部分的结构与轮廓信息,其正确性对整个图像的视觉质量和恢复效果具有决定性影响。基于此,首先从遭受噪声破坏的载密图像中提取其高两位比特平面,并将其重构成一幅灰度图像,称为“高位图像”。该图像虽然丢失了细节,但保留了原始图像的主体框架。将受损的“高位图像”与对应的原始“高位图像”作为输入对深度神经网络模型进行训练。该网络的学习目标是映射出降噪后的、高质量的高位图像。通过网络输出,可以精准比对并定位出哪些像素的高两位比特在攻击中已被破坏,这些像素被标识为“不可信像素”。最终,用修复后的正确高位比特值替换这些像素原有的错误值,从而率先实现对图像整体结构的可靠重建,为后续的精细修复奠定坚实基础。在成功恢复图像的高位结构之后,修复进入第二阶段,旨在恢复低位比特所承载的图像细节。此时,重新计算可信点和不可信点。对于每一个不可信点,根据其已被修正的高两位比特,可以推断出其在完整 8 位像素值中可能归属的数值区间,该区间内的所有可能值即构成该像素的“候选值集合”。此后,算法需要综合利用空间上下文信息来完成最终修复。利用图像固有的空间冗余性,在全局和局部约束下,为每一个剩余的噪声点赋予最合理的视觉细节,从而实现对隐藏信息的完整、高保真恢复。

(2)当前研究多聚焦于特定类型或单一模式的噪声干扰,缺乏对复杂、多样化噪声环境的充分模拟。由于现有方法通常基于较为单一的噪声假设(如独立分布的高斯噪声或均匀分布的脉冲噪声),其在面对真实网络攻击中常见的混合型、动态变化的噪声时,表现往往受限。因此,未来的研究亟须向更贴近实际攻击场景的复杂噪声模型拓展,例如设计融合脉冲噪声与高斯噪声的混合攻击模型,甚至模拟在传输过程中可能遭遇的严重结构化破坏,如图像部分区域被裁剪、覆盖或替换等情形。在此基础上,可进一步构建具备噪声感知与自适应修复能力的智能处理框架。该框架应能自动识别输入载密图像所受噪声的类型与污染密度,进而根据噪声特征动态选择或融合多种修复策略。例如,在检测到低密度脉冲噪声时,优先采用基于冗余编码的位修复机制;而对于高密度混合噪声,则转向基于智能优化算法或深度学习的修复模型,实现噪声的鲁棒去除与信息重建。通过引入多策略自适应调度机制,不仅能够有效提升信息恢复的准确率,还将显著增强算法对未知噪声类型和复杂攻击场景的泛化能力。

(3)目前很多研究是基于图像的局部考虑,由于隐藏图像存在可信点和候选值的特点。从针对独立比特或像素的局部操作,转向将图像视为一个完整整体的全局优化。那些已经通过高位修复被确认为正确的像素,不再仅仅是孤立的可靠数据点,而是被重新定义为整个图像空间中的“约束点”。这些约束点构成了一个稀疏但高度可靠的内部坐标网格,如同一个支撑起图像整体结构的骨架。它们保留了图像在遭受攻击前固有的结构、轮廓和关键纹理信息。利用散布在整个图像中的可信点网格作为硬约束,驱动一个图像生成或插值模型(例如,基于扩散先验或自适应插值算法),来产生一幅初始的、完整的重建图像。这幅图像在可信点位置与已知正确值完全一致,而在不可信点区域则根据周围可信点的分布和图像本身的连续性先验,生成视觉合理的填充内容。紧接着,根据包含不可信点所有可能的像素取值的候选值,对已生成的不可信点进一步选择和替换。从而为每个不可信点筛选出既满足低位比特约束,又与整体图像结构和局部纹理最为协调的最优值。

参考文献 略


提交代写需求

如果您有论文代写需求,可以通过下面的方式联系我们。