基于深度学习的视网膜血管分割思考

发布时间:2022-01-30 21:14:27 论文编辑:vicky

本文是一篇高校毕业论文,笔者认为在中国,随着老龄化进度的加快,越来越多的人得了眼部疾病。据有关部门的统计,现阶段,全国中小学中有超过一半的学生有近视。目前,一些地区已经将眼底检查作为体检项目的一部分,如果使用机器进行诊断,这就对算法的泛化能力要求较高。虽然本文的算法在视网膜血管分割领域取得了一定的分割效果,也提高了分割的精度,但是对于未来的大规模应用方面依然存在许多挑战。


第一章 绪论


1.1 研究背景和研究意义

眼睛是人体获得外部信息的最重要的感知器官之一,眼睛的病变会导致视觉的损失甚至是致盲严重影响人的生活水平和生活质量。根据相关的调查表明,目前我国是世界上致盲和视觉损伤人数最多的国家之一[1]。并且随着我国人口的急速老龄化和人们生活水平的改变,与年龄相关的眼底疾病、高度近视造成的眼底疾病以及代谢性眼底疾病,逐渐显示出上升的趋势。

现代科学研究表明,眼病如果能够在早期进行预防和治疗能够大幅度减轻致盲的风险。目前许多研究表明眼部疾病和心脑血管疾病会在病情的一定阶段,导致眼底视网膜血管结构的变化[2]。图 1.1(a)为正常人的眼底彩色图像,图 1.1(b)高血压患者会导致视网膜发生动脉硬化[3],图 1.1(c)糖尿病会导致视网膜出现微血管瘤并造成血管阻塞[4],图 1.1(d)急性白血病会导致视网膜静脉血管扩张血液渗出[5]。眼科或者内科医生可以通过临床手段的观察到患者的视网膜血管结构来判断患者的患病程度并作为下一步临床诊疗的依据[6]。

随着科学技术的发展,目前眼底的视网膜成像技术如眼底彩照和光学相干断层扫描技术已经趋于成熟,眼科医生可以较为方便的操作仪器获得清晰的眼底图片。但是由于目前中国因为电子设备的普及以及学习生活压力的增大造成眼部损害的患者数量的不断攀升。而专业的眼科执业医师的数量和精力有限,并且受到自身的经验影响,导致诊断的准确性难以保证,甚至有可能发生漏检。因此,目前越来越多的人研究使用深度学习技术进行视网膜血管的自动分割作为辅助诊疗的手段。


1.2 国内外的研究现状

专业的眼科医生可以根据眼底视网膜血管形态和生理性变化,对眼科疾病进行诊断。但是如果采用传统的人工筛选的方式对视网膜血管进行审查不仅主观而且还会影响医生的工作效率。随着科学技术的发展,采用计算机辅助的诊断的视网膜血管自动分割算法已经逐渐的成为眼底图像辅助诊疗的研究重点。目前,国内外的专家学者提出了许多具有建设性意义的优秀算法,按照是否使用手工分割图像进行监督,这些算法可以分为两种:无监督方法,监督方法。

1.2.1 无监督算法

无监督方法主要是利用视网膜血管的固有特征进行分割,因此并不需要人工手工标记的信息作为监督信息,可以直接在图像上对血管结构进行提取。常见的无监督的方法可以分为匹配滤波,血管跟踪,基于形态学的方法,以及基于模型的方法等[7]。

(1)匹配滤波算法

在1989年,Chaudhuri等[8]在研究中引入了高斯滤波器用于视网膜血管分割。高斯滤波具有中间数值较高,四周数值较低的特性,与血管图像的空间分布较为相似。因此,作者使用了不同方向的过滤器来检测不同方向的血管。 为了将血管与背景区域分开,作者不断调整阈值的大小,然后将阈值之后的最大过滤结果用作最终分割结果。Hoover 等[9]在 Chaudhuri 的基础上,使用了局部阈值的对高斯滤波器处理后的图像进行阈值分割,在一定程度上避免了因为光照等因素造成的误分割,提高了视网膜血管的分割准确率。除此之外,一些结合优化算法的匹配滤波算法也被应用在视网膜血管分割中,Cinsdikici 等[10]结合了蚁群算法对视网膜血管图像进行处理,但是由于算法的缺陷性,导致分割得到的血管较粗。

(2)基于血管跟踪算法

眼底视网膜血管都具有连通的特点,Liu 等[11]利用这一特性,使用血管边缘梯度等进行血管跟踪。首先需要人工设定跟踪种子点,并依据血管的连通性和宽度,边缘梯度等判断血管的方向进行追踪。由于使用了血管的固有特性进行跟踪,因此可以很好地掌握血管的详细信息。但是,复杂的血管分布和跟踪算法的固有特性使该方法在血管交叉处以及分支处容易受到影响。Can 等[12]使用了局部区域的灰度极小值点作为种子点,但是当视网膜血管中出现病变则会导致分割效果较差。Yin 等[13]人提出了一种采用概率跟踪的方法,通过抽样在若干血管的边缘进行选择,之后使用高斯滤波器以及贝叶斯的方法对视网膜局部血管结构进行识别,并通过依次的迭代,最终取得较好的分割结果。基于血管跟踪的方法,虽然可以使取得的分割图像的连通性较好,但是对于一些对比度较低的血管分支点和交叉点分割效果并不是很好。


第二章 深度学习理论基础和图像预处理


2.1 卷积神经网络

深度学习也被称为深度神经网络,其主要的理论最早可以追溯到上世纪50-60 年代。当时感知器的出现吸引了许多机器学习专家和研究人员的关注。Rosenblatt 等[25]在研究中证明了对于线性可分的数据,感知器模型可以做到收敛。1998 年 Yann LeCun 等[26]创新性的提出了经典的卷积神经网络 LeNet 在手写数字体识别任务上取得了低于 1%的错误率。Hinton 等在 2006 年首次提出深度学习的概念。之后,2012 年 AlexNet[27]以极高的准确率取得 ImageNet 竞赛的冠军,远超当时使用传统机器学习的团队,造成了轰动效应。从那时候开始越来越多人开始研究卷积神经网络,并间接的促进的深度学习技术的发展。卷积神经网络可以说是深度学习的基础部分。

图像分割技术目前拥有广阔的应用前景,传统的图像分割技术,大多采用阈值分割[28],区域生长算法[29],基于边缘的分割算法[30],以及分水岭算法[31]等将物体和背景区分开来,但是传统的数字图像处理算法并不能判断分割出的物体属于哪一类。然而,使用卷积神经网络的深度神经网络模型,在目前大量数据和算力的支持下往往可以对图像中物体的前景和背景进行精确的分类。本节将从感知器模型开始,并介绍在卷积神经网络和一些具有突破性的网络模型结构的发展中出现的基本理论。


2.2 语义分割网络

2.2.1 FCN

传统的图像分割多利用图像的固有特征进行分割,如将猫和狗的区域和背景区域区分开,但是我们只能最后主观判断哪个是前景哪个是背景。语义分割是在像素级别上对像素进行分类。最初的方法是将图像分成块输入到神经网络中,但是由于神经网络中的全连接层需要完全一样大小的输入,因此要求使输入的图像大小一致。2014 年 Jonathan Long[22]提出了全卷积神经网络,与传统卷积神经网络不同全卷积神经网络会对特征图的尺寸进行恢复,从而实现端到端的训练。全卷积神经网络在图像语义分割中具有重要的意义,开启了神经网络进行语义分割的新篇章。

高校毕业论文怎么写

如图 2.11 是 FCN 的模型,由于图像分割要求输入输出大小一样,而卷积神经网络中的下采样模块会导致图片大小减小。全卷积神经网络提出了对神经网络进行改进,提出了一种上采样的模块,实现了端到端。这样可以让网络模型为图像中的一个像素点都有相应空间位置的类别预测结果。一般而言,我们称下采样过程叫做编码过程,上采样过程叫做解码过程,目前大多数的语义分割网络均遵循编码解码结构。


第三章 基于改进 U-Net 的视网膜血管分割研究.................................29

3.1 算法整体流程.................................. 30

3.2 注意力机制............................................ 31

第四章 基于改进 LadderNet 的视网膜血管分割研究......................... 45

4.1 算法整体流程.......................................... 46

4.2 通道增强参数共享残差块.........................................46

第五章 工作总结与展望........................................57

5.1 总结................................................ 57

5.2 展望............................................ 58


第四章 基于改进 LadderNet 的视网膜血管分割研究


4.1 算法整体流程

首先,由于眼底视网膜图像存在因为光照等其他因素造成的血管和背景的对比度较低的问题,本文使用了对比度较高的绿色通道做图像增强处理。为了解决视网膜血管分割数据集较小的问题,本章采用了随机切片的方式对视网膜血管图像进行处理。之后将处理好的数据集输入到模型中进行训练,并使用 10%的数据作为验证数据,在实验的过程中通过验证集上的表现监督训练的过程,存储在验证集中表现较好的模型作为本文的训练模型。之后将测试数据集进行切片处理,并输入到训练好的模型中得到分割图,之后将分割后的切片拼合成原图像大小,并计算其各项的评价指标。

在 LadderNet 中参数共享残差块具有重要的作用,一方面添加参数共享残差块能够减少网络模型的参数,另一方面使用这种使用模块的设计有助于网络模型的修改。从上章我们知道使用注意力机制能够有效的提高网络模型的性能,考虑到使用的 LadderNet 网络中存在多条路径,并且每条路径都可以看作是一个小型的 FCN 网络模型。由于模型比较复杂,LadderNet 拥有更为优秀的处理噪声的能力,但是由于使用较深的路径,因此有可能会造成在多信息流中特征的丢失。因此为了让信息流在网络中能够较好的传递,防止一些信息在 LadderNet 的多路径中丢失,本章改进了参数共享残差块,并在其中添加了 SE 模块。本文改进的参数共享残差块如图 4.1 所示。

高校毕业论文参考


第五章 工作总结与展望


5.1 总结

现阶段,随着深度学习技术的发展,医学图像分析领域获得了新的发展机遇,目前许多研究者开始基于深度学习技术研究各种在医学中遇到的问题。目前来讲,使用深度学习技术辅助分割胰腺、肺、肝脏等器官逐渐被越来越多的医生所接受。根据目前的临床实践来看,眼底视网膜在临床上具有重要的研究价值。眼科医生可以根据眼底视网膜血管的病变判断病人的疾病以及严重性,并做出相应的诊断和治疗。传统的人工方法分割结果受医生的主观判断严重。本文以目前的研究为基础,提出了两种新的视网膜血管分割算法,分别在 DRIVE 数据集、CHASE_DB1 数据集以及 STARE 数据集上进行了相关的实验研究,并取得了较好的分割结果。本文的研究工作主要由以下几部分构成:

(1)本文首先从是否使用标签进行监督学习,分为监督算法和无监督算法两种大类,之后详细的介绍了每个类别中一些常见的视网膜血管分割算法,以及其本身存在的缺点,进而引出深度学习技术进行视网膜血管分割。之后,简单介绍了深度学习技术涉及到的相关知识点,并介绍目前的常用数据集以及相关的图像预处理算法,为接下来的实验研究做铺垫。

(2)针对使用 U-Net 模型对视网膜血管中的细微结构分割效果差的问题,基于神经网络中的注意力机制进行研究,提出了一种结合空间注意力机制和通道注意力机制的视网膜血管分割网络 ASR-UNet 模型。通过使用注意力机制,提高了网络模型的分割能力,在 DRIVE 数据集以及 CHASE_DB1 数据集上的实验结果表明,网络的各项指标均有较好的表现,取得了较好的分割结果。

(3)为了改善 U 形结构中图像传递的信息流有限,抗干扰能力差等问题。结合上章关于注意力机制的研究,基于 LadderNet 模型提出了一种结合通道注意力机制以及多尺度融合模块的视网膜血管分割网络。该算法改进了 LadderNet 中虽然增加信息流但是没有有效利用多尺度信息的缺点,并且在多条路径中添加通道注意力机制防止细节信息在多路径中丢失。在 DRIVE 数据集以及 STARE 数据集上的实验表明,本章的算法有效的提升了视网膜血管分割的精度。

参考文献(略)

提交代写需求

如果您有论文代写需求,可以通过下面的方式联系我们。