1、学号2111407029广 州 大 学硕士研究生学位论文开题报告题目: 基于胸部CT的肺结节自动检测法研究 专 业: 电子与通信工程 研究方向: 硕士研究生姓名: 刘晨辉 导师姓名: 邹采荣 广州大学研究生处填表说明:1、 表格要求统一以“小4号宋体”字体填写,双面打印,表格的格式和页码次序不能擅自改变,如需附页一律加在本表格后面,并注明前后接连地方;2、 所有栏目须填写清楚,不留空白,所有审核意见须填写具体、有针对性;3、 凡没有建立班组或系教研室的,基层组织意见或系教研室意见一律由学院主管院长负责填写:4、 签名必须由相应责任人签名,不得打印代替;5、 须盖学院(所)公章的地方不能不盖;6
2、本表一式三份,学院(所)审核后,研究生本人留一份,学院留存一份,报研究生处一份。学位论文题目基于胸部CT的肺结节自动检测算法研究 本研究题目是否属导师课题的一部分?如果是的话,属哪一部分?学 位 论 文 的 类 型(在相应栏目划):1、理论研究2、应用基础3、用于生产4、其 他一、立题依据(包括国内外研究现状和发展趋势、文献综述、研究目的、意义等):随着环境污染的不断加重,近年来全球肺癌的发病率呈不断上升的趋势, 肺癌已成为一个影响人们健康的重要问题。2012年中国肿瘤登记年报指出,目前肺癌仍居我国肿瘤发病率及死亡率第一位,2014年国内癌症死亡病例211万,其中首因正是肺癌。研究表明,晚期
3、肺癌病人5年生存率小于10%,仅有15%30%的肺癌诊断时无扩散,而早期肺癌手术后5年生存率可达70%以上1。因此,在临床上尽早发现肺部肿瘤,对提高患者的存活率和治疗效果至关重要。随着医学影像技术的快速发展,CT技术在扫描速度和空间分辨率上有很大的改善,其生成影像可以轻易检出直径范围小于1mm的病灶区域,因此CT被认为是检查肺结节最好的影像学手段2,3。肺癌早期征象在CT图片上的最常见表现形式是肺结节(pulmonary nodule)。肺结节通常是指直径不超过3cm的肺内类圆形病灶,肺结节因其位置不定,形态各异,密度与肺部其它组织相近,且体积较小,目前对肺结节的检测仍然是医学界的难题。为了解
4、决上述问题,近年来计算机辅助诊断(Computer Aided Diagnosis, CAD)已成为国内外研究的热点。计算机辅助诊断系统利用获取的医学图像,运用图像处理、模式识别等技术并结合医学知识,先对获取的图像进行处理和特征提取,通过分析帮助医生对病灶进行诊断。因此,通过CAD系统对薄层 CT 进行肺结节的辅助检测和定性诊断已成为一个新的研究方向4。大量研究表明,CAD系统能有效地帮助放射科医生从CT图像中检测出肺结节,使诊断的结果更加客观5,6,7。因此,利用CAD系统对CT图像进行分析处理,实现对肺结节的准确检测有着广阔的应用前景,对提高患者的治疗效果和生存率,具有十分重要的意义,其社
5、会经济效益非常可观。自上世纪90年代后期以来,基于CT的肺部疾病CAD系统已成为全球的研究热点之一。近年来,相关专家学者们针对肺部CAD系统做了大量的研究,取得了很大进展,有些CAD系统己投入到临床应用当中。目前对肺癌CAD系统的研究较多的科研单位有美国的芝加哥大学,哈佛大学,斯坦福大学等,日本的神户大学等;同时还有一些大跨国医疗公司的部分肺癌CAD系统(如Philips的Pulmo package系统,Siemens的Syngo Lung CARE CT系统和GE公司的GE Rapid Screen Digital Lung VCAR系统)已投入商业应用领域。一个典型的肺癌CAD系统通常包含
6、以下几个部分:1)肺实质的分割;2)肺结节的获取。近年来,国内外学者对这些方面做了大量的研究。国内外对肺实质的分割方法,大体可以分为:基于阈值的分割方法8,9,可形变边界的方法10,11。目前使用最多的方法是基于阈值分割的方法, 但由于这种方法只考虑到 CT 图像中的灰度信息,而忽略了空间信息,因而导致了在对肺实质进行分割时,往往造成某些与胸壁或血管连接的病灶漏检。因此,在实施该方法时,常结合形态学、模版匹配的方法来提高分割的效果。获取肺结节的常用方法一般有阈值分割法、滤波器法等方法。其中滤波器法是目前候选结节识别研究的热点。常用的有滤波器方法有Li12等人提出的选择性增强滤波器。其可对球形结
7、节进行有选择性的增强,而对其它形状的物体如血管和支气管等结构进行抑制,达到只突显结节的目的。另外还有基于高斯函数的检测器的探测方法,通过多尺度平滑图像产生多幅图像并且构建高斯图像金字塔,通过该图像金字塔以及极值找到不同大小的结节并且实现位置和大小的估计。目前的CAD系统仍然存在一些问题。例如对肺结节的准确分割。由于肺结节特征提取的有效性很大程度取决于肺结节分割的精确性,因此,准确分割肺结节是实现准确肺结节检测的前提。由于肺结节的形态存在多样性,而目前的检测算法大多是在假设肺结节是孤立的、类圆形的情况下进行的,这就造成了分割算法的局限性。又因为肺结节的位置存在随机性,对与血管、气管、胸壁粘连的肺
8、结节进行有效分割仍然是目前该领域的难题。为了提高肺结节检测的准确性,同时降低后期诊断出现的假阳性率。可以通过准确的肺结节定位来实现肺结节的准确切割,在保留结节的原始特征的同时,能够有效的提高后期诊断的准确性。参考文献1 李彬,田联房,欧陕兴,恶性肺结节早期诊断智能识别相关技术综述,生物医学工程学杂志,26(5):1141-1145, 2009.2 M. Puderbach and H. Kauczor,Can lung MR replace lung CT,Pediatric Radiology, 38(3):439-451, 2008.(下接P12)二、研究内容(说明课题的具体内容,独创及新
9、颖之处,重点解决的问题,预期的研究成果):本文的研究内容是对肺部CT图像中出现的肺结节进行自动检测和识别。其中主要包括以下几个部分:1 肺结节的分割:将疑是肺结节区域完整的从原始肺部CT图像中分割出来。分割的准确性直接影响到后期的识别,这对于整个检测系统至关重要。2 肺结节特征提取:在将疑是肺结节区域分割出来后,提取该区域的多种特征,例如灰度特征、位置特征、形态特征,作为后期分类识别的依据。3 肺结节识别:根据提取出来的特征并且利用分类器例如常用的SVM(Support Vector Machine)分类器进行分类,判断其是肿瘤还是其他干扰性的组织。本文的新颖之处有以下几点:第一,利用高斯差分
10、函数(DoG,Difference of Gaussian)对结节进行定位从而获取结节。在所有结节的中心处找出一个点作为关键点,以该点代表相应的肺结节,同时根据相应的模糊尺度实现结节切割。相对于已有的利用高斯拉普拉斯函数(LoG,Laplace of Gaussian)对结节进行位置和大小的估计,DoG能够简化一定计算复杂度。第二,结合黑塞矩阵(Hessian Matrix)的特性,通过设置一系列的规则从而剔除错误的关键点,以达到降低假阳性率的目的并提高肺结节检测的准确性。重点解决的问题:1、 解决特征点选取时容易出现的边缘响应和corner响应。2、 将关键点定位到结节中心区域。3、 在分割
11、出肺结节的同时,保持肺结节的局部特征。4、 算法实现时的效率问题。预期的研究成果:1、 能够定位到所有不同位置不同大小的疑是结节区域,并且关键点准确落位到结节中心部分。2、 能够有相对低的假阳性检测结果。也就是关键点尽量少的落位在非结节区域,例如血管、肺边缘等。3、 对于不同位置的肺结节,能够实现准确的分割,并且在分割的同时保留了肺结节的局部特征。4、 能够根据所提取的特征自动诊断肺结节,对于不同病例的不同CT图像,能够给出可观的检测率。三、科研方案设计(包括:研究方法、技术路线、理论分析、计算、实验方法和步骤及其可行性,可能出现的技术问题及解决方法)1、研究方法在本文中主要应用了三种研究方法
12、即文献研究法、定量分析法和实验法。1)文献研究法:通过阅读大量国内外相关的文献获得了本文研究目的和意义,对肺结节检测的研究现状有了进一步认识,从而全面、正确的了解肺结节检测常用的算法和研究内容。2)定量分析法:在编程实现阶段,通过定量分析法可以验证所用算法,在不同的阈值状态下产生的关键点定位情况。根据多个阈值的设置情况对不同位置的关键点所产生的影响,分析总结出不同的关键点对不同阈值的敏感情况,从而找出一系列能够在排除不恰当关键点且保留正确的关键点的阈值设置。在面对不同种类的肺部结节的情况下的检测性能。同时根据所得出的实验效果,改善相关参数设置,找到最具有稳定性的参数环境和阈值设置。对于不同参数
13、中产生的的效果,分析原因,以便总结出在获得最优检测率的情况下还能保持比较低的假阳性率的方法。3) 实验法:在Visual Studio2013平台上,利用开源视觉库opencv对所研究算法进行实现和改进,以此来验证理论的可靠性。同时随机抽取一些CT图像,验证所有的算法和参数对不同图像中不同形态和位置的结节的定位情况,以此来检测所有算法的稳定性并加以改进。对于不同图像所产生的效果,总结分析,以便找出对于大部分图像能够获得最优检测率的情况下还能保持比较低的假阳性率的方法。同时在分割的过程中,根据所有算法的尺度进行分割,验证定位和分割的准确性。2、技术路线本文采取的技术路线为:1) 通过预处理减少噪
14、声对实验结果的影响,同时利用灰度拉伸来增强感兴趣区域(RoI,Region of interest)并减少背景的干扰;2) 根据肺实质的形状特征从CT图像中提取肺实质区域;3) 利用高斯差分函数以及尺度不变特征转换(SIFT)的关键点提取方法,在构建的差分高斯图像金字塔中找到关键点,并且根据相应特征排除一系列不符合要求的关键点;4) 根据所获取的关键点分割出肺结节;5) 提取所获得的肺结节的多种特征并进行分类,判断是否是肿瘤。肺部CT源图像肺结节分割肺结节定位图像预处理肺结节特征提取 肺肿瘤识别3、理论分析肺结节的检测主要难度在于获取疑是肿瘤结节的准确度和可靠性。肺结节在CT图像中通常以白色圆
15、形亮斑的形式出现并且越是中心亮度越大,因此在不同尺度的(下接P14)四、基础及条件(包括:已经做过的有关研究工作,本单位或外单位可供使用的仪器设备和实验条件,已经获得或将要获得的经费等):目前已经在Visual Studio2013的基础上,结合开源视觉库OpenCV,已经完成了以下工作:1) 完成了对肺实质的提取。利用多个CT图像中肺实质局域具有的相同特点,从原始图像中提取了肺实质区域并且将其他区域设置为纯黑或者纯白以方便后期处理。这里采用的是肺实质的面积和周长特征,通常在常见的1024*1024的图像中,肺实质区域是明显大于其他由于部分大节点或者血管形成的不规则物体的面积的,通常面积为50
16、000到100000个像素点,边长为8000到12000个像素点。2) 完成了对选择性增强滤波器的仿真实现,了解到该滤波器的优缺点以期在后期定位中加以运用,在这基础上更加深入的了解了肺结节的局部特性以及肺结节分割的难点。该方法主要通过构建黑塞矩阵(Hessian Matrix),根据该矩阵的特征根以及类结节和其他形状物体的特性设置输出函数。3) 完成了最初的高斯差分函数(DoG)在结节定位上的运用。具体是指构建高斯图像金字塔和高斯差分图像金字塔,选取极大值作为候选特征点。根据初步的分析得到部分阈值排出了部分假阳性候选点。以上工作基于对多个病例的多个CT图像进行研究,目前圆点滤波器被证明因其自身
17、的缺点会造成更大的假阳性检测率,而利用初步的高斯差分函数进行定位的假阳性率也比较高,需要进行进一步的研究,降低假阳性率。本人在老师的指导下,正一步一步加深对计算机辅助诊断系统(CAD)认识和研究,在深入理论理解同时,加强编程能力的提高,从而更好的达到算法实现的目的。目前正加强C/C+以及OpenCV的学习。除此之外,对于后期算法的改进,需要进一步的研究学习更多的相关论文,从论文中找点子、学方法,从而更好的改善目前结节定位的情况。本文的肺结节提取是基于准确的肺结节定位的基础上进行的。因此接下来研究的重点是改进高斯差分函数在肺结节定位时的准确度并且降低错误定位的可能。再次之后进行特征提取和分析,这
18、里的可能用到的特征有纹理特征、形状特征、空间关系特征。之后进行学习支持向量机(SVM)等分类器将特征进行分类,从而检测判断。目前所用到的实验条件有:戴尔台式电脑,软件有Visual Studio2013、opencv2.4.9,同时还有中山大学附属第六医院的赵进明主任的指导以及其放射科提供的实例病例CT图像。学 位 论 文 工 作 计 划时 间研 究 内 容预期效果2015.1-2015.32015.4-2015.82015.9-2015.112016.1-2016.22016.2-2016.32016.3-2016.5学习查阅肺实质提取的相关文献,在VS2013平台上用C/C+实现查阅相关肺
19、结节切割方法,总结分析各种方法的优缺点。同时利用高斯差分函数定位在原有高斯差分函数基础上,优化该方法在结节定位上的应用提取分割出的结节特征,并在医院医生的指导下总结出肿瘤在CT图像中的常见特征学习了解常用的分类器,根据提取到的特征进行分类回顾整个检测系统,对算法进行优化研究应用拓展,并撰写论文并准备论文答辩实现理想的肺实质提取,将肺实质区域从CT图像中分割出来总结得到结节提取的相关特点,得到初步结节定位结果得出一种准确性有所提高并且能够大大降低假阳性率的结节定位方案 实现不同结节的特征提取,比较不同特征提取算法的优缺点判断CT图像中的疑是肿瘤结节 确定一个整合后的完整肺结节检测系统 完成毕业设
20、计论文和准备毕业答辩事宜论文工作起止日期2015.1-2016.5预计论文答辩日期2016.5科研经费开支计划低值设备仪器名称数 量金 额项 目金 额试验材料费试剂药品费旅 差 费资 料 费其 它合计金额:开题报告人签名: 年 月 日广州大学研究生学位论文开题报告审核表研究生姓 名导 师专 业研究方向论文题目:开题报告时间:地点:开题报告审核小组组成姓名职称所在单位成员签名组长成员开题报告中提出的主要问题及回答的简要情况:记录人签名: (不够写可加附页) 年 月 日审核小组意见:(开题报告审核小组就论文选题意义及创新点,国内、外相关文献掌握程度和研究方法的可靠性,论文总体设计的科学性和可行性,
21、存在的主要不足等提出意见或修改建议。)建议:1、通过。2、不通过,建议1个月内重新进行开题报告审核或终止学业。 组长签名: (不够写可加附页) 年 月 日学院(研究所)审查意见:主管领导签名: (公章) 年 月 日 广州大学研究生处制表(上接P3)5 Q. Li, Recent progress in computer-aided diagnosis of lung nodules on thin-section CT, Computerized Medical Imaging and Graphics, 31(4-5):248-257, 20076 L. Saba, G. Caddeo, G
22、 Mallarini, Computer-Aided Detection of Pulmonary Nodules in Computed Tomography: Analysis and Review of the Literature, Journal of Computer Assisted Tomography, 31(4):611-619, 20077 I. Sluimer, A. Schilham, M. Prokop, and B. Ginneken, Computer Analysis of Computed Tomography Scans of the Lung: A S
23、urvey, IEEE Transactions on Medical Imaging, 25(4):385-405, 20068 S. Ukil and J. M. Reinhardt, Anatomy-guided lung lobe segmentation in X-ray CT images, IEEE Transactions on Medical Imaging, 28(2):202-214, 20099 S. H. Peng, D. H. Kim, S. L. Lee, M. K. Lim, Texture Feature Extraction Based on a Unifo
24、rmity Estimation Method for Local Brightness and Structure in Chest CT Images, Computers in Biology and Medicine, 40(11-12):931-942, 201010 魏颖,徐心和,贾同, 赵大哲, 基于优化水平集方法的CT图像肺结节检测算法, 系统仿真学报, (z2):909-911, 200611 M. Silveira, J. Nascimento, and J. Marques, Automatic segmentation of the lungs using robust
25、 level sets, in Proceedings of the 29th IEEE Annual International Conference of Medicine and Biology Society (EMBS07), 4414-4417, 200712 Q. Li, L. Feng, D. Kunio,Computerized detection of lung nodules in thin-section CT images by use of selective enhancement filters and an automated rule-based class
26、ifier, Academic Radiology, 15(2):165-175, 2008(不够可加页)(上接P5)高斯模糊下通过高斯差分函数能够找到可以代表结节中心的点以及对应模糊尺度的核的大小。另外结节的位置也多样化,除了正常的出现在肺实质区域内以孤立结节的形式出现,也可能出现在于肺壁粘连的地方,血管交叉点以及与血管相粘连。本文采用定位的方式找到结节实现分割,这样无论对于孤立结节或者是与肺壁相连的结节,都能够在结节特征不变的前提下分割出来,当然对于肺部结节处于两根血管交叉处,需要进一步进行分析研究,找出合适的分割尺度。本文提出通过被认为等同于高斯拉普拉斯函数(LoG,Laplace of
27、 Gaussian)且运算量相对小很多的高斯差分函数(DoG,Difference of Gaussian)来对肺结节进行定位。由于高斯差分函数对边缘有很大的敏感度,因此本文在预处理阶段将非肺实质区域转换成白色背景,以减少边缘响应。另外对于部分不合格的候选关键点,需要做进一步的分析处理。目前有的方法是计算特征点的主曲率,对于主曲率超过自定义阈值的点则将其排除,以期保留更准确的关键点。目前DoG定位产生的假阳性率会超过150%,准确度在40%50%之间。4、主要的技术难点:1) 通过算法的研究与总结,提高结节定位的准确度,对于部分位置或者形状特殊的结节,找到对应方法加强检测。2)分析容易出现错误关键点的地方,例如结节边缘、肺实质边界、肺部角状处等,找到共同具有的一些特征,设立一系列的阈值加以排除。3)结节的大小不一,运用可变模板将探测到的结节通过合适的尺度切割出来也是一个重要的难点。