灰度图像二值化方法研究毕业设计论文.doc

资源描述

《灰度图像二值化方法研究毕业设计论文.doc》由会员分享，可在线阅读，更多相关《灰度图像二值化方法研究毕业设计论文.doc（46页珍藏版）》请在三一文库上搜索。

1、灰度图像二值化方法研究毕业设计（论文）灰度图像二值化方法研究毕业设计（论文）原创性声明和使用授权说明原创性声明本人郑重承诺：所呈交的毕业设计（论文），是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知，除文中特别加以标注和致谢的地方外，不包含其他人或组织已经发表或公布过的研究成果，也不包含我为获得及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体，均已在文中作了明确的说明并表示了谢意。作者签名：日期：指导教师签名：日期：使用授权说明本人完全了解大学关于收集、保存、使用毕业设计（论文）的规定，即：按照学校要求提交毕业设计（论文）的

2、印刷本和电子版本；学校有权保存毕业设计（论文）的印刷本和电子版，并提供目录检索与阅览服务；学校可以采用影印、缩印、数字化或其它复制手段保存论文；在不以赢利为目的前提下，学校可以公布论文的部分或全部内容。作者签名：日期：目录摘要IIIAbstractIV第一章绪论11.1 图像与数字图像11.2 数字图像处理技术内容与发展现状21.3 灰度图像二值化原理及意义4第二章软件工具MATLAB62.1 MATLAB概述62.2 MATLAB的工作环境62.3 MATLAB图像处理工具箱82.4 工具箱实现的常用功能9第三章图像二值化方法113.1 课题研究对象113.2 二值化方法研

3、究动态133.3 全局阈值法183.4 局部阈值法18第四章 Otsu方法和Bernsen方法204.1 Otsu算法分析204.2 Otsu方法流程图224.3 Bernsen算法分析234.4 Bernsen方法流程图23第五章 Otsu方法和Bernsen方法实验比较255.1 Otsu方法实验结果分析255.2 Bernsen方法结果分析275.3 0tsu方法和Bernsen方法实验结果比较285.4 结论29结束语31参考文献32致谢33附录：源代码34摘要在人类获取的信息中，视觉信息约占60%，听觉约占20%，其它约占20%。由此可见，视觉信息对人类非常重要。同时，图像是人类

4、获取视觉信息的主要途径。图像二值化是图像预处理中的一项重要技术，在模式识别、光学字符识别、医学成像等方面都有重要应用。论文介绍了图像及数字图像处理技术的一些概念和相关知识；对Matlab7.0 软件的发展和软件在图像处理中的应用做了简要介绍；还介绍了灰度图像二值化方法以及利用Matlab7.0软件工具进行算法的实现。课题重点实现了图像分割技术中灰度图像二值化方法，如Otsu算法、Bernsen算法，并对这些算法运行的实验结果进行分析与比较。关键词：图像处理，二值化，Matlab，Otsu算法，Bernsen算法AbstractHuman beings obtain a lot of info

5、rmation, among which the visual information is about 60%, the sense of hearing about 20%, and others about 20%. Therefore, the visual information is very important for human beings. Moreover, the images are the primary way, by which a lot of information is obtained. Image binarization, as an importa

6、nt technology in image pre-processing, is widely-employed in pattern recognition, optical character recognition, medical imaging and so forth. In this paper, some notions and relative knowledge in digital image processing technology are introduced; then, the development of Matlab7.0 and its applicat

7、ion in image processing briefly introduced; in addition, the method of grayscale image binarization and how to implement these algorithms based on Matlab7.0 are presented. This paper mainly implements the grayscale image binarization method in image segmentation technology, such as Otsu algorithm an

8、d Bernsen algorithm, and analyzes and compares the experimental results of the above algorithms.Keywords: Image processing, Binarization, Matlab, Otsu algorithm, Bernsen algorithm40第一章绪论1.1 图像与数字图像图像就是用各种观测系统观测客观世界获得的且可以直接或间接作用与人眼而产生视觉的实体。视觉是人类从大自然中获取信息的最主要的手段。拒统计，在人类获取的信息中，视觉信息约占60%，听觉信息约占20%，其他方

9、式加起来才约占20%。由此可见，视觉信息对人类非常重要。同时，图像又是人类获取视觉信息的主要途径，是人类能体验的最重要、最丰富、信息量最大的信息源。通常，客观事物在空间上都是三维的(3D)的，但是从客观景物获得的图像却是属于二维(2D)平面的。图像存在方式多种多样，可以是可视的或者非可视的，抽象的或者实际的，适于计算机处理的和不适于计算机处理的。但就其本质来说，可以将图像分为以下两大类。模拟图像。包括光学图像、照相图像、电视图像等。比如人在显微镜下看到的图像就是一幅光学模拟图像。对模拟图像的处理速度快，但精度和灵活性差，不易查找和判断。数字图像。数字图像是将连续的模拟图像经过离散化处理后得到的

10、计算机能够辨识的点阵图像。在严格意义上讲，数字图像是经过等距离矩形网格采样，对幅度进行等间隔量化的二维函数。因此，数字图像实际上就是被量化的二维采样数组。一幅数字图像都是由若干个数据点组成的，每个数据点称为像素(pixel)。比如一幅256400，就是指该图像是由水平方向上256列像素和垂直方向上400行像素组成的矩形图。每一个像素具有自己的属性，如颜色(color)、灰度(gray scale)等，颜色和灰度是决定一幅图像表现里的关键因素。其中颜色量化等级包括单色、四色、16色、256色、24位真彩色等，量化等级越高，则量化误差越小，图像的颜色表现力越强。同样，灰度是单色图像中像素亮度的表征

11、，量化等级越高，表现力越强。但是随着量化等级的增加，数据量将大大增加，使得图像处理的计算量和复杂度相应的增加。与模拟图像相比，数字图像具有以下显著优点：(1) 精度高。目前的计算机技术可以将一幅模拟图像数字化为任意的二维数组，即数字图像可以由无限个像素组成，每个像素的亮度可以量化为12位(即4096个灰度级)，这样的精度是数字图像处理与彩色照片的效果相差无几。(2) 处理方便。数字图像在本质上是一组数据，所以可以用计算机对他进行任意方式的修改，如放大、缩小、改变颜色、复制和删除某一部分等。(3) 重复性好。模拟图像，如照片，即便是使用非常好的底片和相纸，也会随着时间的流逝而褪色、发黄，而数字图

12、像可以存储在光盘中，上百年后再用计算机重现也不会有丝毫的改变。1.2 数字图像处理技术内容与发展现状数字图像处理就是采用一定的算法对数字图像进行处理，以获得人眼视觉或者某种接受系统所需要的图像处理过程。图像处理的基础是数字，主要任务是进行各种算法设计和算法实现。目前，图像处理技术已经在许多不同的应用领域中得到重视，并取得了巨大成就。根据应用领域要求的不同，数字图像处理技术可以分为许多分支技术。重要的分支技术有：(1) 图像变换。图像阵列很大时，若直接在空域中处理，计算量将很大。为此，通常采用各种图像变换方法，如傅立叶变换、沃尔什变换、离散余弦变换、小波变换等间接处理技术，将空域处理转换到变换域

13、处理，这样可以有效地减少计算量，提高处理性能。(2) 图像增强与复原。主要目的是增强图像中的有用信心，削弱干扰和噪声，使图像更加清晰，或者将其转换为更适合人或机器分析的形式。图像增强并不是要求真实地反映原始图像，而图像复原则要求尽量消除或减少获取图像过程中所产生的某些退化，使图像能够反映原始图像的真实面貌。(3) 图像压缩编码。在满足一定保真度条件下，对图像信息进行编码，可以压缩图像信息量，简化图像的边式，从而大大压缩图像描述的数据量，以便存储和传输；图像压缩在不同应用背景下可以采用不失真压缩和失真压缩。(4) 图像分割。图像分割是数字图像处理中的关键技术之一，是为了将图像中有意义的特征提取出

14、来。它是进一步进行图像识别、分析和理解的基础。图像的有意义特征包括图像的边缘、区域等。(5) 图像分析。对图像中的不同对象进行分割、分类、识别、描述和解释。(6) 图像识别。图像识别属于模式识别的范畴，起主要内容是在图像经过某些预处理（增强、复原、压缩）后，进行图像分割和提取，从而进行判别分类。图像分类常用的经典识别方法有统计模式分类和句法模式分类。近年来，新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中越来越受到重视。(7) 图像隐藏。是指媒体信息的相互隐藏，常见的有数字水印和图像的信息伪装等。以上图像处理内容也并非孤立存在的，往往相互联系，而一个实用的图像处理系统通常需要将几种图

15、像处理技术结合起来，才能得到所需要的结果。例如，图像变换是图像编码技术的基础，而图像增强与复原一般又是图像处理的最终目的，也可以作为进一步图像处理工作的准备；通过图像分割得到的图像特征既可以作为最后结果，也可以作为下一步图像分析的基础。不同的图像处理技术应用与不同的领域，发展出不同的分支学科，如遥感图像处理、医学图像处理等，其他如计算机图形学、模式识别、人工智能和机器人视觉等学科领域也与图像处理有着密切的关系。图像处理技术的发展大致经历了初创期、发展期、普及期和实用化期4个阶段。初创期开始与20世纪60年代，当时的图像采用像素型光栅进行少秒显示，大多采用中、大型机对其处理。在这一时期，由于图像

16、存储成本高、处理设备昂贵，其应用面很窄。进入20世纪70年代的发展期，开始大量采用中、小型机进行处理，图像处理也逐渐改用光栅扫描方式，特别是CT和卫星遥感图像的出现，对图像处理技术的发展起到了很好的推动作用。到了20世纪80年代，图像处理技术进入普及期，此时的微机已经能够担当起图形图像处理的任务。超大规模集成电路（Very Large Scale Integration, VLSI）的出现更使处理速度大大提高，设备造价也进一步降低，极大地促进了图形图像系统的普及和应用。20世纪90年代是图像处理技术的实用化时期，图像处理的信息量巨大，对处理速度的要求极高。针对现有的实际应用，数字图像处理具有以

17、下特点。(1) 信息量大，要求处理速度比较快。目前，数字图像处理的信息大多是二维信息，处理信息量很大。比如一幅256256低分辨率的黑白图像，要求64Kbit的数据量；对高分辨率彩色512512图像，则要求256Kbit数据量；如果要处理30帧/s的视频图像，则每秒要求处理500Kbit22.5Mbit数据量。因此对计算机的计算速度、存储容量等要求较高。(2) 占用频带较宽。与语音信息相比，数字图像占用的频带要大几个数量级。如电视图像的带宽约56MHz，而语音带宽仅为4KHz左右。所以数字图像在成像、传输、存储、处理、显示等各个环节的实现上，技术难度较大，成本高，且对频带压缩技术提出了更高的要

18、求。(3) 数字图像中各个像素间的相关性强，压缩潜力大。在图像画面上，经常有很多像素有相同或接近的灰度。就电视画面而言，同一行中相邻两个像素或相邻两行间的像素，其相关系数可达0.9以上。一般而言，相邻两帧之间的相关性比帧内相关性还要大。因此，图像处理中的信息压缩潜力巨大。(4) 图像质量评价受主观因素影响。数字图像处理后的图像一般需要给人观察和评价，而人的视觉系统很复杂，受环境条件、视觉性能、人的情绪、爱好以及知识状况影响很大，因此评价结果受人的主观因素影响较大。为此，如何客观评价图像质量还有待进一步深入的研究。另外，计算机视觉是模仿人的视觉，人类的感知原理必然严重影响计算机视觉的研究。(5)

19、图像处理技术综合性强。数字图像处理技术中设计的基础知识和专业技术相当广泛，通常涉及通信技术、计算机技术、电子技术、电视技术以及更多的数学、物理等方面的基础知识。例如，图像编码的理论基础是信息论和抽象数学的结合，而图像识别则需要掌握随机过程和信号处理方面的知识。此外，不少课题还需要更加专业的知识，如小波变换、神经网络、分形理论等。另外，图像处理是一门应用性很强的学问，必须与计算机技术的发展相适应。随着电子技术和计算机技术的不断提高和普及，数字图像处理技术进入高速发展时期。1.3 灰度图像二值化原理及意义灰度图像是指只含亮度信息，不含色彩信息的图像。将彩色图像转化成为灰度图像的过程称为图像的灰度

20、化处理。彩色图像中的每个像素的颜色有R、G、B三个分量决定，而每个分量有255种值可取，这样一个像素点可以有1600多万的颜色的变化范围。而灰度图像是R、G、B三个分量相同的一种特殊的彩色图像，一个像素点的变化范围为255种，所以在数字图像处理中一般先将各种格式的图像转变成灰度图像以使后续的图像的计算量变得少一些。灰度图像的描述与彩色图像一样仍然反映了整幅图像的整体和局部的色度和亮度等级的分布和特征。图像的灰度化处理可先求出每个像素点的R、G、B三个分量的平均值，然后将这个平均值赋予给这个像素的三个分量。图像的二值化处理就是将图像上的点的灰度置为0或255，也就是使整个图像呈现出明显的黑白效果

21、。即将256个亮度等级的灰度图像通过适当的阀值选取而获得仍然可以反映图像整体和局部特征的二值化图像。在数字图像处理中，二值图像占有非常重要的地位，特别是在实用的图像处理中，以二值图像处理实现而构成的系统是很多的，要进行二值图像的处理与分析，首先要把灰度图像二值化，得到二值化图像，这样子有利于再对图像做进一步处理时，图像的集合性质只与像素的值为0或255的点的位置有关，不再涉及像素的多级值，使处理变得简单，而且数据的处理和压缩量小。二值图像在图像分析中应用非常广泛，二值图像就是指只有两个灰度级的图像，二值图像具有存储空间小，处理速度快，可以方便地对图像进行布尔逻辑运算等特点。更重要的是，在二值图

22、像的基础上，还可以进一步对图像处理，获得该图像的一些几何特征或者其他更多特征。第二章软件工具MATLAB2.1 MATLAB概述MATLAB是Matrix Laboratory的缩写，是由美国MathWorks公司推出的计算机软件，经过多年的逐步发展与不断完善，现已成为国际公认的最优秀的科学计算与数学应用软件之一，是近几年来在国内外广泛流行的一种可视化科学计算软件。它集数值分析，矩阵运算，信号处理和图形显示于一体，构成了一个方便的，界面友好的用户环境，而且还具有可扩展性特征。MathWorks公司针对不同领域的应用，推出了信号处理，控制系统，神经网络，图像处理，小波分析，鲁棒控制，非线性系统

23、控制设计，系统辨识，优化设计，统计分析，财政金融，样条，通信等30多个具有专门功能的工具箱，这些工具箱是由该领域内的学术水平较高的专家编写的，无需用户自己编写所用的专业基础程序，可直接对工具箱进行运用。同时，工具箱内的函数源程序也是开放性的，多为M文件，用户可以查看这些文件的代码并进行更改，MALAB支持用户对其函数进行二次开发，用户的应用程序也可以作为新的函数添加到相应的工具箱中。MATLAB中的数字图像是以矩阵形式表示的，这意味着MATLAB强大的矩阵运算能力用于图像处理非常有利，矩阵运算的语法对MATLAB中的数字图像同样适用。本文对MATLAB图像处理工具箱进行探索及应用，实验证明该软

24、件功能强大，语言简洁易学，人机界面友好，工具箱具有丰富的技术支持并集成了该领域专家的智慧，应用简单而效果良好。2.2 MATLAB的工作环境MATLAB的工作环境简单明了，易于操作，使用的MATLAB软件一般是6.x版本。其工作环境包括五个部分：命令窗口(Command Window)，MATLAB的主窗口用户可以直接在此窗口输入命令，系统将自动显示信息；启动平台(Launch Pad)，当用户需要启动某个工具箱的应用程序时，可以在启动平台中实现。工作空间(Workspace)，MATLAB工作空间作为一个独立的窗口，其操作相当方便。它包含着用户已建立的变量，而且变量在工作空间中是以矩阵的形式

25、存储；命令历史记录(Command History)，主要显示在命令中已执行过的命令；当前路径窗口(Current Directory)，主要显示当前工作在什么路径下进行，包括M文件的打开路径，双击M文件名打开该文件进行编辑。如图2.1所示。图2.1 MATLAB6.X论文中使用的MATLAB软件为7.0版本，如图2.2所示。图2.2 MATLAB7.0MATLAB7.0针对编程环境、代码效率、数据可视化、数学计算、文件I/O操作等方面都有进行不断升级、增加了新功能。为此、相对于以前的版本，也具有一些新的特性。就起开发环境方面来说：(1) 重新设计的桌面环境，针对多文档界面提供了简便的管理和访

26、问方法，允许用户自定义桌面外貌，创建常用命令的快捷方式。(2) 增强数组编辑器(Array Editor)和工作空间浏览器(Workspace Browser)功能，用于数据的显示、编辑和处理。(3) 在当前目录浏览器(Current Directory Browser)工具中，增加了代码效率分析、覆盖度的分析等功能。(4) 增加了M-Lint编码分析，能辅助用户完成程序性能分析，提高程序执行效率。(5) 对M文件编辑器(M-Editor)进行了功能增强，可以支持多种格式的源代码文件可视化编辑，如C/C+、HTML、Java等。2.3 MATLAB图像处理工具箱数字图像处理工具箱函数包括以下1

27、5类：(1) 图像显示函数；(2) 图像文件输入、输出函数；(3) 图像几何操作函数；(4) 图像像素值及统计函数；(5) 图像分析函数；(6) 图像增强函数；(7) 线性滤波函数；(8) 二维线性滤波器设计函数；(9) 图像变换函数；(10) 图像邻域及块操作函数；(11) 二值图像操作函数；(12) 基于区域的图像处理函数；(13) 颜色图操作函数；(14) 颜色空间转换函数；(15) 图像类型和类型转换函数。MATLAB图像处理工具箱支持四种图像类型，分别为真彩色图像、索引图像、灰度图像、二值图像，由于有的函数对图像类型有限制，这四种类型可以用工具箱的类型转换函数相互转换。MATLAB可

28、操作的图像文件包括BMP、HDF、JPEG、PCX、TIFF、XWD等格式。2.4 工具箱实现的常用功能就图像处理的基本过程讨论工具箱所实现的常用功能。(1) 常用图像操作：图像的读写与显示操作：用imread()读取图像，imwrite()输出图像，把图像显示于屏幕有imshow()，image()等函数。imcrop()对图像进行剪裁，图像的插值缩放可用imresize()函数实现，旋转用imrotate()实现。(2) 图像增强功能：图像增强是数字图像处理过程中常用的一种方法，目的是采用一系列技术去改善图像的视觉效果或将图像转换成一种更适合于人眼观察和机器自动分析的形式。常用的图像增强方

29、法有以下几种：灰度直方图均衡化。均匀量化的自然图像的灰度直方图通常在低灰度区间上频率较大，似的图像中较暗区域中细节看不清楚，采用直方图修整可使原图灰度集中的区域拉开或使灰度分布均匀，从而增大反差，使图像的细节清晰，达到增强目的。直方图均衡化可用histeq()函数实现。灰度变换法。照片或电子方法得到的图像，常表现出低对比度即整个图像较亮或较暗，为此需要对图像中的每一像素的灰度级进行标度变换，扩大图像灰度范围，以达到改善图像质量的目的。这一灰度调整过程可用imadjust()函数实现平滑与锐化滤波。平滑技术用于平滑图像中的噪声基本采用在空间域上的求平均值或中值。或在频域上采取低通滤波，因在灰度

30、连续变化的图像中，我们通常认为与相邻像素灰度相差很大的突变点为噪声点，灰度突变代表了一种高频分量，低通滤波则可以削弱图像的高频成分，平滑了图像信号，但也可能使图像目标区域的边界变得模糊。而锐化技术采用的是频域上的高通滤波方法，通过增强高频成分而减少图像中的模糊，特别是模糊的边缘部分得到了增强，但同时也放大了图像的噪声。在MATLAB中，各种滤波方法都是在空间域中通过不同的军纪模板即滤波算子实现，可用fspecial()函数创建预定义的滤波算子，然后用filter2()或conv2()函数在实现卷积运算的基础上进行滤波。(3) 边缘检测和图像分割功能边缘检测是一种重要的区域处理方法，边缘是所要提

31、取目标和背景的分界线，提取出边缘才能将目标和背景区分开来。如果一个像素落在边界上，那么它的邻域将成为一个灰度级变化的带。对这种变化最有用的两个特征就是灰度的变化率和方向。边缘检测算子可以检查每个像素的邻域并对灰度变化率进行量化，也包括对方向的确定，其中大多数是基于方向倒数掩模求卷积的方法。MATLAB工具箱提供的edge()函数可针对sobel算子、prewitt算子、Roberts算子、log算子和canny算子实现边缘检测的功能。基于灰度的图像分割方法也可以用简单的MATLAB代码实现。(4) 图像变换功能图像变换技术是图像处理的重要工具，常运用于图像压缩、滤波、编码和后续的特征抽取或信息

32、分析过程。MATLAB工具箱提供了常用的变换函数，如fft2()与ifft2()函数分别实现二维快速傅立叶变换与其逆变换，dct2()与idct2()函数实现二维离散余弦变换与其逆变换，Radon()与iradon()函数实现Radon变换与逆Radon变换。除以上基本图像处理功能，MATLAB还提供了如二值图像的膨胀运算dilate()函数、腐蚀运算erode()函数等基本数学形态学与二值图像的操作函数。第三章图像二值化方法3.1 课题研究对象论文主要研究BMP格式的灰度图像文件。BMP(Bitmap Picture)文件格式是Windows系统交换图形、图像数据的一种标准格式。BMP图像

33、的数据由四个部分组成，如表3.1所示。表3.1 BMP图像文件结构文件部分属性说明BITMAPFILEHEADER(位图文件头)bfType文件类型，必须是0x424D，即字符串 “BM”bfSize指定文件大小，包括这14个字节bfReservered1保留字，不用考虑bfReservered2保留字，不用考虑bfOffBits从文件头到实际位图数据的偏移字节数BITMAPINFOHEADER(位图信息头)biSize该结构长度，为40biWidth图像的宽度，单位是像素biHeight图像的高度，单位是像素biplanes位平面数，必须是1，不用考虑biBitCount指定颜色位数，1

34、为二值，4为16色，8为256色，16，24、32为真彩色biCompression指定是否压缩，有效的值为BI_RGB，BI_RLE8，BI_RLE4，BI_BITFIELDSbiSizeImage实际的位图数据占用的字节数biXPelsPerMeter目标设备水平分辨率，单位是每米的像素数biYPelsPerMeter目标设备垂直分辨率，单位是每米的像素数biClrUsed实际使用的颜色数，若该值为0，则使用颜色数为2的biBitCount次方种biClrImportant图像中重要的颜色数，若该值为0，则所有的颜色都是重要的Palette(调色板)rgbBlue该颜色的蓝色分量rgbGr

35、een该颜色的绿色分量rgbRed该颜色的红色分量rgbReserved保留字ImageData(位图数据)按像素按行优先顺序排序，每一行的字节数必须是4的整倍数第一部分为位图文件头BITMAPFILEHEADER，它是个结构提，其定义如下：typedef struct tagBITMAPFILEHEADER WORD bfType；DWORD bfSize；WORD bfReserved1；WORD bfReserved2；DWORD bfOffBits； BITMAPFILEHEADER；这个结构的长度是固定的，为14个字节(WORD为无符号16位二进制整数，DWORD为无符号32位二进制

36、整数)。第二部分为位图信息头BITMAPINFOHEADER，也是一个结构，其定义如下： typedef struct tagBITMAPINFOHEADER DWORD biSize； LONG biWidth；LONG biHeight; WORDbiPlanes；WORD biBitCount； DWORD biCompression； DWORDbiSizeImage；LONG biXPelsPerMeter；LONG biYPelsPerMeter；DWORD biClrUsed；DWORD biClrImportant； BITMAPINFOHEADER；这个结构的长度是固定的，为

37、40个字节(LONG为32位二进制整数)。其中，biCompression的有效值为BI_RGB、BI_RLE8、BI_RLE4、BI_BITFIELDS，这都是一些Windows定义好的常量。由于RLE4和RLE8的压缩格式用的不多，一般仅讨论biCompression的有效值为BI_RGB，即不压缩的情况。第三部分为调色板(Palette)，当然，这里是对那些需要调色板的位图文件而言的。真彩色图像是不需要调色板的，BITMAPINFOHEADER后直接是位图数据。调色板实际上是一个数组，共有biClrUsed个元素(如果该值为零，则有2的biBitCount次方个元素)。数组中每个元素的类

38、型是一个RGBQUAD结构，占4个字节，其定义如下：typedef struct tagRGBQUAD BYTE rgbBlue；BYTE rgbGreen；BYTE rgbRed；BYTE rgbReserved； RGBQUAD；第四部分就是实际的图像数据。对于用到调色板的位图，图像数据就是该像素颜色在调色板中的索引值，对于真彩色图像，图像数据就是实际的R、G、B值。下面就2色、16色、256色和真彩色位图分别介绍。对于2色位图，用1位就可以表示该像素的颜色(一般0表示黑色，1表示白色)，所以一个字节可以表示8个像素。对于16色位图，用4位就可以表示一个像素的颜色，所以一个字节可以表示2个

39、像素。对于256色位图，一个字节刚好可以表示1个像素。下面有两点值得注意：(1) 每一行的字节数必须是4的整倍数，如果不是，则需要补齐。(2) BMP文件的数据存放是从下到上，从左到右的，也就是说，从文件中最先读到的是图像最下面的一行的左边的第一个像素，然后是左边的第二个像素，接下来是倒数第二行左边第一个像素，左边第二个像素。依次类推，最后得到的是最上面的最右边的一个像素。DIB(Device Independent Bitmap)图像格式是设备无关位图文件，描述图像能力基本与BMP相同，并且能够运行多种硬件平台，只是文件格式较大。3.2 二值化方法研究动态作为一种高效智能的人机交互手段，身份

40、证的快速识别技术可以广泛的应用于公民身份核查、暂住人口调查、旅店业登记核查、罪犯追逃等公安业务当中，大大提高了工作人员的录入速度，减少了用户的等待时间，提高了工作效率。由于身份证图像背景复杂，由激光防伪阴影网格线及各种版面噪声构成；且因激光防伪标志和打印条件的千差万别，再加上身份证图像质量偏差，给身份证的字符识别带来了很大的困难。必须经过预处理，除去大量的噪声信号，才能更好的进行字符的定位、分割，以及识别。而二值化是预处理中非常重要的一步，也是最为关键的一步，它直接影响到OCR 系统的性能。研究者在分析和讨论了多种图像二值化的优缺点后，在吸取各种方法优点的基础上，提出了一种新的身份证扫描图像的

41、二值化方法嵌入式多阈值动态自适应的二值化方法。图像二值化是图像处理中的一项基本技术，也是很多图像处理技术的预处理过程。在颗粒分析、模式识别技术、光学字符识别(OCR)、医学数据可视化中的切片配准等应用中，图像二值化是它们进行数据预处理的重要技术。由于图像二值化过程将会损失原图像的许多有用信息，因此在进行二值化预处理过程中，能否保留原图的主要特征非常关键。在不同的应用中，图像二值化时阈值的选择是不同的。因此，自适应图像阈值的选取方法非常值得研究。研究者对图像二值化方法进行了讨论，在此基础上提出了一个新的图像二值化算法。该算法基于数学形态学理论，较好地保留了图像二值化时原图的边缘特征。激光雕刻中图

42、像处理的二值化处理激光雕刻是近十几年随着激光技术的发展而产生的一种新的雕刻技术，它与计算机图形学、图像处理等学科的结合，应用在各种材料上进行文字、图案加工。如何能得到光滑且能真实反映原图像的雕刻图像是其中的主要问题，但是激光器的开关只有两种状态，因此，图像的二值化处理就成为了关键性技术，其中阈值的选取是决定二值化图像好坏的因素。现实世界中黑白二值图像很少用，大多数图像都是灰度图像或是彩色图像。要使这些图像适用于激光雕刻中，就需要对其进行二值化处，研究者针对激光雕刻总结了适用于雕刻的二值化处理，然而没有一种方法适合于所有图像雕刻的，因而实际中要选择一种合适的二值化方法，使得得到的二值图像效果最好

43、。在信息社会中人的身份识别得到广泛关注。指纹识别技术除了在传统的法律公安上得到应用之外，还有更广阔的应用前景，如计算机用户的确认、访问网络资源的口令、银行ATM 机和信用卡的使用、各类智能IC 卡的双重确认，以及雇员证明、海关身份鉴定、家用电子门锁等一个完整的自动指纹识别系统(AFIS) 包括指纹采集、指纹图像预处理、指纹特征提取和比对等几个模块。在自动指纹识别系统中,指纹图像的预处理是正确进行特征提取、比对等操作的基础,而二值化是指纹图像预处理中必不可少的一步。目前,国内外学者在这方面已经做了大量的工作，常用的二值化方法有固定阈值法、自适应阈值法、局部自适应阈值法等。由于指纹图像是一种方向性

44、很强的图像，这些方法仅仅利用了指纹图像的灰度信息，而忽略了指纹图像的方向信息，因此这些方法对指纹图像的二值化效果并不十分理想。尔后提出了一种改进的二值化方法：利用梯度法求取块方向图，将其量化成8个标准方向，以块方向代替点方向并利用灰度信息对指纹图像进行二值化。最后将该的方法和局部自适应阈值二值化方法及改进前的方法进行比较，可以发现：采用该方法二值化效果有了明显提高，对于不同质量的指纹图像有着令人满意的处理效果。结合Canny 算子的图像二值化方法，对经典的二值化方法Otsu 算法和Bernsen 算法中存在的缺点进行了分析后提出图像二值化方法，该方法综合考虑了边缘信息和灰度信息，通过边缘附近种

45、子点在高阈值二值化图像中的填充和低阈值图像对它的修补而得到二值化结果图像，较好地解决了经典二值化方法中存在的抗噪能力差、边缘粗糙、伪影现象等缺点，实验结果证明，该方法能够较好地解决低对比度图像和目标像素灰度不均匀图像的二值化问题。采用信号匹配的支票图像二值化提出了一种基于信号匹配的低信噪比图像的信号提取方法，解决类似支票日期域的这种既有复杂背景，又有印章噪声干扰的图像二值化问题。这种二值化方法完全不同于传统的方法，它从信号处理的角度出发，利用了部分先验知识和理想状态下的投影轮廓信号，再通过用不同阈值分割的投影信号与之匹配，匹配度最大时的阈值即为图像分割的最佳阈值。本方法比其他的传统的二值化方

46、法更具有自适应性和鲁棒性，通过大量的实验数据，以及与常用的其他算法进行的比较得到了验证。基于灰度的车牌图像二值化算法不均匀光照下的图像二值化是数字图像处理中的一个难题，汽车牌照自动识别系统工作在复杂的光照环境下，经常会出现车牌光照不均的现象，给图像二值化带来困难。为此，研究者提出一种解决办法，首先使用同态滤波去掉车牌图像的不均匀光照的影响，然后使用改进的Bernsen 算法对车牌图像进行二值化。实验表明，使用该算法能有效地克服不均匀光照的影响，二值化效果良好，车牌识别率得到显著的提高；针对常用车牌识别二值化算法存在的问题，提出了基于分形维数的二值化的方法。根据分形维数反映图像复杂程度的定义，通

47、过计算两次突变的分维数，来确定图像的灰度值范围，并利用该灰度值范围确定阈值。并通过实验，表明利用分形维数所得到的阈值进行二值化处理较传统方法有较大改进，且该方法解决了在自然光和不同光照背景下对车牌识别的干扰问题，也可以从复杂背景中提取出倾斜的车牌；偏白或泛白背景的车牌图像二值化方法，在车辆牌照识别系统中，由于摄像机畸变、动态范围太窄、车辆牌照被污染等原因，灰度化的车辆牌照图像背景变得模糊，接近于字体的灰度或者动态范围不高，使得前景字体跟背景难以分开。该文采用高帽与低帽形态滤波增强车牌图像中的字体，去除背景对图像的影响，使用基于迭代的图像分块二值化算法进行二值化。实验表明，该算法可有效克服偏暗或泛白背景的影响，二值化效果良好。基于自组织特征映射(SOFM)神经网络的图像融合二值化方法介绍了SOFM 神经网络的特点及学习算法，根据SOFM 的聚类确定图像第一阈值作为循环迭代的初始值，对整幅图像进行循环迭代得到第二阈值，使用第二阈值对原始图像进行二值化，得到第一幅待融合图像；通过改

展开阅读全文