储粮害虫图像压缩算法的研究 毕业论文.doc

上传人:小小飞 文档编号:3911344 上传时间:2019-10-10 格式:DOC 页数:39 大小:1.97MB
返回 下载 相关 举报
储粮害虫图像压缩算法的研究 毕业论文.doc_第1页
第1页 / 共39页
储粮害虫图像压缩算法的研究 毕业论文.doc_第2页
第2页 / 共39页
储粮害虫图像压缩算法的研究 毕业论文.doc_第3页
第3页 / 共39页
储粮害虫图像压缩算法的研究 毕业论文.doc_第4页
第4页 / 共39页
储粮害虫图像压缩算法的研究 毕业论文.doc_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《储粮害虫图像压缩算法的研究 毕业论文.doc》由会员分享,可在线阅读,更多相关《储粮害虫图像压缩算法的研究 毕业论文.doc(39页珍藏版)》请在三一文库上搜索。

1、毕 业 设 计( 2010 届 )题 目 储粮害虫图像压缩算法的研究学 院 数学计算机学院 专 业 计算机科学与技术 年 级 2006级 学生学号 12006242502 学生姓名 指导教师 2010年 5月 7日储粮害虫图像压缩算法的研究 摘 要: 图像压缩一直以来都是图像处理领域的研究热点.本文首先从图像压缩的基本原理出发,对当前常用图像压缩技术与编码原理作出一个基本的介绍与分析.然后再重点讨论学习小波变换图像压缩原理和算法.之后再选取几种典型图像编码方法,并用MATLAB仿真实现对储粮害虫图像的压缩处理.最后,根据对实验结果的分析和比较,得出一个科学客观的实验结论.关键词:图像压缩;算法

2、;小波变换;MATLAB中图分类号: TP391Study on Compression Algorithm on Image of Stored Grain PestsAbstract: Image compression has always been a hot research focus in the field of image processing. First of all, based on the basic principle of image compression, a brief introduction and analysis of current image

3、compression technology and encoding theory is given. Next, the application of wavelet transform to image compression is studied. After that, several typical kinds of image compression method is chosen to run on the platform of MATLAB software. At last, this paper develops into a scientific and objec

4、tive conclusion on the base of comparison and analysis of the experimental results.Key words: Image compression; Algorithm;Wavelet transform;MATLAB目录1 引言11.1 应用背景11.2 研究背景12 数字图像压缩编码的理论基础32.1 数字图像的几种类型32.2 图像压缩的基本思想52.3 数字图像压缩的可能性52.4 数字图像压缩技术的分类73 常用图像压缩编码技术及原理83.1 第一代图像编码方法83.1.1 统计编码83.1.2 基于字典的编

5、码93.1.3 预测编码103.1.4 变换编码113.1.5 矢量编码123.2 第二代图像编码方法133.2.1 子带编码133.2.2 分形编码133.2.3 小波变换图像压缩编码143.2.4 模型基编码143.2.5 基于神经网络的图像编码144 小波变换图像压缩编码154.1 小波和小波变换的理论基础154.1.1 小波理论的产生154.1.2 小波的基本概念164.1.3 小波变换的基本概念174.2 基于小波变换的图像压缩编码184.2.1 小波变换图像压缩的基本思想及原理184.2.2 小波变换图像压缩编码的优良特性184.2.3 小波变换的图像分解与重构194.3 几种常用

6、的小波变换压缩编码方法205 典型图像压缩编码算法的MATLAB仿真实现215.1 MATLAB小波工具箱及索引图像215.2 图像类型转换225.3 图像压缩编码275.3.1 基于最简单小波变换的图像压缩275.3.2 基于最简单小波变换的图像压缩的改进305.3.3 基于小波包最好基的图像压缩326 结论34致 谢35参考文献36储粮害虫图像压缩算法的研究1 引言1.1 应用背景随着计算机技术、信息处理、智能检测等技术的迅猛发展,基于机器视觉的图像识别检测方法得到了迅速的发展,成为粮虫智能检测方法的发展方向而在之前的储粮害虫人工检测,由于其效率低下,不能准确、及时地检测出粮虫的信息,正面

7、临着粮虫智能检测系统的巨大挑战在储粮害虫图像智能识别检测系统中,机器视觉系统采用CCD照相机实时拍摄粮仓害虫图像,并转化为数字信号,采用相应的技术使计算机能自动提取粮虫的形态性状、智能识别害虫种类,并能对害虫的数量自动计数12但是,图像数字化之后的数据量非常庞大,而磁盘存储空间的限制给实际应用带来了很大的困难,因此对图像的数据压缩就变得极为重要为了解决这个实际应用中的问题,图像的压缩编码则成为关键技术图像的压缩编码最直接的目的就是尽量降低一幅图像的数据量,同时具备以下两个条件中的其中一个:(1)或者保持图像的内容不变,即压缩图像具备表达原始图像的所有信息;(2)或者使图像内容的差别控制在一定范

8、围内,这个范围必须保证图像的关键信息(如储粮害虫的关键特征信息)不丢失,以便系统可以进行识别前一种情况无失真,被称作无损编码,而后一种情况有一定程度上的失真,被称作有损编码一般来说,有损压缩的效率比无损压缩的效率高出很多,很可能在压缩比达到数十倍甚至更高时也不会有明显的质量损伤3总之,在该系统中对图像编码除了要求更高数据压缩率外,还要求编码能提供足够高的图像清晰度以便满足智能系统可以识别粮虫的基本要求1.2 研究背景 自1948 年提出电视信号数字化后,人们就开始了对图像压缩编码的研究工作,至今已有半个多世纪的历程了经典的图像编码方法是基于Shannon信息论,其中最基本的Huffman编码(

9、熵编码)、预测编码和变换编码理论就产生发展于20世纪五六十年代,且影响到今天,在目前已知的图像压缩编码的国际标准中,仍然被普遍采用上个世纪五十年代和六十年代的图像压缩技术由于受到电路技术等的制约,仅仅停留在预测编码、亚采样和内插复原等技术的研究,对视觉特性也做了一些重要的工作1966 年,J.B.O Neal对比分析了DPCM和PCM,并提出了对电视的实验数据进行编码,1969 年进行了线性预测编码的实际实验1969 年美国召开第一届图像编码会议标志着图像编码作为一门独立的学科诞生4近些年来,计算机和网络技术的迅速发展,以及人们对多媒体业务需求的猛增,推动数字图像处理和通信技术的快速发展相应的

10、新技术和新标准也应运而生数字图像压缩技术得到了迅速的发展和广泛的应用,并日臻成熟,其主要标志就是几个关于图像编码的国际标准35的制定上,即公布于1992年的ISO/IEC关于静止图像的编码标准JPEG,公布于2000年的新一代静态图像压缩技术JPEG2000,ITU-T 应用于实时视频通信领域的视频编码标准H.26X(其中包含了H.261、H.263和H.264等标准) 以及ISO/IEC 关于活动图像的编码标准MPEG(其中包含了MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21等标准)这些标准图像编码算法融合了各种性能优良的传统图像编码方法,是对传统编码技术的总结,代表

11、了当前图像编码的发展水平一般在研究和制定一种新的图像压缩标准的时,需要研究大量相关的理论和编码方案图像压缩标准实际上是由多种图像压缩编码方案组成的编码集在研究和开发数字图像压缩标准的过程中,出现了预测编码、熵编码、变换编码、混合编码和嵌入式编码等多种编码方法和技术从技术发展34的角度来看,Kunt 等人在1985 年提出了第一代图像编码和第二代图像编码的概念他将1948-1988年40年的以信息论和数字信号处理为理论基础,旨在去除图像数据中的线性相关性的一类编码技术成为第一代图像编码,如PCM、DPCM、DM、亚取样编码法,变换域的DFT、DCT、沃尔什-哈达玛变换编码等,以及以此为基础的混合

12、编码法均属于经典的第一代编码法这类技术去除客观和视觉的冗余信息的能力已经接近极限,其压缩比不高,而第二代图像压缩编码技术是指不局限于信息论的框架,要求充分利用人的视觉生理心理和图像信源的各种特征,能获得高压缩比的一类编码技术第二代编码方法多是80年代以后提出的新的编码方法,如金字塔编码、基于神经网络的编码、小波变换编码、模型编码、分形压缩编码,以及以这些方法为基础的混合编码方案一类仍属经典编码算法小波变换编码,自90年代以来日益受到人们的重视,特别是J.M.Shapiro于1993年提出的嵌入式零树小波变换编码(EZW)算法,与之前的各种算法相比,它有着优异的压缩性能,且提供了天然的多尺度、多

13、分辨率的图像描述方法,因而得到了广泛的应用此后,A.Said等人提出了改进的所谓分等级树的集分割SPIHT算法,在运算复杂度显著降低的同时,获得了与EZW算法相当或更好的压缩率,由此确立了小波变换在图像编码领域中的重要地位2 数字图像压缩编码的理论基础2.1 数字图像的几种类型数字图像按照记录方式可以分为两种:矢量图像和位图图像其中矢量图像主要用于各种数学图表及工程制图等方面而位图图像可以制作出色彩和色调变化丰富的图像,通常数码相机和扫描仪所捕获的图像都属于位图事实上位图图像也有多种表示方法,由于此论文是基于MATLAB软件的,所以下面笔者主要论述一下MATLAB支持的基本图像类型61)索引图

14、像索引图像包括图像矩阵和颜色图数组,其中颜色图是按图像中颜色值进行排序后的数组对于每个像素,图像矩阵包含一个值,这个值就是颜色图数组中的索引颜色图为的双精度矩阵,各行分别指定红、绿、蓝(R、G、B)单色值,且R、G、B均为值域0,1上的实数值图像矩阵与颜色图的关系依赖于图像矩阵是双精度类型还是unit8(无符号8位整数)类型如果图像矩阵为双精度类型,则第一点的值对应于颜色图的第一行,第二行的值对应于颜色图的第二行,依次类推各个点的值都对应于相应颜色的各个行如果图像矩阵是unit8,且有一个偏移量,即第0点的值对应于颜色图的第一行,第一点的值对应于颜色图的第二行,依次类推unit8类型常用于图形

15、文件格式,且它支持256色在MATLAB中,基本的数据结构是矩阵,其元素是一组有序实数或复数,这样可以方便的表示图像但是,在小波工具箱中,仅仅支持有序实数所表示的图像像素是图像显示的基本单元,表示图像矩阵中的一个元素;而在计算机的显示器上,像素代表了一个基本的点因此,通过一般矩阵下标从图像矩阵中可以很容易地选取一个像素图1索引图像表示一个典型的彩色图像需要两个矩阵来表示,即颜色图和图像矩阵颜色图是一组用来表示图像中颜色的有序数值对每一个图像像素来说,图像矩阵包含了颜色图的相应索引在此需注意,图像矩阵的元素是浮点型整数,而MATLAB将其作为双精度型数值存储对一个包含n个颜色的图像,其颜色图矩阵

16、是的,且颜色图矩阵的每一行都是的向量,即color = R , G , B ,其分量分别代表红、绿、蓝三种颜色状态,R、G和B是从0到1变化的实数当显示一个图像时,MATLAB会将这些数值转换为所对应的颜色的显示状态,具体转换过程如上图所示MATLAB显示索引图像时,使用图像矩阵中的值在颜色图中查找所需的颜色,如图1所示,如果图像矩阵中位置(100,200)上的值是18,那么像素(100,200)的颜色就是颜色图中第18行所代表的颜色2)RGB图像与索引图像一样,RGB图像也是分别用红、绿、蓝三个亮度值为一组,代表每个像素的颜色与索引图像不同的是,这些亮度值直接存在于图像数组中,而不是存放在颜

17、色图中图像数组为,其中m,n表示图像像素的行列数3)二进制图像在二进制图像中,每个点为两个离散值中的一个,这个值代表开或关二进制图像被保存在一个二维的由0(关)和1(开)组成的矩阵中从另一角度来讲,二进制图像可以看成为一个仅包括黑和白的特殊灰度图像,也可看做仅有两种颜色的索引图像二进制图像可以保存为双精度或unit8类型的数组,显然使用unit8类型更节省空间在图像处理工具相中,任何一个返回二进制图像的函数都是以unit8类型逻辑数组来返回的4)灰度图像在MATLAB中,灰度图像是保存在一个矩阵中的,矩阵中的每一元素代表一个像素点矩阵可以是双精度类型,其值域为0,1;矩阵也可以是unit8类型

18、,其数据范围是0,255矩阵中的每一个元素代表不同的亮度或灰度级,其中亮度为0,表示黑色,亮度为1(或者unit8类型的255),则代表白色2.2 图像压缩的基本思想7众所周知,信息论是数据压缩的理论基础从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,去掉确定的(可推知的)信息,也就是用一种更接近信息本质的描述来代替原有冗余的描述这个本质的东西就是信息量(信源熵)数据压缩是信源编码的目的和手段从广义上讲,数据压缩就是减少必须分配给指定消息集合或数据采样集合的信号空间的数值这一信号空间可以是一个物理容积,也可以是时间间隔,当然还可以是带宽数据压缩的目的是为了缓减现有系统特性的诸

19、多限制,例如带宽限制和存储空间等等从信息论观点来看,图像作为一个信源,其描述图像的数据是由信息量(信源熵)和信息冗余量两部分组成的去掉这些冗余信息就可以实现图像的压缩,而又不会损害图像的有用信息2.3 数字图像压缩的可能性数字图像是指一个被采样和量化后的二维函数,通常我们可以用一个二维数值矩阵来表示一幅图像8例如对图像取样,在按行、列各取样m、n次,将这些数据按取样点的相对位置排成一个矩阵并对每个元素进行量化,从而得到一个数值矩阵。那么,我们可以用这个数值矩阵代替函数,矩阵的元素称为数字图像的像素表示形式如下:若取样点数为,像素灰度级为,则存储一幅数字图像所需的位数至少为:图像压缩就是对数值矩

20、阵进行处理,用尽可能少的数据量来表示这个数值矩阵8图像用不同的方法表示需要不同的数据量,不同的表示方法都会产生不同程度的数据冗余,图像压缩的目的就是尽可能的减少这些冗余通常静止的数字图像表示存在三种基本的数据冗余89:1)像素间冗余=空间冗余+结构冗余空间冗余是指在原始图像中,图像上各个像素的灰度、颜色之间往往存在空间关联性,但是基于离散像素的表示方式通常没有利用图像之间的这种空间连贯性结构冗余是指在有些图像中,图像的纹理区域、像素灰度值有明显的分布模式如方格状的地板图案等由于这种连贯性和分布模式的存在,任何给定像素的值可以根据这个像素相邻的像素的值进行适当的预测,因而邻近像素间通常存在数据冗

21、余因为单个像素携带的信息相对较少,单一像素对一幅图像的多数视觉贡献是多余的,它的值可以通过以其相邻的像素值为基础进行预测为减少像素间冗余,通常用于最终人类观察的二维像素矩阵必须变换为更有效的形式例如,我们可以用部分像素信息和相邻像素之间的差异来描绘图像2)心理视觉冗余由于人类视觉系统的特点,人对所有视觉信息感受的灵敏度不同在图像处理过程中,待处理图像中各种信息的重要程度也不同,那些对人类视觉系统不十分重要的信息称作心理视觉冗余心理视觉冗余是与人的视觉感受相联系的,这些冗余在不削弱图像感知质量的情况下可以消除视觉系统对图像的亮度和色彩度的敏感程度相差很大,通常将看到的图像分为边缘与非边缘区域来处

22、理,总是把视网膜上的图像分解成为若干有向的频率通道再进行处理这些视觉系统的特点带来的视觉冗余是有损压缩的理论基础3)编码冗余通常,如果没有充分利用各种结果出现的概率去编码时,图像的编码就会存在编码冗余当一幅图像的灰度级直接用自然二进制数值来表示时,冗余总会存在在这种情况下,通常使用变长编码来降低编码冗余当上述这三种冗余的一种或多种得到减少或消除时,就实现了图像数据压缩另外,允许一定程度上的失真也是图像压缩的一个重要理论前提2.4 数字图像压缩技术的分类根据压缩后的图像能否完全恢复将图像压缩方分为两种:一种是无损压缩;另一种是有损压缩事实上,从信息论的角度出发对图像压缩进行分类,得出的分类结果和

23、上述情况是完全一致的1)无损压缩7,也称冗余压缩或熵编码利用图像数据的统计信息对无语义数据流进行压缩,以减少存储、处理及传输的数据量冗余压缩是可逆过程,利用压缩后的数据可以重新构造获得图像源数据,但压缩比较小无损压缩编码算法可分为两大类:基于统计概率的方法和基于字典的技术统计编码方法中常用的有Huffman 编码、算术编码;基于字典技术的编码方法有游程编码(RLE)和LZW编码等2)有损压缩7,也称熵压缩编码利用图像数据在时间域和频率域中的相关性(冗余)和人的视觉心理特征,对有语义数据进行适度压缩的有损编码压缩了熵,信息量会减少,而损失的信息量不能再恢复,因此有损压缩是不可逆过程,也就是说熵压

24、缩后恢复的图像与源图像肯定是有差别的熵压缩法的种类繁多,可进一步分为:(1)预测编码(Predictive Coding):利用先前和现在的数据对在时间或空间上相邻的下一个数据进行预测,从而达到压缩的目的如增量调制()、差分脉冲编码调制(DPCM)、自适应差分脉冲编码调制(ADPCM)、运动补偿(Motion Compensation)等;(2)变换编码(Transformation Coding):采用各种数学变换方法,将原时间域或空间域的数据变换到频率域或其他域,利用数据在变换域中的冗余或人类的视觉特性来进行压缩常见的变换编码:: 快速傅里叶变换(FFT)、离散余弦变换(DCT)、离散小波

25、变换(DWT)、Karhunen-Loeve变换(KLT)和迭代函数系统(IFS)等;(3)分层编码(Layered Coding):将原数据在时空域或频率域上分成若干子区域,利用人类的视觉特性进行压缩编码,然后再合并如子采样(Sub-Sampling)、子带编码(Sub-band Coding);(4)模型法编码:模型法编码是指采用模型的方法对传输的图像进行参数估测如随机马尔可夫模型(Markov Model)和分形图像编码(Fractal Image Coding)等;(5)其他编码:包括矢量量化(Vector Quantization)、人工智能(Artificial Inteligen

26、ce)编码等3)混合编码4(Hybrid Coding) = 无损压缩编码 + 有损压缩编码无损压缩和有损压缩结合形成了混合编码技术,它融合了各种不同的压缩编码技术,很多国际标准都是采用混合编码技术,一般是先利用熵压缩编码进行有损压缩,再利用冗余压缩编码做进一步的无损压缩,如JPEG,MPEG 等标准利用混合编码对自然景物的灰度图像进行压缩一般可压缩几倍到十几倍,而对于自然景物的彩色图像压缩比将达到几十甚至上百倍3 常用图像压缩编码技术及原理从技术发展的角度来看,Kunt 等人在1985 年提出了第一代图像编码和第二代图像编码的概念他将1948-1988年40年的以信息论和数字信号处理为理论基

27、础,旨在去除图像数据中的线性相关性的一类编码技术成为第一代图像编码,如PCM、DPCM、亚取样编码法,变换域的DFT、DCT、沃尔什-哈达玛变换编码等,以及以此为基础的混合编码法均属于经典的第一代编码法这类技术去除客观和视觉的冗余信息的能力已经接近极限,其压缩比不高,而第二代图像压缩编码技术是指不局限于信息论的框架,要求充分利用人的视觉生理心理和图像信源的各种特征,能获得高压缩比的一类编码技术 第二代编码方法多是80年代以后提出的新的编码方法,如金字塔编码、基于神经网络的编码、小波变换编码、模型编码、分形压缩编码等3.1 第一代图像编码方法 3.1.1 统计编码统计编码是建立在图像的统计特性基

28、础之上的压缩编码方法,根据像素灰度值出现概率的分布特性而进行的压缩编码是通过用较短的代码代表频繁出现的字符,用较长的代码代表不常出现的字符,从而达到压缩图像的目的常见的统计编码是变长编码,主要有霍夫曼码、算术编码等1)霍夫曼编码在无损压缩的编码方法中,是一种有效的编码方法它是霍夫曼博士在1952 年根据可变长最佳编码定理提出的依据信源数据中各信号出现的频率分配不同长度的编码基本思想:在编码过程中,对出现频率越高的值,分配越短的编码长度,相应地对出现频率越低的值则分配较长的编码长度,它是一种无损编码方法采用霍夫曼编码方法的实质是针对统计结果对字符本身重新编码,而不是对重复字符或重复子串编码,得到

29、的单位像素的比特数最接近图像的实际熵值霍夫曼编码的编码步骤9如下:(1)将信源符号出现概率按递减的顺序排列;(2)将两个最小的概率进行组合相加,并重复该步骤,始终将较高概率分支放在上部直到概率为1;(3)对每一个组合中的元素进行1位码字分配,如概率较大的元素分配码字1,概率较小的分配码字0,当然反向分配也完全可以;(4)对每个信源符号从右至左排列,分配码字序列,得到非等长霍夫曼编码2)算术编码方法与霍夫曼编码方法相似,都是利用比较短的代码取代图像数据中出现比较频繁的数据,而利用比较长的代码取代图像数据中使用频率比较低的数据从而达到数据压缩的目的基本思想:将被编码的数据序列表示成0 和1 之间的

30、一个间隔(也就是一个小数范围),该间隔的位置与输入数据的概率分布有关信息越长,表示间隔就越小,因而表示这一间隔所需的二进制位数就越多(由于间隔是用小数表示的)算术压缩算法中两个基本的要素为源数据出现的频率以及其对应的编码区间其中,源数据的出现频率、编码区间则决定算术编码算法最终的输出数据统计编码虽然是一种高效的编码法,但其主要的缺点7是:(1)码字不是等长的,不便于数据存储单元收集代码;(2)前面提到的几种码都缺乏构造性,不能用数学方法建立一一对应关系;(3)需要在编码过程中知道每种消息出现的概率,但事实上这是难以做到3.1.2 基于字典的编码基于字典的技术生成的文件包含的是定长码(通常是12

31、至16位),每个码字代表原文件中数据的一个特定序列图像压缩编码中常见的压缩方法有:游程编码(RLE)和LZW编码1)游程编码(RLE)的最大特点是其算法最为简单在图像中,尤其是灰度级较少的图像中,常有一些由相同灰度的相邻像素组成的区域在一个逐行存储的图像中,具有相同灰度值的一些像素组成的序列称为一个游程我们可以用(X,Y)来表示它,X,Y均为最小位数的二进制数表示其中X是灰度值的码,Y是X的游程长度,这样就可以不必将统一数据存储多次,这就是游程编码RLE对于仅包含少数个灰度级的图像,特别是二值图像,非常有效特别地,它对有单一颜色背景下物体的图形图像有很高的压缩比,但对于其它类型效果则不会很好甚

32、至很差92)LZW编码也是对字符串编码从而实现压缩与RLE不同的是,它在对文件进行编码的同时,生成了特定的字符串序列的表以及它们对应的代码压缩编码时,每当表中没有的字符串头一次出现时,它就被原样保存起来,同时将分配给它的代码也一同保存之后,当这个字符串再次出现时,只将其代码存起来这就去掉了大量的文件冗余信息,不但字符串表是在压缩过程中动态生成的,而且字符串表也不必存在压缩文件中,因为解压缩算法可以由压缩文件的信息重构它3.1.3 预测编码预测编码是建立在信号(如图像、声音等)数据的相关性之上的,它是较早应用于数据压缩的一种技术所谓预测编码,就是根据过去的信号样本值来预测下一个样本值,并仅把预测

33、值与现实样本值的差(即预测误差)加以量化、编码以后进行传输的方式常见的差分脉冲编码调制(DPCM),自适应差分脉冲编码调制(ADPCM)等都属于预测编码方式的编码技术下面以DPCM为例进行说明:基本原理:对于静止单帧图像(如蓝天、沙漠和大地等)来说,虽然每个图像块的幅值各不相同,但图像块内各像素的幅度是想接近或相同的,幅值的跃变部分仅对应于像块的轮廓,只占整幅图像的很小一部分这就意味着图像的前后像素值之差为零或差分很小的概率极大;而像素值差较大的情形,则出现的概率很小对于一幅静止二维图像,设空间坐标(i,j)处,该像素的实际灰度值为,而用表示对于该点像素灰度的预测值像素的预测值可以根据同一行已

34、扫描的前几个像素,或者几行上的像素进行预测计算实际值与预测值之间的差,可用下式进行表示:预测后的差值经过信道编码后传输到接收端,在接收端通过预测值加上差值信号后,可重现原像素DPCM的编码/解码原理图如图2所示:图2 差分脉冲编码调制(DPCM)原理图预测编码可以获得比较高的编码质量,并且实现起来比较简单,因此被广泛应用于图像压缩编码系统但是它的压缩率并不高,而且精确的预测有赖于图像的特性,并且必须作大量的非线性运算,因而一般不单独使用而是与其他方法结合起来使用73.1.4 变换编码79所谓变换编码,并非直接对空域图像信号编码,而是首先将空域图像信号映射变换到另一个正交矢量空间(交换域或频域)

35、,产生一些变换系数,然后对这些变换系数进行编码处理变换编码也是一种针对统计冗余进行压缩的方法在空间上具有强相关的信号,反映在频域上是在某些特定的区域中能量集中在一起,或者是系数矩阵的分布具有某种规律,这就可以利用这些规律分配频域上的量化比特数,从而达到压缩的目的图3 变换编码的基本模型变换编码的基本模型如图3所示,可以看出编码器主要执行4种相对简单的操作:子图分解、变换、量化及编码一幅大小的输入图像首先被分解为大小为的子图像这些子图进而被变换以生成个子图像变换阵列每一个阵列的大小为变换的目的将每幅子图像中的像素解相关,或用最少量的变换系数包含尽可能多的信息在量化阶段有选择地消除或更粗略地量化带

36、有最少信息的系数,因为这些系数对重构子图像质量的影响最小在编码阶段对量化的系数进行编码(通常使用熵编码)然后针对变换后的信号再进行量化与信道编码操作解码时,先对图像数据进行符号解码,再进行反变换后合并子图像就可以恢复原始图像变换编码有两个最明显的特点,一是可以得到高的压缩比;二是比预测等其它方法的计算复杂性高在变换后,由于在频域上信息是按照频谱的能量与频率分布排列的,只要对频域平面量化器进行合理的(非均匀)比特分配,即高能量区给以高的比特数,低能量区给以低的比特数,就可以得到高的压缩能力变换编码的目的在于去掉图像内容的相关性,它对变换后的系数进行编码,而不是对图像的原始像素进行编码变换的方法很

37、多,基本可以分为两类:一类是特殊的变换编码法,如一维线性编码、等值线编码等;另一类是函数变换编码法,传统的变换编码有傅里叶变换、DCT变换、卡胡南-列夫变换(KLT)、哈尔(Haar)变换和沃尔什-哈达玛(WHT)变换等3.1.5 矢量编码7量化是图像压缩编码的重要环节,量化能够有效改变系数的分布特性,为后续的熵编码作铺垫量化又分为标量量化和矢量量化两种标量量化就是对单个参数进行映射和取整,它在模-数变换和一般的编码系统中得到广泛应用矢量量化编码是一种高效的图像压缩编码算法,可以有效利用矢量中各分量之间以及各矢量量之间的关联特性来消除冗余矢量量化编码利用相邻图像数据间的高度相关性,将输入图像数

38、据序列每一组m个数据构成一个m维矢量一起进行编码,即一次量化多个点根据香农率失真理论,对于无记忆信源,矢量量化编码总是优于标量量化编码输入图像块按照一定的方式形成一个输入矢量,编码时用这个输入矢量与码书中的所有码字计算距离,找到距离最近的码字,即找到最佳图像块输出其索引(地址)作为编码结果矢量量化编码属于有损压缩编码,它的缺点是复杂度随矢量维数呈指数增加,数据量和计算量都很大3.2 第二代图像编码方法3.2.1 子带编码4子带编码的基本思想是使用一组带通滤波器把输入图像的傅立叶频谱分成若干个连续的频段,每个频段称为子带对每个子带中的图像信号采用单独的编码方案去编码采用对每个子带分别编码的优点是

39、:第一,对每个子带信号分别进行自适应控制,量化阶的大小可以按照每个子带的能量电平加以调节具有较高能量电平的子带用大的量化阶去量化,以减少总的量化噪声第二,可根据每个子带信号在感觉上的重要性,对每个子带分配不同的位数,用来表示每个样本值例如,在低频子带中,为了保护图像的边缘轮廓结构,就要求用较小的量化阶、较多的量化级数,即分配较多的位数来表示样本值而图像中的噪声及图像的细节,通常出现在高频子带中,对它分配较少的位数第三,各子带的量化噪声都局限在本子带内,即使某个子带内的信号能量较小,也不会被其他子带的量化噪声掩盖掉3.2.2 分形编码分形概念是由美国数学家B.B.Mandelbrot 在1975

40、 年研究不规则形状及性质时首先提出的,而利用分形作图像压缩是在1987年由F.Barnsley 首先提出来的4其基本思想是寻找图像内部的自相似性,并以一定的变换来模拟,然后以变换的存储代替原图像的存储解码时,只需将变换重复作用于初始图像,利用迭代函数系统(IFS)的理论,经过若干次迭代就可以得到原图像较好的近似所谓自相似性7就是指无论几何尺寸如何变化,景物的任何一小部分的形状都与较大部分的形状极其相似与DCT编码不同,分形编码利用的自相似性不是临近样本的相关性,而是大范围的相似性,即图像块的相似性对相似性的描述是通过仿射变换来确定的,用图像中的一个子块经过自仿射分形变换来逼近同一图像的另一子块

41、由于图像存在高度的仿射冗余度,仿射变换的参数的数据量小于图像块的数据量,因而可以实现压缩的目的分形图像压缩极高的压缩比、快速的解压缩速度颇引人关注从当前发展情况来看,目前分形法由于图像分割、迭代函数系统代码的获得非常困难,因而实现起来特别耗时,算法异常的复杂,因而难以实现和应用因此,尽管分形图像压缩有巨大的潜力,但要把这种潜力释放出来,还有许多问题有待进一步的研究目前的分形图像压缩还处在理论探讨阶段,离实际应用还有不小的距离3.2.3 小波变换图像压缩编码1989 年,S.G.Mallat 将小波变换用于多分辨率图像的描述这个过程称为小波分解它是继傅立叶变换之后在图像压缩中的又一里程碑,它解决

42、了很多傅立叶变换不能解决的问题与傅立叶变换一样,小波变换的基本思想也将图像信号变为一簇基函数的加权和,而这一簇基函数是通过基本函数的平移和伸缩构成的小波变换作为正交变换不会产生能量损失,即对小波变换后的图像进行针对性的处理才是实现压缩的关键小波分解得到的水平和垂直细节图像的高频分量系数大部分为零,可采用非均匀量化对系数出现概率大的用细量化,对出现概率小的系数采用粗量化由于人眼对高频分量不敏感,可采用粗量化或舍弃为了进一步提高压缩比,可对上述经过处理的小波系数采用游程编码或Huffman 编码对图像进行压缩小波变换是可逆的,通过重构算法,图像数据能够被完全恢复3.2.4 模型基编码7模型编码将图

43、像信号看作三维世界中的目标和景物投影到二维平面的产物,而对这一产物的评价是由人类视觉系统的特性决定的模型编码的关键是对特定的图像建立模型,并根据模型确定图像中景物的参数,如运动参数、形状参数等解码时则根据参数和已知模型用图像合成技术重建图像由于编码的对象是特征参数而不是原始图像,有可能实现比较大的压缩比模型编码引入的误差主要是人眼视觉不太敏感的几何失真,因此在具有较高压缩率的情况下可重建非常自然和逼真的图像因此,模型编码有很大的发展空间,但是当前,模型法则仅限于人头肩像等基本的图像上,进一步的发展有赖于新的数学方法和其它相关学科的发展3.2.5 基于神经网络的图像编码基于神经网络的图像编码4是

44、试图初步模仿人的视觉系统某些局部的初级功能,并将其研究成果应用到图像编码领域目前直接用于图像压缩编码的神经网络主要有反向误差传播(BP)型和自组织映射(Kohonen)型另外除了将神经网络直接用于图像压缩编码外,还可以把神经网络同传统的图像编码相结合,构成许多间接应用神经网络的图像编码神经网络有较强的容错能力,任何局部的损坏不会影响整体结果另外,神经网络的大规模并行处理能力,为神经网络图像编码的实时实现创造了条件神经网络的工作机理至今仍在研究之中,硬件研制不成功,所以在图像编码中的应用研究进展缓慢,目前多与其他方法结合使用74 小波变换图像压缩编码小波变换是当前数学中一个迅速发展的新领域,它同

45、时具有理论研究和实际应用十分广泛的双重意义近年来,小波变换倍受科学界的重视,也取得了许多传统分析方法难以实现的显著应用效果它是继1822年傅里叶提出傅里叶变换之后又一里程碑式的研究成果,解决了很多傅里叶变换不能解决的难题它被认为是对Fourier分析理论最辉煌的继承、总结和发展,是近年来在分析工具及方法上的重大突破4.1 小波和小波变换的理论基础4.1.1 小波理论的产生7信号处理是当代科学技术的重要组成部分在应用中,信号往往是数字的序列,这些数值能够由测量得到信号处理的目标是准确的分析,有效而快速的编码,准确而快速的传递,之后是仔细的重构对于一幅图像,可以看作是二维离散信号为了得到适合于给定

46、信号的研究方法,通常把信号分为平稳的和非平稳的如果一个信号的性质随时间是稳定不变的,则称为平稳信号研究平稳信号的理想工具是法国人傅里叶提出的Fourier变换,它将平稳信号分解为正弦波的线性组合,较好地描述了信号的频率特性它是一种全局性的变换,无法表达信号的时-频局部特性然而非平稳信号的广泛存在是不争的事实,许多天然和人工的信号,例如语音、音乐、雷达和声纳信号、生物医学信号、图像信号等等都是非平稳信号目前在非平稳信号的处理领域小波分析得到了广泛研究和应用虽然Fourier变换能较好地刻画信号的频率特性,但几乎不提供信号在时域上的任何信息,不能较好地解决突变信号与非平稳信号的问题之后人们也对此方法进行了多次改进,但是效果还是不很理想,因此小波分析就应运而生小波分析的基本思想是把信号展开成一族基函数的加权之和,即用一族函数来表示或逼近信号或函数与Fourier变换不同的是,这一族函数是通过某个基本函数的平移和伸缩构成的小波分析提供了一种自适应的时域和频域同时局部化的分析方法,无论分析低频或高频局部信号,它都能自动调节时-频窗,以适应实际分析的需要4.1.2 小波的基本概念小波(Wavelet),即小区域的波,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1