多媒体技术基础05.ppt_三一文库31doc.com

资源描述

《多媒体技术基础05.ppt》由会员分享，可在线阅读，更多相关《多媒体技术基础05.ppt（44页珍藏版）》请在三一文库上搜索。

1、第五讲,彩色数字图像基础,主要内容,视觉系统对颜色的感知图像的颜色模型图像的基本属性图像的分类伽马()校正 JPEG压缩编码常用数字图像文件格式,视觉系统对颜色的感知,可见光的波长范围为380nm780nm，大多数自然光都是由不同波长的光组合而成。人的视网膜有对红、绿、蓝颜色敏感程度不同的三种锥体细胞，另外还有一种在光功率极端低的条件下才起作用的杆状体细胞，因此颜色只存在于眼睛和大脑中。颜色是视觉系统对可见光的感知结果。红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同，对不同亮度的感知程度也不同，因此不同组成成分的可见光就呈现出不同的颜色。,视觉系统对颜色的感知(续),眼睛本质

2、上是一个照相机。人的视网膜通过神经元来感知外部世界的颜色。人眼中红、绿、蓝三种锥体细胞对不同频率的光的感知程度不同，对不同亮度的感知程度也不同，这就意味着，人们可以使用数字图像处理技术来降低数据率而不使人感到图像质量明显下降。自然界中的任何一种颜色都可以由R，G，B这3种颜色值之和来确定，它们构成一个3维的RGB矢量空间。,图像的颜色模型,颜色模型(color model)是简单方法来描述所有颜色的一套规则和定义。一种颜色模型所标定的所有颜色就构成了一个颜色空间。颜色空间通常用三维模型表示，空间中的颜色通常使用代表三个参数的三维坐标来指定对于人来说，可以通过色调、饱和度和亮度来定义颜色

3、(HSL颜色模型)；对于显示设备来说，可以用红、绿、蓝磷光体的发光量来描述颜色(RGB颜色模型)；对于打印设备来说，可以使用青色、品红、黄色和黑色颜料的用量来指定颜色(CMYK颜色模型)。,理论上绝大部分可见光谱都可用红、绿、蓝三色光按不同比例和强度的混合来表示。颜色CR(百分比)G(百分比)B(百分比) RGB模型称为相加混色模型，用于光照、视频和显示器。例如，显示器通过红、绿和蓝荧光粉发射光线产生彩色。,RGB相加混色模型,CMYK相减混色模型,一个不发光的物体称为无源物体，它的颜色由该物体吸收或者反射光的光波决定。用彩色墨水或颜料进行混合，绘制的图画就是一种无源物体，用这种方法生成的

4、颜色叫做相减色。在理论上任何一种颜色都可以用三种基本色(青色cyan、品红magenta、黄色yellow)按一定比例混合得到，这就是CMY相减混公模型，之所以称为相减色，是因为它减少了为视觉系统识别颜色所需要的反射光。,彩色打印机采用的就是这种原理，印刷彩色图片也是采用这种原理。按每个像素每种颜色用1位表示，相减法产生的8种颜色如下表所示。由于彩色墨水和颜料的化学特性，用等量的三基色得到的黑色不是真正的黑色，因此在印刷术中常加一种真正的黑色(black)，所以CMY又写成CMYK。,CMYK相减混色模型(续),相加色与相减色的关系,相加色与相减色的关系(续),HSL颜色模型,在HSL模型中

5、，H定义色调；S定义颜色的深浅程度或饱和度；L定义亮度。 RGB模型和CMYK模型主要是面向设备的，而HSL模型更容易被人理解和控制。的白光量,图像的三个基本属性,一、分辨率显示分辨率：指显示屏上能够显示出的象素数目。同样大小显示屏能够显示的象素越多，说明显示设备的分辨率越高，显示的图像质量也就越高，如800600、1024768。图像分辨率：指组成一副图像的像素的密度，一般用单位长度上包含像素的个数来衡量。常用单位为DPI(dotsperinch)，即每英寸多少点。,二、像素深度像素深度是指存储每个像素所用的位数，它是用来度量图像的颜色分辨率。像素深度决定彩色图像的每个像素可能有的颜色

6、数，或者确定灰度图像的每个像素的灰度级数。表示一个像素的位数越多，它能表达的颜色数目就越多，存储所需就越大。相反，如果位数较少，则图像的颜色质量较较，但存储所需较少。在用二进制数表示彩色图像的像素时，除了用固定位数表示颜色外，有时还增加1位或几位作为属性位。属性位用来指定该像素应具有的性质，如透时度属性。,图像的三个基本属性(续),三、真彩色、伪彩色与直接色真彩色：真彩色是指在组成一幅彩色图像的每个像素值中，RGB三个基色分量直接决定显示设备的基色强度，这样产生的彩色称为真彩色。伪彩色：每个像素的颜色不是由每个基色分量的数值直接决定，而是把像素值当作彩色查找表的表项入口地址，去查找一个显

7、示图像时使用的RGB强度值，用查找出的RGB强度值产生的彩色称为伪彩色。直接色：每个像素值分成RGB分量，每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度，用变换后得到的RGB强度值产生的彩色称为直接色。,图像的三个基本属性(续),图像的分类,数字图像的分类,图像的分类(续),点位图是将一副图像在空间上离散化，即将图像分成许许多多的像素，每个象素用若干个二进制位来指定该像素的颜色或灰度值。点位图的优点是：显示速度快；颜色丰富；获取容易，拍摄、扫描、绘制。点位图的缺点是：存储和传输时数据量比较大；缩放、旋转时算法复杂且容易失真。,图像的分类(续),矢量图是用一系列

8、计算机指令来表示一幅图，如画点、画线、画曲线、画圆、画矩形等。这种方法实际上是用数学方法来描述一幅图。矢量图的优点是：缩放、旋转、移动时图像不会失真；存储和传输时数据量较小。矢量图的缺点是：图像显示时花费时间比较长；图像的颜色不够丰富；真实世界的彩色图像难以转化为矢量图。,图像的分类(续),矢量图,点位图,标准单色图标准灰度图,图像的分类(续),256色标准图像 24位标准图像,图像的分类(续),伽马()校正,一个图像系统中一般包含输入设备(扫描仪、摄像机、数码相机)、存储设备(胶片、磁盘)和输出设备三大模块。这些光电转换设备的输入输出特性曲线一般是非线性的，且表现为幂函数的形式：按照

9、惯例，“输入”和“输出”都缩放到01之间。所以整个图像系统的传递函数是一个幂函数：12n。,yxn输出(输入),伽马()校正(续),一个图像系统追求的目标：真实的再现原始场景。为了真实地再现原始场景，如果图像再现环境为明亮环境则必须使整个图像系统的1；如果为暗淡环境，则必须使整个系统的1.25；如果为黑暗环境，则必须使系统的1.5。实际图像系统(硬件系统)的值并非符合我们要求的值，且是不能随意改变的。所有要求我们加入一个中间环节来校正整个系统的值，即补偿系统的非特性曲线，使之接近于应用环境所要求的值。这个过程就叫做伽马()校正。,JPEG是一个由ISO和IEC两个组织机构联合组成的一个图像专

10、家小组，负责制定静态数字图像的数据压缩编码标准，这个专家组开发的算法称为JPEG算法，并且成为国际上通用的标准。 JPEG是一个适用范围很广的静态图像数据压缩标准，既可用于灰度图像又可用于彩色图像。JPEG不仅适于静止图像的压缩，电视图像的帧内图像的压缩编码，也常采用此算法。JPEG标准还可以大范围地调节图像压缩率及其保真度。标准主要采用了两种基本的压缩算法：一种是采用以离散余弦变换(DCT)为基础的有损压缩算法，另一种是采用以预测技术为基础的DPCM无损压缩算法。,JPEG编码标准,JPEG有损顺序编码算法的主要计算步骤如下： 1.将源图像分成几个颜色平面(如RGB分量图像)。 2.将各颜

11、色平面分成88的小块。 3.对数据块进行正向离散余弦变换(FDCT)。 4.使用加权函数对变换后的系数进行量化。 5.Z字形排列量化结果。 6.使用差分脉冲编码调制(DPCM)对直流系数(DC)进行编码。 7.使用行程长度编码(RLE)对交流系数(AC)进行编码。 8.对以上数据进一步进行熵编码。 9.最后将编码图像数据及各种标记代码组成数据流。,JPEG编码标准(续),JPEG编码标准(续),对每个单独的彩色图像分量，把整个分量图像分成88的图像块，如图所示，并作为两维离散余弦变换DCT的输入。通过DCT变换，把能量集中在少数几个系数上。,DCT变换使用下式计算,逆变换使用下式计算,JPEG

12、编码标准(续)FDCT变换,量化是对经FDCT变换后的系数进行量化，量化的目的是减小非“0”系数的幅度以及增加“0”值系数的数目，量化是图像质量下降的最主要原因。对于有损压缩算法，JPEG算法使用均匀量化器进行量化，量化步距是按照系数所在的位置和每种颜色分量的色调值来确定。因为人眼对亮度信号比对色差信号更敏感，因此使用了两种量化表：亮度量化值和色差量化值。此外，由于人眼对低频分量的图像比对高频分量的图像更敏感，因此图中的左上角的量化步距要比右下角的量化步距小。,JPEG编码标准(续)量化,JPEG编码标准(续)量化,色度量化值表与亮度量化值表,JPEG编码标准(续)Z字形编排,8X8图像块

13、经过FDCT变换和量化之后得到的DC直流系数有两个特点，一是数值比较大，二是相邻图像块的DC系数值变化不大。根据这个特点，JPEG算法使用了差分脉冲调制编码(DPCM)技术，对相邻图像块之间量化DC系数的差值进行编码。量化AC系数的特点是1X64矢量中包含有许多“0”值系数，且许多“0”是连续的，因此使用非常简单和直观的行程长度编码(RLE)对它们进行编码。使用熵编码还可以对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩，在JPEG算法中，使用Huffman编码器来减少熵。,JPEG编码标准(续)编码,JPEG编码的最后一个步骤是把各种标记代码和编码后的图像数据组成

14、一帧一帧的数据，这样做的目的是为了便于传输、存储和译码器进行译码，这样的组织的数据通常称为JPEG位数据流(JPEG bitstream)。 JPEG编码实例(P78)。,JPEG编码标准(续)组成位数据流,常用数字图像文件格式,BMP文件格式 GIF文件格式 JPEG文件格式 PNG文件格式,位图文件(Bitmap-File)格式是Windows采用的图像文件存储格式，在Windows环境下运行的所有图像处理软件都支持这种格式。BMP位图文件默认的文件扩展名是bmp。,BMP文件格式,BMP文件大体上分为四个部分：,BMP文件格式(续),1.位图文件头：它包含有关于文件类型、文件大小(以字节

15、为单位)、存放位置等信息，在Windows 3.0以上版本的位图文件中用BITMAPFILEHEADER结构来定义。 2.位图信息头：它包含有位图文件的大小、压缩类型和颜色格式。BMP位图文件可以是没有任何压缩的位图，或者采用RLE编码进行压缩的位图。它用BITMAPINFOHEADER结构来定义。,BMP文件格式(续),3.彩色表：它包含的元素与位图所具有的颜色数相同，像素的颜色用RGBQUAD结构来定义。彩色表中的颜色按颜色的重要性排序，这可以辅助显示驱动程序为不能显示足够多颜色数的显示设备显示彩色图像。对于24位真彩色图像就不使用彩色表，因为位图中的RGB值就代表了每个像素的颜色。,4.

16、位图数据：紧跟在彩色表之后的是图像数据字节阵列。图像的每一扫描行由表示图像像素的连续的字节组成，每一行的字节数取决于图像的颜色数目和用像素表示的图像宽度。扫描行是由底向上存储的，这就是说，阵列中的第一个字节表示位图左下角的像素，而最后一个字节表示位图右上角的像素。,BMP文件格式(续),GIF(Graphics Interchange Format)格式由CompuServe公司于1987年开发，版本号GIF87a，89年扩充后版本号为GIF89a。 GIF图像文件以块(block)为单位存储信息。一个GIF文件由表示图形/图像的数据块、数据子块以及显示图形/图像的控制信息块组成，称为GIF

17、数据流。数据流中的所有控制信息块和数据块都必须在文件头(Header)和文件结束块(Trailer)之间。,GIF文件格式,GIF文件格式(续)-文件结构,详细描述,GIF文件采用了LZW无损压缩算法来存储图像数据。 GIF文件允许设置背景的透明属性。 GIF文件格式可在一个文件中存放多幅彩色图像并且制作出幻灯片或者动画效果。 GIF文件支持图像数据的交叉存储方式，这样一个大的图像可以逐步显示，让用户首先看到图像概貌，然后逐步清晰。 GIF文件定义的图像中可以加入文本。,GIF文件格式(续)-特点,例一例二例三例四,JPEG文件格式,JPEG标准委员会没有对JPEG文件格式作出明确的定义

18、，现在被广泛采用的是1992年9月由C-CubeMicrosystems公司提出的JPEG文件交换格式，版本号为1.02。JFIF文件格式直接使用JPEG标准为应用程序定义的许多标记，因此JFIF格式成了事实上JPEG文件交换格式标准。 JEPG文件大体上可以分成两个部分：标记码和压缩数据。标记码部分给出了JPEG图像的所有信息，如图像的宽、高、Huffman表、量化表等。,PNG文件格式,PNG流式网络图形格式(Portable Network Graphic Format，PNG)是20世纪90年代中期开始开发的一种位图文件存储格式，读成“ping”，其目的是企图替代GIF和TIFF文件格

19、式，同时增加了一些GIF文件格式所不具备的特性。 PNG用来存储灰度图像时，图像的灰度等级可多达16位，存储彩色图像时，图像的颜色深度可多达48位，并且还可存储多到16位的通道数据。 PNG使用从LZ77派生的无损数据压缩算法。,PNG文件格式中要增加下列GIF文件格式所没有的特性：每个像素为48位的真彩色图像。每个像素为16位的灰度图像。可为灰度图和真彩色图添加通道。添加图像的信息。使用循环冗余码检测损害的文件。加快图像显示的逐次逼近显示方式。标准的读/写工具包。,PNG文件格式(续)-优点,PNG图像格式文件由一个8字节的PNG文件署名域和按照特定结构组织的3个以上的数据块组成。 PNG定义了两种类型的数据块，一种叫做关键数据块，是标准的数据块，另一种叫做辅助数据块，是可选的数据块。PNG文件定义了4个标准数据块，每个PNG文件都必须包含它们，PNG读写软件也必须支持这些数据块。PNG文件定义了10个辅助数据块。,PNG文件格式(续)-文件结构,详细描述,结束,

展开阅读全文