第五章多媒体图像处理技术.ppt

上传人:本田雅阁 文档编号:2619774 上传时间:2019-04-20 格式:PPT 页数:40 大小:3.31MB
返回 下载 相关 举报
第五章多媒体图像处理技术.ppt_第1页
第1页 / 共40页
第五章多媒体图像处理技术.ppt_第2页
第2页 / 共40页
第五章多媒体图像处理技术.ppt_第3页
第3页 / 共40页
亲,该文档总共40页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第五章多媒体图像处理技术.ppt》由会员分享,可在线阅读,更多相关《第五章多媒体图像处理技术.ppt(40页珍藏版)》请在三一文库上搜索。

1、第五章 多媒体图像处理技术,5.1 图像基础知识,图像是人们非常容易接收的信息媒体,人们接收信息的83%来源于视觉,图像其最大的特点是形象、生动、直观,是多媒体技术的重要组成部分。,5.1 图像基础知识,5.1.1 图像的基本概念 1.色彩 色彩源于光,1672年牛顿用三棱镜将太阳光(白光)分解成红、橙、黄、绿、青、蓝、紫顺序排列渐变的彩带,这种现象称为色散。,太阳光经过三棱镜后产生的色散现象,5.1 图像基础知识,2. 色彩的三要素 色彩可用亮度、色调和饱和度来描述,人眼所看到的任一色彩都是这三个特性的综合效果。这三个特性被称为色彩的三要素。 亮度是指光作用于人眼时所引起的明亮程度的感觉,它

2、与被观察物体的发光强度有关。 色调是当人们看到一种或多种波长的光时所产生的彩色感觉。 饱和度是指颜色的纯度或者说是指颜色的深浅程度,,5.1 图像基础知识,5.1.2 色彩模型,1. RGB模型 自然界常见的颜色,都可以由红(R)、绿(G)、蓝(B)三种颜色光按不同比例混合而成。同样,绝大多数颜色光也可以分解成红、绿、蓝三种色彩。这就是色度学的基本原理三基色原理。 在RGB模型中,对于任意彩色光F,其配色方程可写成: Fr(R)+g(G)+b(B) 其中r、g、b为三色系数,r(R)、g(G)、b(B)为彩色光的三色分量。,5.1 图像基础知识,5.1.2 色彩模型,1. RGB模型 RGB颜

3、色模型构成一个立方体的三维坐标空间结构,用红、绿、蓝表示三条坐标轴。R=G=B=0处,为黑色,R=G=B=255处,为白色。,5.1 图像基础知识,5.1.2 色彩模型,2. HSL模型 HSL模型是使用H、S和L 三个参数来生成颜色。H为颜色的色调,改变它的值可生成不同的颜色;S为颜色的饱和度,改变它的值可使颜色变亮或变暗;L为颜色的亮度参量。,5.1 图像基础知识,5.1.2 色彩模型,3. CMY(CMYK)模型 当阳光照射到一个物体上时,这个物体将吸收一部分光线,剩下的光线被反射,反射的光线就是我们所看见的物体颜色。这是一种减色色彩模型,在印刷时应用的也是这种减色模式,根据这种减色模式

4、,就衍变出了适合印刷的CMYK色彩模型。 CMYK代表印刷上用的四种颜色,C代表青色,M代表洋红色,Y代表黄色,K代表黑色。,5.1 图像基础知识,5.1.2 色彩模型,3. CMY(CMYK)模型 CMY模型与RGB模型的图像可以通过公式4.1进行转换,CMY模型与CMYK模型可由公式4.2进行转换:,(4.1),(4.2),5.2 图像数据的数字化,5.2.1 图像信息数字化过程 图像数字化过程大体分为3个步骤。,模拟图像的数字化过程,5.2 图像数据的数字化,1.采样 图像采样就是将二维空间上模拟的连续彩色信息,转化为一系列离散数值来表示。图像采样就是对图像在水平方向和垂直方向上进行间隔

5、取样,每个采样点组成图像的基本单位,我们称之为像素(Pixel)。,5.2 图像数据的数字化,2.量化 采样是对图像的空间坐标进行离散化处理,量化则是对每个像素的灰度或颜色值进行数字化处理,把模拟量的亮度值用指定位数的数字量表示。 3.编码 编码是对量化的数据的二进制表示。数字化后的图像数据量非常大,必须采用编码技术来压缩信息。编码压缩技术是实现图像传输与存储的关键,第6章将详细介绍。,5.2 图像数据的数字化,5.2.2 数字图像的表示,一幅采样图像由M(行)N(列)个采样点组成,每个采样点是组成图像的基本单位。黑白图像的像素只有1个亮度值,彩色图像由多个彩色分量组成,比如红、绿、蓝,因此,

6、图像在计算机中表示时:单色图像用一个矩阵来表示;彩色图像用一组(一般是3个)矩阵来表示,矩阵中的元素是像素颜色分量的亮度值,使用整数表示。,5.2 图像数据的数字化,5.2.2 数字图像的表示,彩色图像的数字化表示示例,5.2 图像数据的数字化,5.2.3 数字图像的基本属性,1. 分辨率 显示分辨率 显示分辨率是指显示屏上能够显示出的像素数目。例如,显示分辨率为640480,表示将显示屏分成480行,每行640个像素,这样,整个显示屏就含有3072200个像素点。屏幕能够显示的像素越多,说明显示设备的分辨率越高,显示的图像质量也就越好。 图像分辨率 图像分辨率指一幅图像的像素数。对同样大小的

7、一幅图,如果表示该图像的像素数目越多,则图像的分辨率越高,看起来就越逼真细腻;反之,图像就越粗糙。,5.2 图像数据的数字化,区别: 图像分辨率与显示分辨率是两个不同的概念。图像分辨率是确定组成一幅图像的像素数目,而显示分辨率是确定显示图像的区域大小。,5.2 图像数据的数字化,2.图像的像素深度 像素深度是指存储每个像素的颜色(或亮度)信息所占用的二进制位数。像素深度决定彩色图像的每个像素可能有的颜色数。,表4-1 图像深度与表示的颜色数目,5.2 图像数据的数字化,区别: 图像分辨率与显示分辨率是两个不同的概念。图像分辨率是确定组成一幅图像的像素数目,而显示分辨率是确定显示图像的区域大小。

8、,5.2 图像数据的数字化,3.图像的真彩色、伪彩色和直接色 真彩色(True Color) 真彩色是指一幅彩色图像中的每个像素都分成RGB三个基色分量。每个分量用8位二进制数表示,这样产生的色彩称为真彩色。 伪彩色(Pseudo Color) 伪彩色是把像素值作为彩色查找表的表项入口地址,去查找一幅显示图像使用的RGB强度值,再用查找出的强度值产生彩色,称为伪彩色。 直接色 直接色是把像素值的RGB颜色分量作为单独的索引值,通过相应的色彩变换找出RGB各自对应的基色强度,用这个强度值产生的彩色称为直接色。,5.2 图像数据的数字化,5. 图像的大小 图像的大小是指在磁盘上存储整幅图像所占用的

9、字节数。按下面的公式计算: 图像文件的字节数=图像分辨率量化位数/8 一幅分辨率为640480的二值图像,文件大小为:(640480)/8=38400B=37.5KB 一幅同样分辨率的图像,图像深度为8位。则图像文件的大小为:(6404808)/8=307200B=300KB 一幅同样大小的真彩色图像,图像文件的大小为: (64048083)/8=921600B=900KB,5.3 图像文件的种类与格式,1. 矢量图 矢量图用一系列计算机指令来表示。先用数学方法描述,然后变成数字表达式,最后再用编程语言来描述。在计算显示图像时,能看到画图的过程。 特点: 缩小或放大后不会失真。 旋转、复制、属

10、性变化容易实现。 将矢量图作为构造块存储到图库中,可加速图的生成,同时减少矢量图文件的大小。,5.3.1 图像文件的种类,5.3 图像文件的种类与格式,2. 位图 位图是把一幅图像分成许多像素,每个像素用若干个二进制位来表示。位图的编辑处理可用画图软件进行。 利用扫描仪、数码照相机、数码摄像机、录像机、激光视盘等设备获取位图。 特点: 色彩自然,丰富,逼真。 在进行放大和缩小时会失真。 占用磁盘空间比较大。,5.3 图像文件的种类与格式,3. 灰度图和彩色图 灰度图(Gray-Scale Image)按照灰度等级的数目来划分。只有黑白两种颜色的图像称为单色图像,每个像素的像素值用1位二进制数来

11、表示。 彩色图像(Color Image)可按照颜色的数目来分类。许多24位真彩色图像用32位存储,这附加的8位称为(Alpha)通道。它定义了一个透明度,用来表示与其图像之间的遮掩透明关系。,5.3 图像文件的种类与格式,1. BMP格式 BMP是Windows系统下的标准格式。其扩展名为BMP。该格式结构简单,每个文件上存放一幅图像。支持1、4、8、16、24位颜色深度。 2. GIF格式 GIF是图形交换格式(Graphics Interchange Format)的英文缩写,是Compu Server公司于20世纪80年代推出的一种高压缩比的彩色图像文件格式。最多只能存储256色的彩色

12、图像或灰度图像。 GIF图像文件很小,Internet网上的动画文件多为GIF格式文件。,5.3.2 图像文件的格式,5.3 图像文件的种类与格式,3. JPEG格式 JPEG(Join Photographic Experts Group )是国际标准化组织和国际电报电汇咨询委员会联合制定的静态图像压缩编码标准。 4. TIFF格式 TIFF(Tagged Image File Fermat)称为标记图像文件格式。它是由Aldus和Microsoft公司为扫描仪和桌面出版系统联合研制的较为通用的图像文件格式,是一种工业标准格式。它不依赖操作环境,具有可移植性。 5. PSD格式 PSD是Ad

13、obe公司开发的图像处理软件Photoshop自建的标准文件格式。,5.4 图像素材的获取,Windows “画图” 图像编辑处理工具软件; Photoshop、CorelDraw等专业图像编辑软件; 利用系统提供的菜单命令和鼠标可绘制各种图形,可进行填色、剪贴、缩放、平移、颜色设置等处理。,5.4.1利用绘图软件工具绘制,5.4 图像素材的获取,1. 扫描仪的安装 扫描仪与计算机连接,安装相应的驱动程序。 2. 安装扫描识别软件 安装智能文字识别软件(如OCR)来实现这种转换。目前比较流行的文字识别软件有汉王OCR,尚书七号、清华紫光等。,5.4.2 图像扫描与文字识别,5.4 图像素材的获

14、取,(1) 预览:运行汉王OCR 5.0增强版,进入主程序界面。单击“扫描”工具按钮,启动扫描程序,单击“预览”按钮,开始预览扫描。,3. 图像扫描与文字识别过程,扫描预览,5.4 图像素材的获取,(2) 扫描 根据预览效果,通过“选取框”适当调整扫描范围;单击“扫描”按钮开始扫描,并将扫描结果保存为一个TIFF类型的图像文件 。,3. 图像扫描与文字识别过程,扫描预览,5.4 图像素材的获取,(3) 倾斜校正 如果图像有倾斜度,会影响文字识别率。 单击“编辑倾斜校正”菜单命令或单击工具栏中“图像倾斜校正”进行倾斜校正。,3. 图像扫描与文字识别过程,倾斜校正,5.4 图像素材的获取,(4)

15、文字识别 用工具栏中“设定文字识别区域”按钮在扫描图像上设定文字识别区域;单击“识别”按钮识别文字。,3. 图像扫描与文字识别过程,文字识别,5.4 图像素材的获取,(5) 文字校对 对错误的文字,系统将对其用蓝色标注,选择错字,在屏幕下方显示对应图像位置和候选字窗口,直接更正即可。 (6) 保存文件。,3. 图像扫描与文字识别过程,文字校对,5.4 图像素材的获取,1. 利用“PrintScreen”键抓图 按“PrintScreen”键可以抓取整个屏幕;或者按“Alt+ PrintScreen”可以抓取当前活动窗口。 启动图像编辑软件,用“粘贴”命令将屏幕图像粘贴到新建文件中。 编辑保存文

16、件。,5.4.3 抓取屏幕图像,5.4 图像素材的获取,2. 利用SnagIt软件,抓取屏幕图像,5.4.3 抓取屏幕图像,抓取全屏 抓取窗口 抓取任意区域 抓取滚动窗口 抓取Web页面 抓取菜单,5.4 图像素材的获取, 用数码相机或数码摄像机拍摄照片 通过USB接口将数码相机或数码摄像机与计算机连接,可将数码相机或摄像机拍摄的照片文件复制到计算机中,5.4.4 利用数码相机或数码摄像机获取图像,5.5 数字图像处理,通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等操作,称为数字图像处理(Digital Image Processing)。 5.5.1 数字图像处理的研究内容 1.

17、 图像变换 2. 图像编码压缩 3. 图像增强和复原 4. 图像分割 5. 图像描述 6. 图像分类,5.4 图像素材的获取,1. ACDSee ACDSee是ACD System公司推出的基于Windows环境下一个专业的图形浏览软件。可以实现浏览和选择图片、像格式转换、获取图像、批量重命名、建立文件清单、图像的简单处理等操作。,5.5.2 常用图像处理软件,ACDSee图像浏览器,5.4 图像素材的获取,2.Photoshop Photoshop是Adobe公司于1990年推出的一款集图像扫描、编辑修改、图像制作、图像合成等多种功能于一体的专业图像处理软件。,5.5.2 常用图像处理软件,

18、Photoshop图像编辑软件,5.4 图像素材的获取,3.Matlab Matlab在20世纪80年代兴起,在发展过程中不断拓宽应用范围,不断增强功能,1997年被评为美国十大科技成果之一。 Matlab直接面向科学与工程计算,语言风格接近数学形式,程序编写简单、效率高。Matlab提供了大量工具箱,几乎涵盖了科学与工程技术的所有领域。 Matlab的图形图像处理功能很强,提供有一系列绘图函数,适合于线性坐标、对数坐标和极坐标等不同坐标显示,还能够绘制一些特殊图像,如切片图、轮廓图等;它能够显示和生成许多格式的图像,可以对灰度和彩色图像进行滤波、块操作、几何操作、图像变换、图像分析与增强等操作。是广大科研人员研究解决各种具体工程问题普遍使用的一款软件。,5.5.2 常用图像处理软件,本章小结,色彩源于光,不同颜色的光实际上对应于不同波长的光波。色彩通常用亮度、色调和饱和度这三个要素来描述,在进行图像处理时,根据应用领域的不同使用不同的色彩模式。 计算机要对图像进行处理,必须要对模拟图像信号通过采样、量化、编码转换为数字图像。 图像获取方法: 通过绘图工具软件可绘制简单图形图像 借助扫描仪可扫描输入图像 利用抓图工具软件可以抓取屏幕图像 通过图库或网络可以获取需要的图像素材,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1