第5章多媒体技术基础新.ppt

资源描述

《第5章多媒体技术基础新.ppt》由会员分享，可在线阅读，更多相关《第5章多媒体技术基础新.ppt（60页珍藏版）》请在三一文库上搜索。

1、多媒体技术基础,大学计算机基础教程,主要内容,多媒体的基本概念音频的编码技术图像的编码技术视频的编码技术数据压缩技术,多媒体的基本概念,什么是多媒体多媒体的关键技术多媒体信息的特点,什么是多媒体,多媒体是多种媒体的组合，即文字、声音、图像、图形、动画、视频等各种媒体的组合。包括：文本包含字母、数字、字、词、等基本元素，一般采用文字编辑软件生成；图形是采用计算机语言或专门软件生成的矢量图形；图像是采用扫描设备、摄像设备或其他图像处理设备生成的用像素点记录的自然影像；,什么是多媒体,视频是动态的影视图像，即视频是动态的图像；音频是指大约在20Hz20 kHz频率范围的连续变化的

2、声音信号；动画是采用计算机动画软件创作并可连续的画面。,文本媒体,文本可以是英文字母、阿拉伯数字、汉字、中文标点符号和英文标点符号等，一般由文字编辑软件（如记事本、WPS字处理软件和Microsoft Word应用程序等）生成。需要区别的是：中文标点符号如句号“。”和英文标点符号如句号“.”是不同的文本。,图形和图像媒体,图形,图像,音频和视频媒体,音频,视频,动画媒体,动画,多媒体的关键技术,多媒体信息的特点,数据量大图形图像、音频和视频等媒体元素需要很大的存储空间。例如，5分钟标准质量的PAL视频信息需要大约6.6GB的存储空间。面对如此巨大的存储要求，必须对多媒体信息进行压缩处理。

3、多数据流某些多媒体展示时表现为静态和连续信息的集成，例如，视频播放时就是静态的图像和连续的音频信息的集成。输入时，每一种信息都有一个独立的数据流；播放时，需要对这些数据流加以合成。各种类型的媒体信息可以存储在一起，也可单独进行存储。,多媒体信息的特点,连续性多媒体信息一般包含时间数据，具有连续性的特点。例如，音频、视频和动画都是时间相关的。编码方式多样多媒体信息由于处理的信息类型复杂，导致编码方式多样。例如，文本中的英文字符使用ASCII编码，中文字符使用汉字信息交换码、音频和图像都是基于采样-量化-编码的过程进行编码。,音频的编码技术,什么是音频信号模拟信号与数字信号音频的编码

4、技术：采样、量化和编码音频文件存储容量的计算,什么是音频信号,音频，又称为声音，是通过空气传播的一种连续的波，称为声波。声音的强弱体现在声波压力的大小，音调的高低体现在声音的频率上。声音信号的两个基本参数是频率和幅度。频率小于20Hz的信号称为亚音信号；频率在20Hz20kHz的信号称为音频信号；人们说话的信号频率通常在300Hz3kHz；频率大于20kHz的信号称为超音频信号，或者称为超声波信号。,模拟信号与数字信号,模拟信号: 时间和幅度都是连续的信号数字信号: 幅值被限制在有限个数值之内，它不是连续的而是离散的，即幅值只能取有限的数值,音频的编码技术,由于多媒体信息的特殊性，其二

5、进制编码的技术和方法比一般的字符编码要复杂很多；基本的思想就是将“连续”变成“离散”，将“模拟信号”变为“数字信号” 一般需经过采样、量化、编码三个过程。,音频采样,音频采样：每隔一个时间间隔在声音波形上取一个幅度值，将时间上连续的信号变成离散的信号；采样的目的是在时间上，对连续的变化进行离散化，最终以有限个数的“点”，去替代原来连续的信号。,音频采样的例子,t,音频采样的例子,t,音频量化,音频量化：指的是在幅度值的取值空间上进行离散化，用有限位的二进制代码，表示落在同一时间段内的幅度值,音频量化的例子,3位量化,2位量化,音频编码,根据采样和量化的结果，将各离散点的幅度值进行“逐点”记

6、录，将记录的结果保存为一个文件，即为该音频信息的数据文件，实现对音频信息的编码；将来按照采样、量化和编码的“逆思想” ，可把该文件还原。只有当采样频率高于声音信号最高频率的两倍时，才能将数字信号表示的声音还原为原来的声音。,音频编码的图示,00 10 10 10 01 01 01 11 11,000 100 100 100 010 001 010 101 110,音频文件存储容量的计算,采样频率：(Hz 单位时间内的采样次数一般为11.025kHz或22.05kHz) 量化位数：(bit 表示量化级别的二进制的位数一般为8位或16位) 声道数量：单声道or多声道,不同技术指标下的效果图示

7、,采样频率11KHz 8位量化,采样频率22KHz 16位量化,音频文件存储容量的计算,音频数据的存储容量采样频率*量化位数*声道数*播放时间/8（字节B）采样频率=44.1kHz 样本精度=16bit 立体声播放时间=60秒存储空间=44.1*1000*16*2*60/(8*1024*1024) =10.09 MB,图像的编码技术,颜色模型图像的编码技术：采样、量化和编码图像文件存储容量的计算,颜色模型,颜色模型（color model）指的是描述所有颜色的一套规则和定义。最典型的代表是RGB（Red Green Blue）颜色模型。两种典型的颜色模型： RGB颜色模型：红绿篮

8、颜色模型 HSL颜色模型：色调饱和度亮度颜色模型,RGB颜色模型,颜色=R（红色的百分比）+G（绿色的百分比）B（蓝色的百分比）。当三种基本颜色等量相加时，得到白色。,RGB颜色模型,颜色=R（红色的百分比）+G（绿色的百分比）B（蓝色的百分比）。当红绿等量相加而篮为0时得到黄色。,RGB颜色模型,颜色=R（红色的百分比）+G（绿色的百分比）B（蓝色的百分比）。当红篮等量相加而绿为0时得到品红色。,RGB颜色模型,颜色=R（红色的百分比）+G（绿色的百分比）B（蓝色的百分比）。当绿篮等量相加而红为0时得到青色。,图像的编码技术,图像的数字化编码也经过采样、量化和编码三个过程采样是将图

9、像在二维空间上进行离散化分别在图像的横向和纵向设置M和N个相等的间隔；然后得到M*N个点，组成一个的包含若干行和若干列的一个“阵列”，每个点称为一个像素；,量化与编码,量化是对像素的颜色进行离散化(即用确定的数值记录点的颜色) 量化的等级与每个像素颜色的二进制数值的位数有关表示像素状态的位数越多，具有的色彩就越丰富黑白方式：用一个“位”表示像元的颜色；有2种色真彩色方式：用三个字节表示一个像元的颜色；具有2563个不同的颜色编码是对每个像素的颜色，以不同的二进制代码形式进行记录,图像编码的例子,采样：在横方向和纵方向上都设置10个采样点，得到10*10个像素量化：由于是黑白图像，

10、所以量化字长设置为1位二进制代码，并假定“0”表示黑色，“1”表示白色编码：最后将编码数值一行一行地记录保存起来，就完成了对图像的二进制编码,图像编码的例,1,影响图像质量的因素,图像分辨率（相当于音频的采样频率）用多少个像素表示图像像素深度或位深度（相当于音频的量化精度）用多少个二进制位表示一个像素的状态分辨率越高，像素深度越大，将占用越多的存储空间；当然，图像就越清晰圆滑美观逼真,宽度：271 高度：300 颜色：2色大小：9.9 KB,宽度：271 高度：300 颜色：4色大小：19.8 KB,不同像素深度的例,宽度：271 高度：300 颜色：256色大小：79.4

11、KB,宽度：271 高度：300 颜色：真彩色大小：238.2 KB,不同像素深度的例,不同分辨率的例子,图像文件存储容量的计算,存储一幅352288的静态真彩色图像图像分辨率为 352288 像素深度为 3B 存储容量= (352288 3)/1024=297KB 如提高图像分辨率存储容量= (7681024 3)/(10241024)=2.25MB,视频的编码技术,将视频信息在时间上、帧内空间上和色彩上分别进行离散化，并最终以二进制代码形式编码记录将涉及比音频信息和图像信息数字化更复杂的原理和方法，其基本的思想包括：将完整的视频信息在时间上分解为若干的帧；参照图像信息编码的方法

12、进行“帧内编码”；参照音频信息编码的方法进行伴音编码处理；考虑播放速率和伴音同步，最后完成视频信息编码,视频文件的存储容量计算,表示一幅352*288的静态真彩色图象需要的存储空间 352*288*3(B)=304128B=297KB 假设每秒播放25帧，计算1分钟视频数据的存储空间（不含音频数据） 352*288*3*25*60 (B)=435.06MB,数据压缩技术,数据压缩的必要性数据压缩的基本概念文本文件的压缩音频文件的压缩图像文件的压缩,数据压缩的必要性,尽管我们可以利用信息理论中的各种编码技术表达字符、图形图像、音频、视频，但是包含这些数据的文件往往是相当大的一秒钟的

13、视频需要约 9MB 的内存空间一幅全屏的位图约占用 25MB的内存空间一段45分钟的声音文件有大约 475 MB,数据压缩的必要性,大文件需要大的内存空间，否则将降低运行速度大文件需要大的外部存储空间，因而降低计算机硬盘等存储设备的有效使用效率大文件需要较长的传输时间，因而容易发生在传输过程中的中断,数据压缩基本概念,压缩：指重新记录一个文件，以使它占用较小存储空间解压缩：数据压缩必须是可逆的；数据压缩的逆过程叫解压缩压缩比：当数据被压缩的时候，包含数据的文件将缩小；其缩小量可用压缩比衡量压缩比原文件容量压缩后新文件的容量缩比为20:1意味着原始文件是压缩后文件的20倍,数据压

14、缩基本概念,有损压缩为获得更高地压缩比，首先对数据信息进行重新的组织整理，剔除某些不重要、不敏感、可忽略的原始数据，然后再进行压缩无损压缩数据无需事先进行重新组织而直接进行压缩，压缩文件中完全保留了原文件中的全部信息数据,文本文件的数据压缩,实现文本文件压缩的方法很多介绍：自适应模型替代法,自适应模型替代法,它首先扫描整个文本，寻找重复出现两次或两次以上的字节模型当找到一个模型后，就用在文本中没有用到过的一个新的字节模型替代它只要新的字节模型“短”于原字节模型，就可起到“压缩”的目的,自适应模型替代法举例,自适应模型替代法将44个字节（包括空格和标点）长的句子压缩到29个字节。,

15、上例中用来做替代的符号不是实际上使用的字符，是为了举例而用的。,图像信息的数据压缩,例如：在右侧图像中，兰色区域中所有点（像素）的颜色是相同的，如果仍“逐点记录”，必然产生很大的数据冗余。,图像信息是“逐点记录的”。之所以能进行压缩是因为信息本身通常存在很大的数据冗余量。,图像数据压缩方法,“游程长度编码”法（Run length encoding）游程长度：具有相同颜色并且是连续的像素的数目。通过为连续的相同颜色的像素重新编码实现图像文件的压缩游程长度编码。,有一个3232象素，256色的位图（如右图所示），其中每个像素需要一个字节存储颜色；如白色用1111 1111表示，黑色用000

16、0 0000表示没压缩时：图像的前九行有329=288个像素，需288个字节存储,游程长度编码例,图中有167个连续的白色像素。把这167个字节压缩成个字节。一个字节记录连续的像素点数，一个字节表示共同的颜色。 1010 0111（167）1111 1111（白色）使用相同的方法可以继续压缩后续的像素。,游程长度编码方法,前167个白色像素被压缩成2B： 10100111 11111111,下面5个黑色像素编码为： 00000101 00000000,代表5个黑色,代表167,代表白色,3232像素,压缩图示：,58/88,用游程长度编码压缩后，前9行只需30个字节即第二、四列的二进制数,59/88,The End!,课堂测验,

展开阅读全文