第五部分MPEG压缩技术.ppt

上传人:本田雅阁 文档编号:2571330 上传时间:2019-04-10 格式:PPT 页数:47 大小:446.01KB
返回 下载 相关 举报
第五部分MPEG压缩技术.ppt_第1页
第1页 / 共47页
第五部分MPEG压缩技术.ppt_第2页
第2页 / 共47页
第五部分MPEG压缩技术.ppt_第3页
第3页 / 共47页
第五部分MPEG压缩技术.ppt_第4页
第4页 / 共47页
第五部分MPEG压缩技术.ppt_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《第五部分MPEG压缩技术.ppt》由会员分享,可在线阅读,更多相关《第五部分MPEG压缩技术.ppt(47页珍藏版)》请在三一文库上搜索。

1、第五章 MPEG压缩技术,MPEG(Moving Picture Expert Group)是在1988年由国际标准化组织(International Organization for Standardization,ISO)和国际电工委员会(International Electrotechnical Commission,IEC)联合成立的专家组,负责开发电视图像数据和声音数据的编码、解码和它们的同步等标准。这个专家组开发的标准称为MPEG标准,到目前为止,已经开发和正在开发的MPEG标准有: MPEG-1:数字电视标准,1992年正式发布。 MPEG-2:数字电视标准。 MPEG-3:已

2、于1992年7月合并到高清晰度电视(High-Definition TV,HDTV)工作组。 MPEG-4:多媒体应用标准(1999年发布)。 MPEG-7:多媒体内容描述接口标准(正在研究)。,主要应用范围 光盘存储 数字视频的传播 交换式数字视频 HDTV 网络多媒体,MPEG-1和-2典型的编码参数,5.1 MPEG-1数字电视标准,MPEG-1处理的是标准图像交换格式(Standard Interchange format,SIF)或者称为源输入格式(Source Input Format,SIF)的电视,即NTSC制为352像素240行/帧 30帧/秒,PAL制为352像素 288行

3、/帧 25帧/秒,压缩的输出速率定义在1.5 Mbit/s以下。这个标准主要是针对当时具有这种数据传输率的CD-ROM和网络而开发的,用于在CD-ROM上存储数字影视和在网络上传输数字影视。 MPEG-1的标准号为ISO/IEC 11172,标准名称为“信息技术用于数据速率高达大约1.5 Mbit/s的数字存储媒体的电视图像和伴音编码”Information technology Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s)。它已于1991年

4、底被ISO/IEC采纳,由五个部分组成:, MPEG-1系统,写成MPEG-1 Systems,规定电视图像数据、声音数据及其他相关数据的同步,标准名是ISO/IEC 11172-1:1993 Information technology Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s Part 1:Systems。 MPEG-1电视图像,写成MPEG-1 Video, 规定电视数据的编码和解码,标准名是ISO/IEC 11172-2:1993

5、Information technology Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s Part 2:Video。 MPEG-1声音,写成MPEG-1 Audio, 规定声音数据的编码和解码,标准名是ISO/IEC 11172-3:1993 Information technology Coding of moving pictures and associated audio for digital storage media at up

6、 to about 1.5 Mbit/s Part 3:Audio。, MPEG-1一致性测试,写成MPEG-1 Conformance testing,标准名是ISO/IEC 11172-4:1995 Information technology Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s Part 4:Conformance testing。这个标准详细说明如何测试比特数据流(bitstreams)和解码器是否满足MPEG-1前3个部分(

7、Part1,2和3)中所规定的要求。这些测试可由厂商和用户实施。 MPEG-1软件模拟,写成MPEG-1 Software simulation,标准名是ISO/IEC TR 11172-5 Information technology Coding of moving pictures and associated audio for digital storage media up to about 1.5 Mbit/s Part 5:Software simulation。实际上,这部分的内容不是一个标准,而是一个技术报告,给出了用软件执行MPEG-1标准前3个部分的结果。,MPEG-1

8、译码器的方框图,5.2 MPEG-2数字电视标准,MPEG-2标准从1990年开始研究,1994发布DIS。它是一个直接与数字电视广播有关的高质量图像和声音编码标准。MPEG-2可以说是MPEG-1的扩充,因为它们的基本编码算法都相同。但MPEG-2增加了许多MPEG-1所没有的功能,例如增加了隔行扫描电视的编码,提供了位速率的可变性能(scalability)功能。MPEG-2要达到的最基本目标是:位速率为49 Mbit/s,最高达15 Mbit/s。 MPEG-2的标准号为ISO/IEC 13818,标准名称为“信息技术电视图像和伴音信息的通用编码(Information technolo

9、gy Generic coding of moving pictures and associated audio information )”。MPEG-2包含9个部分: MPEG-2系统,写成MPEG-2 Systems,规定电视图像数据、声音数据及其他相关数据的同步,标准名是ISO/IEC 13818-1:1996 Information technology Generic coding of moving pictures and associated audio information :Systems。,这个标准主要是用来定义电视图像数据、声音数据和其他数据的组合,把这些数据组合

10、成一个或者多个适合于存储或者传输的基本数据流。数据流有两种形式,一种称为程序数据流(Program Stream,PS),另一种称为传输数据流(Transport Stream,TS)。程序数据流是组合一个或者多个规格化的即包化基本数据流(Packetised Elementary Streams,PES)而生成的一种数据流,用在出现错误相对比较少的环境下,适合使用软件处理的应用;传输数据流也是组合一个或者多个PES而生成的一种数据流,它用在出现错误相对比较多的环境下,例如在有损失或者有噪声的传输系统中。,MPEG-2的系统模型, MPEG-2电视图像,写成MPEG-2 Video,规定电视数

11、据的编码和解码,标准名是ISO/IEC 13818-2:1996 Information technology Generic coding of moving pictures and associated audio information :Video。 为了适应各种应用,这个标准定义了电视图像的各种规格,称为配置(profile) 。表中的“X”符号表示MPEG-2支持的配置。 有些人认为使用4:2:0子采样格式的图像质量还不够好,因此在1996年的标准中增加了4:2:2子采样格式的图像。多视角配置(Multiview Profile,MVP)是附加的配置。 MPEG-2声音,写成MP

12、EG-2 Audio,规定声音数据的编码和解码,是MPEG-1 Audio的扩充,支持多个声道,标准名是ISO/IEC 13818-3:1998 Information technology Generic coding of moving pictures and associated audio information Part 3:Audio。,MPEG-2电视图像配置, MPEG-2一致性测试,写成MPEG-2 Conformance testing,标准名是ISO/IEC DIS 13818-4 Information technology Generic coding of mov

13、ing pictures and associated audio information Part 4:Conformance testing。 MPEG-2软件模拟,写成MPEG-2 Software simulation,标准名是ISO/IEC TR 13818-5:1997 Information technology Generic coding of moving pictures and associated audio information Part 5:Software simulation。 MPEG-2数字存储媒体命令和控制扩展协议,写成MPEG-2 Extension

14、s for DSM-CC,标准名是ISO/IEC DIS 13818-6 Information technology Generic coding of moving pictures and associated audio information Part 6:Extensions for DSM-CC。,MPEG-2先进声音编码,写成MPEG-2 AAC,是多声道声音编码算法标准。这个标准除后向兼容MPEG-1 Audio标准之外,还有非后向兼容的声音标准。标准名是ISO/IEC 13818-7:1997 Information technology Generic coding of

15、 moving pictures and associated audio information Part 7:Advanced Audio Coding (AAC)。 MPEG-2系统解码器实时接口扩展标准,标准名是ISO/IEC 13818-9:1996 Information technology Generic coding of moving pictures and associated audio information Part 9:Extension for real time interface for systems decoders。 MPEG-2 DSM-CC一致性

16、扩展测试,标准名是ISO/IEC DIS 13818-10 Information technology Generic coding of moving pictures and associated audio information Part 10:Conformance extensions for Digital Storage Media Command and Control (DSM-CC)。,5.3 MPEG-4 多媒体应用标准,MPEG-4从1994年开始工作,它是为视听(audio-visual)数据的编码和交互播放开发算法和工具,是一个数据速率很低的多媒体通信标准。MP

17、EG-4的目标是要在异构网络环境下能够高度可靠地工作,并且具有很强的交互功能。 为了达到这个目标,MPEG-4引入了对象基表达(object-based representation)的概念,用来表达视听对象(audio/visual objects,AVO);MPEG-4扩充了编码的数据类型,由自然数据对象扩展到计算机生成的合成数据对象,采用合成对象/自然对象混合编码(Synthetic/Natural Hybrid Coding,SNHC)算法;在实现交互功能和重用对象中引入了组合、合成和编排等重要概念。MPEG-4系统构造如图5-01所示,接收端的构造部件如图5-02所示。,图5-01

18、MPEG-4系统示意图,图5-02 MPEG-4接收端的主要部件,MPEG-4中制定了一个称为传输多媒体集成框架(Delivery Multimedia Integration Framework,DMIF)的会话协议,它用来管理多媒体数据流。该协议在原则上与文件传输协议FTP(File Transfer Protocol)类似,其差别是:FTP返回的是数据,而DMIF返回的是指向到何处获取数据流的指针。DMIF覆盖了三种主要技术:广播技术,交互网络技术和光盘技术,如图8-03所示。,图8-03 DMIF覆盖的三种主要技术,MPEG-4将应用在移动通信和公用电话交换网(public switc

19、hed telephone network,PSTN)上,并支持可视电话(videophone)、电视邮件(video mail)、电子报纸(electronic newspapers)和其他低数据传输速率场合下的应用。 MPEG-4的标准名是Very-low bitrate audio-visual coding (甚低速率视听编码)。截止到1998年9月,已作为国际标准草案(Draft International Standard,DIS)的MPEG-4文件有6个部分,它们是: MPEG-4系统标准,标准名是ISO/IEC DIS 14496-1 Very-low bitrate audi

20、o-visual coding Part 1: Systems。 MPEG-4电视图像标准,标准名是ISO/IEC DIS 14496-2 Very low bitrate audio-visual coding Part 2: Video。 MPEG-4声音标准,标准名是ISO/IEC DIS 14496-3 Very low bitrate audio-visual coding Part 3: Audio。, MPEG-4一致性测试标准,标准名是ISO/IEC DIS 14496-4 Very-low bitrate audio-visual coding Part 4: Conform

21、ance Testing。 MPEG-4参考软件,标准名是ISO/IEC DIS 14496-5 Very-low bitrate audio-visual coding Part 5: Reference software MPEG-4传输多媒体集成框架,标准名是ISO/IEC DIS 14496-6 Very-low bitrate audio-visual coding Part 6: Delivery Multimedia Integration Framework (DMIF)。,5.4 MPEG-7多媒体应用标准,MPEG-7的工作于1996年启动,名称叫做多媒体内容描述接口(Mu

22、ltimedia Content Description Interface) ,目的是制定一套描述符标准,用来描述各种类型的多媒体信息及它们之间的关系,以便更快更有效地检索信息。这些媒体材料可包括静态图像、图形、3D模型、声音、话音、电视以及在多媒体演示中它们之间的组合关系。在某些情况下,数据类型还可包括面部特性和个人特性的表达。 与其他的MPEG标准一样,MPEG-7是为满足特定需求而制定的视听信息标准。MPEG-7标准也是建筑在其他的标准之上的,例如,PCM, MPEG-1, MPEG-2和MPEG-4等等。在MPEG-7中,例如MPEG-4中使用的形状描述符、MPEG-1和MPEG-2

23、中使用的移动矢量(motion vector)等都可能在MPEG-7中用到。,下图表示了MPEG-7的处理链(processing chain),这是高度抽象的方框图。在这个处理链中包含有三个方框:特征抽取(feature extraction)、标准描述(standard description)和检索工具(search engine)。特征的自动分析和抽取对MPEG-7是至关重要的,抽象程度越高,自动抽取也越困难,而且不是都能够自动抽取的,因此开发自动的和交互式半自动抽取的算法和工具都是很有用的。尽管如此,特征抽取和检索工具都不包含在MPEG-7标准中,而是留给大家去竞争,以便得到最好的算

24、法和工具。,MPEG-7的应用领域包括:数字图书馆(Digital library),例如图像目录、音乐词典等;多媒体目录服务(multimedia directory services),例如黄页(yellow pages);广播媒体的选择,例如无线电频道,TV频道等;多媒体编辑,例如个人电子新闻服务,多媒体创作等等。潜在应用的应用领域包括:教育、娱乐、新闻、旅游、医疗、购物等等,5.5 MPEG视频,MPEG-1和MPEG-2 Video标准有许多共同之处,基本概念类似,数据压缩编码方法基本相同,都采用以图像块作为基本单元进行变换、量化和运动补偿等技术来获得高压缩比。MPEG-4 Vide

25、o部分采用内容基编码技术,它除与MPEG-1和-2 Video向后兼容外,还引入了电视图像对象(VO)的概念,在某些应用场合下,对场景中的图像分别进行编码可以获得很高的压缩比而服务质量也能满足要求。下面将简要介绍这些标准中压缩电视图像数据的基本方法。,5.5.1 数据压缩算法 1 简介 电视图像数据压缩利用的各种特性和采用的方法归纳在表5-1中。从表中可以看到,电视图像本身在时间上和空间上都含有许多冗余信息,图像自身的构造也有冗余性。此外,正如前面所介绍的,利用人的视觉特性也可对图像进行压缩,这叫做视觉冗余。,表5-1 电视图像压缩利用的各种冗余信息,MPEG-Video图像压缩技术基本方法和

26、方法可以归纳成两个要点: 在空间方向上,图像数据压缩采用JPEG(Joint Photographic Experts Group)压缩算法来去掉冗余信息。 在时间方向上,图像数据压缩采用运动补偿(motion compensation)算法来去掉冗余信息。 为了在保证图像质量基本不降低而又能够获得高的压缩比,MPEG专家组定义了三种图像:帧内图像I(intra),预测图像P(predicted )和双向预测图像B(bidirectionally interpolated ),典型的排列如图5-04所示。这三种图像将采用三种不同的算法进行压缩。,图5-04 MPEG专家组定义的三种图像,2 帧

27、内图像I的压缩编码算法 帧内图像I不参照任何过去的或者将来的其他图像帧,压缩编码采用类似JPEG压缩算法,它的框图如图5-05所示。如果电视图像是用RGB空间表示的,则首先把它转换成YCrCb空间表示的图像。每个图像平面分成88的图块,对每个图块进行离散余弦变换DCT(discrete Cosine Transform)。DCT变换后经过量化的交流分量系数按照Zig-zag的形状排序,然后再使用无损压缩技术进行编码。DCT变换后经过量化的直流分量系数用差分脉冲编码DPCM(Differential Pulse Code Modulation),交流分量系数用行程长度编码RLE(run-leng

28、th encoding),然后再用霍夫曼(Huffman)编码或者用算术编码。它的编码框图如图5-05所示。,图5-05 帧内图像I的压缩编码算法框图,3 预测图像P的压缩编码算法 预测图像的编码也是以图像宏块(macroblock)为基本编码单元,一个宏块定义为IJ像素的图像块,一般取1616。预测图像P使用两种类型的参数来表示:一种参数是当前要编码的图像宏块与参考图像的宏块之间的差值,另一种参数是宏块的运动矢量。运动矢量的概念可用图5-06表示。,图5-06 运动矢量的概念,求解差值的方法如图5-07所示。假设编码图像宏块MPI是参考图像宏块MRJ的最佳匹配块,它们的差值就是这两个宏块中相

29、应像素值之差。对所求得的差值进行彩色空间转换,并作4:1:1的子采样得到Y,Cr和Cb分量值,然后仿照JPEG压缩算法对差值进行编码,计算出的运动矢量也要进行霍夫曼编码。,图5-07 预测图像P的压缩编码算法框图,求解运动矢量的方法定义在图5-08中。在求两个宏块差值之前,需要找出编码图像中的预测图像编码宏块MPI相对于参考图像中的参考宏块MRJ所移动的距离和方向,这就是运动矢量(motion vector)。,图5-08 运动矢量的算法框图,horizontal,要使预测图像更精确,就要求找到与参考宏块MRJ最佳匹配的预测图像编码宏块MPI。所谓最佳匹配是指这两个宏块之间的差值最小。方法一、

30、以绝对值AE(absolute difference)最小作为匹配判据,,,,方法二、以均方误差MSE(mean-square error)最小作为匹配判据,,方法三、以平均绝对帧差MAD(mean of the absolute frame difference)最小作为匹配判据,,,,其中,dx和dy分别是参考宏块MRJ的运动矢量d(dx, dy)在X和Y方向上的矢量。 从以上分析可知,对预测图像的编码实际上就是寻找最佳匹配图像宏块,找到最佳宏块之后就找到了最佳运动矢量d(dx,dy)。,为减少搜索次数,现在已开发出许多简化算法用来寻找最佳宏块,下面介绍其中的三种。 1. 二维对数搜索法(

31、2D-logarithmic search) 这种方法采用的匹配判据是MSE为最小。它的搜索策略是当沿着最小失真方向搜索。二维对数搜索方法如图5-09所示。在搜索时,每移动一次就检查5个搜索点。如果最小失真在中央或在边界,就减少搜索点之间的距离。在这个例子中,步骤1,2,5得到的近似移动矢量d为(i,j-2)、(i,j-4)、(i+2,j-4)、(i+2,j-5)和(i+2,j-6),最后得到的移动矢量为d(i+2,j-6)。,图5-09 二维对数搜索法,2. 三步搜索法(three-step search) 这种搜索法与二维对数搜索法很接近。不过在开始搜索时,搜索点离(i,j)这个中心点很远

32、,第一步就测试8个搜索点,如图5-10所示。在这个例子中,点(i+3,j-3)作为第一个近似的移动矢量d1;第二步,搜索点偏离(i+3,j-3)较近,找到的点假定为(i+3,j-5);第三步给出了最后的移动矢量为d(i+2,j-6)。本例采用MAD作为匹配判据。,图5-10 三步搜索法,3. 对偶搜索法(conjugate search) 该法使用MAD作为匹配判据,示于图5-11。在第一次搜索时,通过计算点(i-1,j)、(i,j)和(i+1,j)处的MAD值来决定i方向上的最小失真。如果计算结果表明点(i+1,j)处的MAD为最小,就计算点(i+2,j)处的MAD,并从(i,j),(i+1

33、,j)和(i+2,j)的MAD中找出最小值。按这种方法一直进行下去,直到在i方向上找到最小MAD值及其对应的点。 在这个例子中,假定在i方向上找到的点为(i+2,j)。在i方向上找到最小MAD值对应的点之后,就沿j方向去找最小MAD值对应的点,方法与i方向的搜索方法相同。最后得到的移动矢量为d(i+2,j-6)。,图5-11 对偶搜索法,在整个MPEG图像压缩过程中,寻找最佳匹配宏块要占据相当多的计算时间,匹配得越好,重构的图像质量越高。,4 双向预测图像B的压缩编码算法 双向预测图像B的压缩编码框图如图5-12所示。具体计算方法与预测图像P的算法类似。,图5-12 双向预测图像B的压缩编码算

34、法框图,5 电视图像的结构 MPEG编码器算法允许选择I图像的频率和位置。I图像的频率是指每秒钟出现I图像的次数,位置是指时间方向上帧所在的位置。一般情况下,I图像的频率为2。MPEG编码器也允许在一对I图像或者P图像之间选择B图像的数目。I图像、P图像和B图像数目的选择依据主要是根据节目的内容。例如,对于快速运动的图像,I图像的频率可以选择高一些,B图像的数目可以选择少一点;对于慢速运动的图像I图像的频率可以低一点,而B图像的数目可以选择多一点。此外,在实际应用中还要考虑媒体的速率。 一个典型的I、P、B图像安排如图513所示。编码参数为:帧内图像I的距离为N=15,预测图像(P)的距离为M

35、=3。,图513 MPEG电视帧编排,I、P和B图像压缩后的大小如表10-02所示,单位为比特。从表中可以看到,I帧图像的数据量最大,而B帧图像的数据量最小。 MPEG三种图像的压缩后的典型值(比特),5.4 MPEG-4电视图像编码 MPEG Video专家组建立了一个用来开发图像和电视图像编码技术的模型,叫做“试验模型(Test Model)”或者叫做“验证模型(VMVerification Model)”。这个模型描述了一个核心的编码算法平台,包括编码器、解码器以及位流(bitstream)的语法和语义。本节就电视图像的编码和解码的基本方法作一个简单介绍,其他内容请看本章所附的参考文献和

36、站点。 1、 电视图像对象区的概念 MPEG-4 Video编码算法支持由MPEG-1和MPEG-2提供的所有功能,包括对各种输入格式下的标准矩形图像、帧速率、位速率和隔行扫描图像源的支持。MPEG-4 Video算法的核心是支持内容基(content-based)的编码和解码功能,也就是对场景中使用分割算法抽取的单独的物理对象进行编码和解码。MPEG-4 Video还提供管理这些电视内容的最基本方法。,为了实现预想的内容基交互等功能,MPEG-4 Video验证模型引进了一个叫做“电视图像对象区(Video Object Plane,VOP)”的概念。如图10-11所示,上图表示支持MPEG

37、-1和MPEG-2的普通的MPEG-4编码器,下图表示MPEG-4的甚低速率电视图像(Very Low Bitrate Video,VLVB)的核心编码器。MPEG-4 Video验证模型不像MPEG-1/-2 Video那样把电视图像都认为是一个矩形区,而是假设每帧图像被分割成许多任意形状的图像区,每个区都有可能覆盖描述场景中感兴趣的物理对象或者内容,这种区被定义为图像对象区VOP。,图513 普通MPEG-4编码器和MPEG-4 VLBV核心编码器,编码器输入的是任意形状的图像区,图像区的形状和位置也可随帧的变化而改变。属于相同物理对象的连续的电视图像对象区(VOP)组成电视图像对象(Vi

38、deo Objects,VO)。例如,一个没有背景图像的正在演讲的人,如图10-11所示。MPEG-4可单独对属于相同电视图像对象(VO)的电视图像区(VOP)的形状、移动(motion)和纹理(texture)信息进编码和传送,或者把它们编码成一个单独的电视图像对象层(Video Object Layer,VOL)。此外,需要标识每个电视图像对象层(VOL)的信息也包含在编码后的位流(bitstream)中,这些信息包括各种电视图像对象层(VOL)的电视图像在接收端应该如何进行组合,以便重构完整的原始图像序列。这样就可以对每个电视图像对象区(VOP)进行单独解码,提供了管理电视图像序列的灵活

39、性。,2 电视图像编码方案 MPEG-4 Video验证模型对每个电视图像对象(VO)的形状、移动和纹理信息进行编码形成单独的VOL层,以便能够单独对电视图像对象(VO)进行解码。如果输入图像序列只包含标准的矩形图像,就不需要形状编码,在这种情况下,MPEG-4 Video使用的编码算法结构也就与MPEG-1和MPEG-2使用的算法结构相同。 MPEG-4 Video验证模型对每个电视图像对象区(VOP)进行编码使用的压缩算法是在MPEG-1和MPEG-2 Video标准的基础上开发的,它也是以图像块为基础的混合DPCM和变换编码技术(hybrid DPCM/Transform coding)

40、。MPEG-4编码算法也定义了帧内电视图像对象区(Intra-Frame VOP,I-VOP)编码方式和帧间电视图像对象区预测(Inter-frame VOP prediction,简写为P-VOP)编码方式,它也支持双向预测电视图像对象区(B-directionally predicted VOP,B-VOP)方式。在对电视图像对象区(VOP)的形状编码之后,颜色图像序列分割成宏块进行编码,如图5-14所示。图中的Y1、Y2、Y3和Y4表示亮度宏块,U、V分别表示红色差和蓝色差宏块。,图5-13 电视图像序列中的I-VOP和P-VOP编码方式和宏块结构 图5-14 描绘了MPEG-4 Vid

41、eo的编码算法,用来对矩形和任意形状的输入图像序列进行编码。这个基本编码算法结构图包含了移动矢量(motion vector)的编码,以及以离散余弦变换为基础的纹理编码。,图5-14 MPEG-4 Video编码器的算法方框图,MPEG-4采用内容基编码方法的一个重要优点是,使用合适的和专门的对象基移动预测工具(object-based motion prediction tools)可以明显提高场景中某些电视图像对象的压缩效率。 图5-15 表示MPEG-4对电视图像序列进行编码的一个实际例子。左上角的图是背景全景图。右上角的图是一个没有背景的子图像全景图,可以把网球运动员当作是一个电视图像

42、对象(VO),经常把这种可以独立移动的小图像称为子图像(sprite)。下面的图是接收端合成的全景图。在编码之前这个子图像全景图从背景全背景图序列中抽出来,然后分别对它们进行编码、传送和解码,最后再合成。,图5-15 MPEG-4电视序列编码举例,3 电视图像分辨率可变编码 “电视图像分辨率”是指电视图像空间分辨率(spatial resolution)和时间分辨率(temporal resolution)。空间分辨率是指一帧图像包含的行数与每行显示的像素数之乘积,而时间分辨率是指每秒种显示或者传输的图像帧数。设置电视图像分辨率可变编码功能的一个重要目的是为了能够灵活支持性能不同(例如不同带宽

43、)的各种电视接收或显示设备,或者支持要求浏览电视数据库等方面的应用。另一个目的是提供分层次的电视图像数据位流,这样可按应用所要求的先后次序进行传输。 MPEG-2也有电视图像分辨率可变编码功能,但它是以图像的帧为基础进行编码。而MPEG-4电视图像分辨率可变编码是以任意形状的电视图像对象区(VOP)为基础进行编码。对那些没有能力或者不愿意接收高分辨率图像的接收器,它可以接收分辨率比较低的电视图像,降低空间分辨率或者时间分辨率意味降低图像的质量。,空间分辨率可变性(Spatial Scalability)和时间分辨率可变性(Temporal Scalability)的实现方法类似。图5-15 描述了多种分辨率电视图像编码(multiscale video coding)方案。该方案提供三个层次的编码/解码,每一层都支持在不同空间分辨率下进行编码/解码。从图中可以看到,多种空间分辨率的实现是通过降低输入电视信号的采样率来获得的。,图5-15 VOP空间分辨率可变编码方法,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1