插值算法毕业论文---H.264与AVS插值算法比较.doc

上传人:椰子壳 文档编号:3932657 上传时间:2019-10-10 格式:DOC 页数:33 大小:1.05MB
返回 下载 相关 举报
插值算法毕业论文---H.264与AVS插值算法比较.doc_第1页
第1页 / 共33页
插值算法毕业论文---H.264与AVS插值算法比较.doc_第2页
第2页 / 共33页
插值算法毕业论文---H.264与AVS插值算法比较.doc_第3页
第3页 / 共33页
插值算法毕业论文---H.264与AVS插值算法比较.doc_第4页
第4页 / 共33页
插值算法毕业论文---H.264与AVS插值算法比较.doc_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《插值算法毕业论文---H.264与AVS插值算法比较.doc》由会员分享,可在线阅读,更多相关《插值算法毕业论文---H.264与AVS插值算法比较.doc(33页珍藏版)》请在三一文库上搜索。

1、本科毕业论文(设计)H.264与AVS插值算法比较H.264 interpolation algorithm with AVS comparison指 导 教 师: 作 者 姓 名: 学 号: 作 者 姓 名: 学 号: 计算机科学与技术院(系、部)电子信息科学与技术 专业 2011届 2011年 4 月 7日山东经济学院学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献均已

2、在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目: 作者签名: 日期: 年 月 日山东经济学院关于论文使用授权的说明本人完全了解山东经济学院有关保留、使用学士学位论文的规定,即:学校有权保留、送交论文的复印件,允许论文被查阅,学校可以公布论文的全部或部分内容,可以采用影印或其他复制手段保存论文。学位论文题目: 指导教师签名: 论文作者签名 年 月 日 年 月 日山东经济学院学士学位论文H.264与AVS插值算法比较摘 要视频分辨率变换在多媒体领域有着非常广泛的应用,在传统的插值算法中由于对图像边缘活纹理等细节信息考虑不足常常导致插值后图像出现模糊或锯齿的

3、现象,所以论文对H.264AVC及AVS进行了详细的分析 。本论文的主要目的就是比较H.264与AVS插值算法,测试他们在图像处理上的优劣,利用MATLAB这一工具编写程序对同一图像进行处理。本文分别从运算复杂度和性能两个方面进行了比较,在复杂度的分析中引入了复杂度分析模型,该模型从硬件设计的角度合理地量化了两种插值算法的复杂度。在比较两种插值算法的性能上,根据插值的运算特性给出了性能的评估指标。用上述复杂度模型和性能指标对H.264和AVS的插值算法进行分析和比较,实验结果表明H.264具有较好的性能,而AVS的性能开销比略好于H.264 。 关键词:MATLAB;插值算法;H.264;AV

4、S- I -H.264 interpolation algorithm with AVS comparisonAbstractVideo resolution transform in multimedia field has a very wide range of applications, in traditional interpolation algorithm for image edges due to live texture detail information consider deficiency often result in interpolation fuzzy o

5、r after images appear serrated phenomenon so papers on H.264 / AVC and AVS were analyzed in detail. The main purpose of this paper is to compare with the AVS and H.264 interpolation algorithm, test their in image processing, advantage and disadvantage of the MATLAB this tool programming for the same

6、 image processing.This paper respectively from two aspects of computing complexity and performance are compared, and the analysis of the complexity introduced into the complexity analysis model, this model from the hardware design Angle properly quantify two interpolation algorithm complexity. In co

7、mparing two interpolation algorithm performance, and according to the operation characteristics are given interpolation performance evaluation index. With the complexity of model performance index and H.264 and AVS interpolation algorithm analysis and comparison, the experimental results show that t

8、he H.264, and has better performance than the AVS performance overhead is slightly better than H.264.Key Words:MATLAB;Nearest Neighbor Interpolation;H.264;AVS- III -目 录摘 要IAbstractII引 言11 H.264与AVS的背景21.1 H.264的背景21.2 AVS的背景21.3 H.264基本概述21.4 AVS基本概述32 插值复杂度分析42.1 插值复杂度分析42.2 H.264与AVS插值算法的复杂度分析52.2

9、.1 H.264亮度样本插值部分分析 52.2.2 H.264色度样本插值部分分析62.2.3 AVS亮度样本插值部分分析72.2.4 AVS色度样本插值部分分析93 BMP图像解析113.1 BMP概况113.2 BMP文件结构114 实验结果及分析144.1 性能比较的方法144.2 实验结果及分析15结论18参考文献19附录 程序20致 谢27山东经济学院学士学位论文引 言 H.264/AVC是ITU-T Video Coding Experts Group(VCEG)与ISO/IEC Moving Picture Experts Group(MPEG)共同制定的最新一代视频编码国际标准

10、。AVS(Audio video Coding Standard)是基于我国创新技术和部分公开技术的自主标准,在编码效率上与H.264/AVC相当,达到了第二代标准的最高水平。目前对两个标准性能比较也已成为图像通信领域关心的热点问题之一。“插值”最初是电脑的术语,现在引用到数码图像的处理上。即图像放大时,像素也相应地增加,增加的过程就是“插值”程序自动选择信息较好的像素作为增加的像素,而并非只使用临近的像素,所以在放大图像时,图像看上去会比较平滑、干净。不过需要说明的是插值并不能增加图像信息。图像放大时,像素也相应地增加,增加的过程就是“插值”程序自动选择信息较好的像素作为增加的像素,而并非只

11、使用临近的像素,所以在放大图像时,图像看上去会比较平滑、干净通过插值得到的样本值越是接近真实的像素值,那么插值滤波器的性能也就越好,它对降低视频码率以及提高图像视觉质量的贡献也就越大所以对H.264与AVS的插值算法在复杂度和性能上进行分析比较,对评价和比较两个标准的性能很有意义。1 H.264与AVS的背景1.1 H.264的背景 H.264/MPEG-4AVC是ITU-T的VCG(Video Coding Experts Group)和ISO/IEC的MPEG(Moving Picture Experts Group)联合开发的新一代视频编码标准。它的应用范围很广阔包括可视电话、视频会议等

12、。H.264的主要特色就是极大的提高了压缩率。H.264在细节上与之前的标准相比压缩效率有很大提高,但在核心技术上仍沿用了之前基于预测变换的混合编码框架。而且新一代视频编码标准H.264具有良好的网络适应性和容错等特点。1 1.2 AVS的背景AVS的诞生可以说是一个历史的机遇,面对H.264以及MPEG-2等标准高额的专利费,我国数字视频产业面临严重挑战。加上我国致力于提高国内数字音视频产业的核心竞争力,由国家信息产业部科学技术司于2006年6月批准成立了“数字音视频编解码技术标准工作组”,联合国内从事数字音视频编解码技术研发的科研机构和企业,针对我国音视频产业的需求,提出了我国自主知识产权

13、的信源编码标准信息技术先进音视频编码系列标准,简称AVS(audio video coding standard).2 自主的AVS标准在技术和性能上处于国际先进水平,如果抓住这次机遇,我国在技术专利标准芯片系统产业这个产业链上,就有可能具有全面的主动权。 1.3 H.264基本概述 H.264,同时也是MPEG-4第十部分,是由ITU-T视频编码专家组(VCEG)和ISO/IEC动态图像专家组(MPEG)联合组成的联合视频组(JVT,Joint Video Team)提出的高度压缩数字视频编解码器标准。3H.264和以前的标准一样,也是采用DPCM加变换编码的混合编码模式。但它“回归基本”的

14、简洁设计,不用众多的选项,获得比H.263+好得多的压缩性能;加强了对各种信道的适应能力,采用“网络友好”的结构和语法,有利于对误码和丢包的处理;应用目标范围较宽,以满足不同速率、不同解析度以及不同传输(存储)场合的需求。 技术上,它集中了以往标准的优点,并吸收了标准制定中积累的经验。与H.263 v2(H.263+)或MPEG-4简单类(Simple Profile)相比,H.264在使用与上述编码方法类似的最佳编码器时,在大多数码率下最多可节省50%的码率。H.264在所有码率下都能持续提供较高的视频质量。H.264能工作在低延时模式以适应实时通信的应用(如视频会议),同时又能很好地工作在

15、没有延时限制的应用,如视频存储和以服务器为基础的视频流式应用。H.264提供包传输网中处理包丢失所需的工具,以及在易误码的无线网中处理比特误码的工具。1.4 AVS基本概述AVS是我国具备自主知识产权的第二代信源编码标准,是信息技术先进音视频编码系列标准的简称,其包括系统、视频、音频、数字版权管理等四个主要技术标准和符合性测试等支撑标准。信源编码技术解决的重点问题是数字音视频海量数据(即初始数据、信源)的编码压缩问题,故也称数字音视频编解码技术。显而易见,它是其后数字信息传输、存储、播放等环节的前提,因此是数字音视频产业的共性基础标准。AVS是基于我国创新技术和部分公开技术的自主标准,编码效率

16、比MPEG-2高2-3倍,与AVC相当,而且技术方案简洁,芯片实现复杂度低,达到了第二代标准的最高水平;而且,AVS是开放式制订的国家、国际标准,易于推广; AVS是一套包含系统、视频、音频、媒体版权管理在内的完整标准体系,为数字音视频产业提供更全面的解决方案。4 综上所述,AVS可称第二代信源标准的上选。2 插值复杂度分析2.1 插值复杂度分析为了提高编码效率 ,H. 264 和 AVS在做运动估计与运动补偿时 ,都采用了分数精度的运动矢量。在亮度插值中 ,精度达到四分之一像素 ,而在色度插值中 ,精度为八分之一像素。两种标准支持的精度是相同的 ,但它们所使用的插值滤波器不同。H. 264对

17、半像素点插值时使用了一种6抽头滤波器 ,同时四分之一像素通过对半像素点和整数点取平均的方法得到。AVS则在半像素插值时使用了一种 4抽头的滤波器;四分之一像素插值通过在半像素基础上再使用另一种 4 抽头滤波器得到。H. 264 和AVS两种插值算法运用了不同的阶数 ,不同系数的滤波器 ,但他们都可以通过移位操作和加法P 减法操作来实现。在硬件设计中 ,移位运算的消耗可以忽略 ,因而可以通过加法P 减法的操作次数来统计运算量 ,从而评估他们的复杂度。首先以 H. 264 在进行半像素点插值时所用的 6抽头滤波器的运算为例 ,来说明复杂度分析的思路。H. 264采用了一种6抽头滤波器来进行半像素样

18、本点的插值 ,其抽头系数为(1 , - 5 ,20 ,20 , - 5 ,1) 。即对于6个 N 比特的有符号整型输入信号 A ,B , C , D , E和 F来说 ,输出信号 P为: (2.1)P是一个(N + 6)比特的有符号整数。把所有的乘法操作替换为移位操作和加法P 减法操作 , (2.1)式就可以写为: (2.2)合并同类项进一步提高效率 ,并将所有加法或减法操作统一为2 输入 ,1 输出的标准形式 ,进一步推倒出下式: (2.3)对(2.3)式进行统计 ,共用到 5 个加法和 2 个减法。具体完成一个六抽头滤波器的运算工作 ,需要3个N 比特的加法 ,一个(N + 1)比特的加法

19、 ,一个(N + 2)比特的加法以及两个(N + 1)比特的减法。由于减法可以通过加法实现 ,因而在统计运算量时把减法转换成加法进行统计。将运算全过程中 ,各个不同位宽加法的次数乘上其位宽的比特数再求累加和 ,统计该运算的开销。 (2.4) 上式中M是加法运算的次数 ,width是加法运算的位宽 ,Cost 是运算开销。所以对上面 6 抽头滤波器的运算 ,它的复杂度的评价指标就是: (7N + 5) 。在图像中一般像素点都是用8比特的无符号数 ,即 N = 8 ,同时要在具体的运算过程中还要考虑减法造成的符号位。52.2 H.264和AVS插值算法的复杂度分析2.2.1 H.264亮度样本插值

20、部分分析H.264/AVC标准中对亮度模块的插值采用1/2和l/4象素精度的插值,对每个分象素位置的计算,需要参考周围四个宏块的信息,具体的插值如下图所示: SggRddCAaaBbbFDGabcrhdeHIqpnijkmfgsNMccPLEccKJffQUhhTKddL 图2.1 H.264/AvC亮度模块插值参考象素 Fig 2.1 H.264 / AvC brightness module interpolation reference pixels图2.1中用大写字母标记的是整数样本位置,用小写字母标记的是l/2和l/4样本位置。1/2样本位置的预测通过6抽头滤波器F(l,-5,20,

21、20,-5,l)计算得到。6其计算过程如下:l/2样本b:首先用F对水平放行上最近的6个整数样本滤波,得到: 中间值; 最终的预测值1/2样本h:首先用F对垂直方向上最近的6个整数样本滤波,得到:中间值;最终的预测值: 1/2样本s和m的计算方法和上述相同。l/2样本j:首先用F在水平或者垂直方向对最近的6个1/2样本中间值滤波,滤波方法和b1的方法一致。得到:样本中间值或 最终的预测值。其中aa,bb,gg,s1和hh是相应位置l/2样本中间值(用F在水平方向滤波得到),cc,dd,ee,m1,和ff是相应位置l/2样本中间值(用F在垂直方向滤波得到)。采用水平方向或垂直方向滤波得到的值相同

22、。而对于1/4样本c,d,f,i,k和q来说,过邻近的整象素点和半象素点进行水平或者垂直双线性滤波获得:a=(G=b+l)1,c=(H+b+1)l,d=(G+h+l)1,n=(M+h+l)l,f=(b+j+l)l,i=(h+j+l)l,k=(j+m+l)l,q=(j+s+1)l对于剩下的1/4象素点e,g,p,r协议中采用斜对角参考象素双线性滤波: e=(b+h+l)l,g=(b+m+l)l,p=(h+s+l)l,r=(m+s+l)l。2.2.2 H.264色度样本的插值部分分析色度样本采用的是1/8样本插值,对应的运动矢量的水平分量是xFrac,垂直分量为yFrac。如果MbaffFrame

23、Flag的值为O且mbe_field_decoding_flag标志为0时,x方向和y方向分量大小不便,否则水平和垂直分量缩小为原来的一半。如图所示,A,B,C,D时被插值样本周围的整数样本值,dx和dy分别是预测样本到点A的水平和垂直分量,等于xFrac和yFrac。7预测样本的值可以由下面公式计算: (2.5)2.2.3 AVS亮度样本插值部分分析AVS的亮度样本插值分为1/2样本插值和1/4样本插值,不算自身宏块最多需要对周围4个宏块的数据进行参考,图一给出了参考图像整数样本、1/2样本和1/4样本的位置,其中用大写字母标记的为整数样本位置,用小写字母标记的为1/2和1/4样本位置。8L

24、ddKbbffAaaBhhCeeDabcrhdeEFqpnijkmfgsIHccjgggggG图2.2 整数样本、1/2样本和1/4样本的位置Fig2.2 Integer samples, 1/2 samples and 1/4 sample position1/2样本位置的预测值通过4抽头滤波器F1(-1,5,5,-l)计算得到。l/4样本位置的预测值通过4抽头滤波器F2(l,7,7,l)计算得到。1/2样本的计算过程如下:(1)1/2样本b:首先用Fl对水平方向上最近的4个整数样本滤波,得到中间值 ;最终的预测值。(2)1/2样本h:首先用F1对垂直方向上最近的4个整数样本滤波,得到中间值

25、;最终的预测值。(3)l/2样本j:首先用F1在水平或垂直方向上对最近的4个1/2样本中间值滤波,得到中间值或最终的预测值其中aa,dd和s是相应位置1/2样本中间值(用F1在水平方向滤波得到),bb,cc和m是相应位置l/2样本中间值(用F1在垂直方向滤波得到)。采用水平方向或垂直方向滤波得到的值相同。1/4样本的计算过程如下:(1)l/4样本a:首先用F2在水平方向上对ee,D, b和E四个值滤波,得到中间值;最终的预测值其中ee和b是相应位置l/2样本中间值,D和E是相应位置整数样本放大8倍的值。(2)1/4样本d:首先用F2在垂直方向上对ff,D,h和H四个值滤波,得到中间值;最终的预

26、测值其中ff和h是相应位置1/2样本中间值,D和H是相应位置整数样本放大8倍的值。l/4样本n的插值过程与d的插值过程相同。(3)1/4样本i:首先用F2在水平方向上对gg,h,j和m四个值滤波,得到中间值;最终的预测值其中gg和j是相应位置l/2中间值,h和m是相应位置1/2样本中间值放大8倍的值,1/4样本k的插值过程与i的插值过程相同。(4)l/4样本f:首先用F2在垂直方向上对hh,b,j、和s四个值滤波,得到中间值:最终的预测值其中,hh和j是相应位置l/2中间值,b和s是相应位置l/2样本中间值放大8倍的值,1/4样本q的插值过程与f的插值过程相同。(5)1/4样本e,g,p和r:

27、; ; ;其中D,E,H和I是相应位置整数样本放大64倍的值,j是相应位置1/2样本中间值。2.2.4 AVS色度样本插值部分分析色度样本插值使用与对应亮度块的运动矢量mvE(mvE的水平分量为mvE_x,垂直分量为mvE_y)对应的运动矢量mvC。mvC的水平分量为mvC_x,垂直分量为mvC_y,mvC的基本单位为1/8样本。如果chroma_format的值为01,则mvC_x的值等于mvE_x,mvC_y的值等于mvE_y;如果chroma_format的值为10,则mvC_x的值等于mvE_x,mvC_y的值等于mvE_y*2。9 色度样本插值如图所示,A,B,C,D是被插值样本周围

28、的整数样本值,dx与dy分别是预测样本与A的水平和垂直距离,dx等于mvC_x&7,dy等于mvC_y&7,这里各变量与参考样本的位置关系如图所示图2.3 各变量与参考样本的位置关系Fig2.3 The variables and the reference sample position relationship 预测样本矩阵的元素predMatrixx,y根据下式计算: (2.6) 3 BMP图像解析3.1 BMP概况BMP是一种与硬件设备无关的图像文件格式,使用非常广。BMP是Windows环境中交换与图有关的数据的一种标准,在Windows环境中运行的图形图像软件都支持BMP图像格式。

29、相对来讲,BMP格式比较简单,它只包含两个重要参数:编码格式(Encoding)和像素位数(bpp, bit-per-pixel)。24bpp称为真彩(true-color)图像,应用最为广泛。16bpp的bmp图像拥有存储空间小,解析速度快,仿真彩效果好等特点,经常出现在游戏软件中。grayscale(灰度)图像其实是8bpp的一种情况。3.2 BMP文件结构 典型的BMP图像文件由四部分组成:(1)文件头。它包含BMP图像文件的类型、内容尺寸和起始偏移量等信息。BMP的文件头共14个字节。数据部分偏移量的存在,说明图像数据部分并不一定要紧随图像参数或调色板之后放置,BMP图片的制作者其实可

30、以在调色板之后、数据部分之前填充任何内容,只要正确地设置偏移量即可。(2)图像参数。它包含图像的宽、高、压缩方法,以及颜色定义等信息。一个数据块共40字节或56字节。图像的宽和高是int型而不是uint型。因为在BMP格式中,负数的高是有意义的。为了与高搭配,因此图像的宽也定义为int型。第31-34字节存储着一个uint型参数,它代表图像数据的压缩方式。该参数的取值范围是0、1、2或3等等。这些取值的含义分别是:0 RGB方式;1 8bpp的run-length-encoding方式;2 4bpp的run-length-encoding方式;3 bit-fields方式。只有压缩方式选项被置

31、为bit-fields时,当前结构体的大小为56字节,否则为40字节。 biBitCount=1 表示位图最多有两种颜色,缺省情况下是黑色和白色,也可以自己定义这两种颜色。图像信息头装调色板中将有两个调色板项,称为索引0和索引1。图象数据阵列中的每一位表示一个象素。如果一个位是0,显示时就使用索引0的RGB值,如果位是1,则使用索引1的RGB值。biBitCount=4 表示位图最多有16种颜色。每个象素用4位表示,并用这4位作为彩色表的表项来查找该象素的颜色。biBitCount=8 表示位图最多有256种颜色。每个象素用8位表示,并用这8位作为彩色表的表项来查找该象素的颜色。biBitCo

32、unt=16 表示位图最多有216种颜色。每个色素用16位(2个字节)表示。这种格式叫作高彩色,或叫增强型16位色,或64K色。biBitCount=24 表示位图最多有224种颜色。这种位图没有调色板(bmiColors成员尺寸为0),在位数组中,每3个字节代表一个象素,分别对应于颜色R、G、B。biBitCount=32 表示位图最多有232种颜色。图象数据压缩分为以下两种: BI_RLE8:每个象素为8比特的RLE压缩编码,可使用编码方式和绝对方式中的任何一种进行压缩,这两种方式可在同一幅图中的任何地方使用。编码方式:由2个字节组成,第一个字节指定使用相同颜色的象素数目,第二个字节指定使

33、用的颜色索引。此外,这个字节对中的第一个字节可设置为0,联合使用第二个字节的值表示:第二个字节的值为0:行的结束。 第二个字节的值为1:图象结束。 第二个字节的值为2:其后的两个字节表示下一个象素从当前开始的水平和垂直位置的偏移量。 绝对方式:第一个字节设置为0,而第二个字节设置为0x030xFF之间的一个值。在这种方式中,第二个字节表示跟在这个字节后面的字节数,每个字节包含单个象素的颜色索引。压缩数据格式需要字边界(word boundary)对齐。 BI_RLE4:每个象素为4比特的RLE压缩编码,同样也可使用编码方式和绝对方式中的任何一种进行压缩,这两种方式也可在同一幅图中的任何地方使用

34、。这两种方式是:编码方式:由2个字节组成,第一个字节指定象素数目,第二个字节包含两种颜色索引,一个在高4位,另一个在低4位。第一个象素使用高4位的颜色索引,第二个使用低4位的颜色索引,第3个使用高4位的颜色索引,依此类推。绝对方式:这个字节对中的第一个字节设置为0,第二个字节包含有颜色索引数,其后续字节包含有颜色索引,颜色索引存放在该字节的高、低4位中,一个颜色索引对应一个象素。此外,BI_RLE4也同样联合使用第二个字节中的值表示:第二个字节的值为0:行的结束。 第二个字节的值为1:图象结束。 第二个字节的值为2:其后的两个字节表示下一个象素从当前开始的水平和垂直位置的偏移量。 (3)调色板

35、。可选部分,bpp较小的位图需要调色板;有些位图,比如24bpp(真彩色)图就不需要调色板。调色板是单色、16色和256色图像文件所特有的,相对应的调色板大小是2、16和256,调色板以4字节为单位,每4个字节存放一个颜色值,图像的数据是指向调色板的索引。(4)位图数据,这部分的内容因位图实际像素位数和编码格式而不同,在真彩位图中直接使用RGB真彩色值;而有调色板的位图则使用调色板中颜色索引值。紧跟在彩色表之后的是图象数据字节阵列。图象的每一扫描行由表示图象象素的连续的字节组成,每一行的字节数取决于图象的颜色数目和用象素表示的图象宽度。扫描行是由底向上存储的,这就是说,阵列中的第一个字节表示位

36、图左下角的象素,而最后一个字节表示位图右上角的象素。倒向DIB的原点在图像的左下角,而正向DIB的原点在图像的左上角。同时,每一扫描行的字节数必需是4的整倍数,也就是DWORD对齐的。4 实验结果及分析41 性能比较的方法在视频编解码算法的性能比较中 , PSNR (峰值信噪比)是目前比较通用的一种评价图像的客观标准。PSNR是一般是用于最大值信号和背景噪音之间的一个工程项目。通常在经过影像压缩之后,输出的影像通常都会有某种程度与原始影像不一样。为了衡量经过处理后的影像品质,我们通常会参考PSNR值来认定某个处理程序够不够令人满意。它是原图像与处理图像之间均方误差相对于(2n-1)2的对数值(

37、信号最大值的平方,n是每个采样值的比特数),它的单位是dB。PSNR计算公式如下: (4.1) (4.2)其中,MSE是原图像与处理图像之间均方误差。 Peak就是指8bits表示法的最大值255。MSE指MeanSquareError,I(角标n)指原始影像第n个pixel值,P(角标n)指经处理后的影像第n个pixel值。PSNR的单位为dB。所以PSNR值越大,就代表失真越少。 PSNR是最普遍,最广泛使用的评鉴画质的客观量测法,不过许多实验结果都显示,PSNR的分数无法和人眼看到的视觉品质完全一致,有可能PSNR较高者看起来反而比PSNR较低者差。这是因为人眼的视觉对于误差的敏感度并不

38、是绝对的,其感知结果会受到许多因素的影响而产生变化。 从理论上分析可知:通过插值得到的像素样本值越是接近 “真实” 像素的值 ,那么插值滤波器的性能就越好 ,它对于降低视频码率以及提高图像视觉质量的贡献也就越大。所以我们可以利用静态图像样本来评价两种标准下的插值性能。具体做法是:在一幅静态图像中 , 把坐标x和y的值都是4的倍数的像素作为整数像素采样出来 ,其它像素点舍弃。10 根据采样得到的整数像素 ,分别采用 H. 264 和 AVS标准下的方法 ,通过插值重构出所有的分数像素点 。将插值重构的像素样本与原始图像的像素进行比较 ,计算其PSNR作为重要的比较依据。计算程序用 MATLAB

39、编写完成。4.2 实验结果及分析 (a)原图 (b)缩小图 (c) H.264插值算法图 (d) AVS插值算法图图4.1 baboon性能比较结果图Fig 4.1 baboon performance comparison results figure (a)原图 (b)缩小图 (c) H.264插值算法图 (d) AVS插值算法图图4.2 barbara性能比较结果图Fig 4.2 barbara performance comparison results figure表4.1 统计数字 Tab.4.1 statistics表(a)图像H.264/AVSPSNRbaboonH.26436

40、.1759AVS35.2059 表(b)图像H.264/AVSPSNRbarbaraH.26434.3340AVS33.3889从表4.1的统计数字来看 ,发现在分数像素插值上 ,H. 264的表现略微好于AVS ,尤其是在半像素插值时以及当图像比较平滑时。这是因为在做半像素插值时 H. 264使用了比AVS更多抽头数的滤波器;同时 ,由于 H. 264的滤波器更接近于理想的低通特性 ,因而在处理平滑图像时有一定优势。但是在做四分之一像素点的插值时 ,H. 264 相对 AVS几乎没有优势 ,这是因为 H. 264 在第一步用 6 阶滤波得到半像素后 ,只是再用了一次 2 阶的平均运算便得出了

41、四分之一像素值 ,而 AVS则在前后两步都用了 4抽头的滤波器。在处理含有大量细节的图像中,两种标准的插值表现均较差,两者的性能在这种情况下分不出优劣。结 论H.264与AVS这两个协议的像素都可以划分为亮度和色度两种,因此其对比较也应该从亮度和色度进行划分。其亮度样本插值部分都可分为1/2样本插值和1/4样本插值。H. 264对1/2像素点插值时使用了一种6抽头滤波器,同时1/4像素通过对半像素点和整数点取平均的方法得到。AVS则在1/2像素插值时使用了一种 4抽头的滤波器,1/4像素插值通过在1/2像素基础上再使用另一种 4 抽头滤波器得到。H.264/AVC标准中对亮度模块的插值1/2样

42、本位置的预测通过6抽头滤波器F(l,-5,20,20,-5,l)计算得到。而对于1/4样本来说,过邻近的整象素点和半象素点进行水平或者垂直双线性滤波获得。AVS的亮度样本插值1/2样本位置的预测值通过4抽头滤波器F1(-1,5,5,-l)计算得到。l/4样本位置的预测值通过4抽头滤波器F2(l,7,7,l)计算得到。对H.264与AVS的插值算法性能比较中 ,采用目前比较通用的一种评价图像的客观标准PSNR (峰值信噪比)。它是原图像与处理图像之间均方误差相对于(2n-1)2的对数值(信号最大值的平方,n是每个采样值的比特数)。运用本文提出的算法复杂度及算法性能评价的方法评估的结果表明。H.2

43、64与AVS相比,在分数像素插值上 ,H. 264的表现略微好于AVS ,尤其是在半像素插值时以及当图像比较平滑时。由于 H. 264的滤波器更接近于理想的低通特性 ,因而在处理平滑图像时有一定优势。但是在做四分之一像素点的插值时 ,H. 264 相对 AVS几乎没有优势。在处理含有大量细节的图像中,两种标准的插值表现均较差,两者的性能在这种情况下分不出优劣。另外,对H.264和AVS性能比较时调用的BMP格式的图像做了简单的介绍,BMP是一种与硬件设备无关的图像文件格式,由四部分组成:文件头、图像参数、调色板、位图数据。本文的研究虽然取得了初步的成功,但依然任重道远,尚有许多有待进一步深入进行的研究工作。参 考 文 献1 马思伟.AVS视频编码技术回顾与应用展望.信息技术快报2005年,第 3卷,第 10期(总第 29期).2 AVS 通讯.2005 年第 5 期(总第 1

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1