关于LZW算法的改进研究.doc

上传人:土8路 文档编号:9952848 上传时间:2021-04-06 格式:DOC 页数:3 大小:18.50KB
返回 下载 相关 举报
关于LZW算法的改进研究.doc_第1页
第1页 / 共3页
关于LZW算法的改进研究.doc_第2页
第2页 / 共3页
关于LZW算法的改进研究.doc_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《关于LZW算法的改进研究.doc》由会员分享,可在线阅读,更多相关《关于LZW算法的改进研究.doc(3页珍藏版)》请在三一文库上搜索。

1、关于LZW算法的改进研究文章来源 毕业论文网 【摘要】 在分析LZW算法的基础上,对LZW算法的缺陷进行了探讨。并对LZW算法进行了改进,大幅度减少了编码的长度,降低了匹配长度取值变化的影响,完全兼容LZW算法,在平均压缩率方面有较大的提高,而且对改进的算法进行了分析论证。 【关键词】  数据压缩   LZW算法   缓冲区        LZW算法的实质是无损压缩技术1-3,LZW算法通过对输入流进行分析,自适应地生成一个包含输入流中不重复子串的串表,将每一子串映射为一独

2、立的码字输出。这样,它就充分利用了相邻输入之间的相关性,可以取得超过信源一阶熵的编码效率。然而,受缓存容量、计算复杂度和计算速度等因素的限制,串表的长度受到一定限制,且一般信源所具有的局部平稳性随缓存容量加大,编码效率提高不大。即:它自身固有一定的缺陷与不足,难以满足人们的需要,对它进行改进一直成为人们的研究目标之一4-6。为了解决这一问题,本文对LZW算法进行了改进,命名为LZWC编码算法。它兼有LZW算法的优点,还具有自身的优越性。首先对LZW算法进行一些必要的介绍和分析。         1. LZW算法  

3、       LZW算法1由韦尔奇(T.A.Welch)于1984年通过对LZ算法的改进。开发出的一种更优算法。它是一种基于字典的编码方法。并且它是LZ系列码中应用最广,变形最多的一种算法。LZW压缩有3个重要的对象:数据流、编码流和编译表。在编码时,数据流是输入对象,编码流就是输出对象;在解码时,编码流则是输入对象,数据流是输出对象;而编译表是在编码和解码时都需要借助的对象。          1.1LZW算法的编码原理   &nbs

4、p;     LZW算法的编码原理为:对消息序列xn=x1x2x3…xn从左到右进行阅读,并以此进行LZW编码:          (1)对x1显然是第一次出现,它的前面也没有字符,那么他的编号是1,它的码元为(1,0, x1)。          (2)对于x2它可能有两种情况发生,即x1=x2或x1≠x2。对此,有      

5、;   如果x1=x2,那么对于x2不作编码,而对x3的编码位点取2,连接位点则为1,这表示对x3作第二次编码,它与第一次编码的x1相连接。          如果x1≠x2,那么x2的编码位点取为2,连接位点则为0,这表示对x2作第二次编码,它的前面没有出现过相同的字符。          (3)依照上述步骤递推,如果对向量xn=x1x2x3…xn,n<m,我们已经得到它的编码:C=(i,

6、li, xji),i=1,2, …, k .         对上式的C满足的条件:对每一个i有且只有一对(i,li),使li<i<ji成立。那么C构成一LZW树。由树的构造可知,对每个点i,它的枝li是唯一的。因此,树C的全部枝为li,i=0,1,…,k 确定,而且每个li与xn中的子向量xαi对应。          (4)如向量xn中的编码C及相应的树确定,那么我们就可读xn+1,xn+2

7、,…, xn+k,并对它们继续进行编码,如果有一个ik使xαi=(xn+1,xn+2,…, xn+k)成立,而且对任何ik都有:xαi≠( xn+1,xn+2,…, xn+k,xn+k+1)成立。那么:         不对字符xn+1,xn+2,…, xn+k进行编码。         对xn+k+1作它的编码为(K+1,i, xn+k+1)。   

8、      以此类推,就可以完成对xn的编码C。         2.2 LZW算法的原理         LZW算法通过编码表来组织输人字符串,并把它们转换成一定长度的编码。LZW算法有一个重要的特性称作前缀性,即如果一个字符串在编码表上,那它的前缀串也在编码表上。例如:A、B为两个不同的字符串,AB组成一新的字符串,A为B的前缀串,如果B在编码表中,则一定在编码表中。    

9、;     LZW通过编码表识别源输人字符序列,通过向编码表中增加新的字符串,从而识别更多、更长的字符序列。但由于前缀性的约束,这种识别一般每次只在原来的基础上增加一个字符,依次进行。同时,由于编码算法没有很强的分析功能,使它不知道哪些字符序列将来出现的概率较大,所以它具有一定的盲目性。例如,有一个长度为n的字符序列,LZW编码表要完全识别它,则至少需要该序列部分或全部重复出现n次。但是,当一个较长的字符串重复出现两次,我们就能够容易识别它,而且这样的字符串再次出现的概率是非常大的。基于这样一种认识,本文在LZW算法的基础上,构造了一种新的编码算法,我们

10、把新算法称为LZWC编码算法,一般情况下它对数据的压缩率比LZW算法有大幅度提高。新算法在最差的情况下可退化成标准的LZW算法。下面对LZWC算法的原理进行详细的介绍。         2  LZWC算法         LZWC算法的基本原理是针对源输人数据中不同特点的数据序列,采用不同的编码器分别编码。数据序列的分类则是根据它的特点,通过对原始数据序列的分析来完成。       &n

11、bsp; LZWC算法共有两个编码器,它们是:         (1) 重复编码器(RepeatCorder),简称RC。         (2) LZW编码器。         RC对输入流中重复的数据进行编码,剩下的数据由则由LZW编码器进行编码。RC编码器和LZW编码器的编码通过LZW编码器的编码表统一起来。       

12、  2.1  LZWC算法的编码及原理         LZWC的算法过程如下:         对消息序列xn=x1x2x3…xn从左到右进行阅读,并以此进行LZWC编码:         (1) 输入流中的数据x1,x2,…,xn依次经过前缓冲区。         (4) 假如还有数据进入缓冲区,则转1),继续此过程。         (5) 否则,结束编码过程。 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1