实时搜索: rar和zip哪个压缩更小

rar和zip哪个压缩更小

552条评论 6292人喜欢 6585次阅读 899人点赞
如题 ...

RAR和ZIP压缩格式的区别: 第一个区别:WinZip 只有英文版+汉化包的,而且安装程序体积较大
WinRAR 则有官方的简体中文版,安装程序体积较小(还不到 1MB)
第二个区别:WinZip 支持的压缩包格式虽然很多,但都已经过时了,而且也没有新的特性
WinRAR 支持的压缩包格式也不少,但都是现在最流行的,支持的格式也在增加
第三个区别:WinZip 压缩文件只能压缩成 ZIP 格式,而且压缩率较低,速度较慢
WinRAR 却兼容 Zip 格式,而且有其他的扩展压缩方法,提高了压缩率

综上所述:由于第一个原因,我就不愿意用 WinZip,看到第二个原因, 我就想放弃 WinZip 了,知道了第三个原因,就有足够的理由让我放弃 WinZip 了,支持 WinRAR !!!

压缩格式.zip和.rar的区别是?它们都是有损压缩吗?何为有损压缩?: 不要与音频压缩混为一坛,它们都是无文件损失压缩的,不然的话解压了少的文件程序就无法使用了,rar相对zip功能更为强大,往后将全面替代zip

zip文件和rar文件的优缺点是什么?拜托各位了 3Q: ZIP的历史比RAR长久.但是压缩方面比较小. RAR的 压缩率 比ZIP要大很多.所以 现在网 上大多数的 压缩文件 是用RAR格式的. 区别一、zip的安装比较大,并仅仅有英文版+汉化包 rar有官方的简体中文版,并且安装很小,不足一兆 区别二、winrar的压缩率较高,而zip的压缩率更低 区别三、zip支持的格式很多,但已经较老,不大流行 rar支持格式也很多,并且还是流行的 区别四、zip仅仅能够压缩成 zip格式 ,不能解压rar格式;rar不仅有自己的格式,还可以压缩成zip格式并解压zip格式 区别五、zip的界面没有rar漂亮 区别六、winrar支持 分卷压缩 ,zip不支持 区别七、国外很多都采用zip,因为它是免费的,rar不是免费的,在国内很流行是由于有盗版的存在;zip不能兼容rar,是因为这样必须付出一笔费用; 定义~ ZIP,一个强大并且易用的压缩实用程序, 支持 ZIP、CAB、TAR、GZIP、MIME, 以及更多格式的压缩文件. 其特点是紧密地与 Windows 资源管理器 拖放集成, 不用留开资源管理器而进行压缩 / 解压缩 . 包括 WinZip 向导 和 WinZip 自解压缩器个人版本. WINRAR是现在最好的压缩工具,界面友好,使用方便,在压缩率和速度方面都有很好的表现。其压缩率比之WINZIP之流要高,3.x采用了更先进的 压缩算法 ,是现在压缩率较大、压缩速度较快的格式之一。新增无需解压就可以在压缩文件内查找文件和字符串、 压缩文件格式转换功能 。RAR的优点是压缩率大,速度快当设置成最快压缩方式的时候,压缩包比.ZIP小,而速度却与PKZIP不相上下.更可支持非RAR压缩文件。可将大型文件分割成数块磁片方便携带,且 压缩比 比winzip还强大在众多的压缩类软件对比中,WinRAR总能以压缩比取胜。 优缺点~ WinRAR给使用者以简约/灵活的感觉:小巧的体积、优秀的压缩比率、兼容几乎所有压缩文件格式、强大的 档案管理 功能、出色的安全性等等,可产生自动解压缩文件,支持鼠标右键快选功能、支持Zip文件。 尽管在 文件压缩 率方面非常出色,但这似乎是以牺牲速度为代价的,WinRAR在压缩某些文件时需要的时间几乎是其它 压缩软件 的1倍或更多

怎样压缩文件才能把压缩大小压的更小???:

  想把文件压缩得更小,一般有以下两种方法:


  1、在压缩软件里设定为最大压缩比。

  如winrar软件,压缩的时候,调整一下压缩方案,压缩方式,选最好。

  


  2、换用压缩比更高的压缩软件。

  zip不如rar高,rar不如7z高。目前通用压缩软件里,压缩效果最好的是7z。因此,如果想把文件压得更小,建议用7Z来压缩。

WinRAR和WinZIP有什么区别?: 数十年前,数据压缩算法都掌握在少数厂商手中,而有一位伟大的黑客(名字我记不清了,缩写是PK,典型的早年黑客,技术天才,后来因酗酒过度,英年早逝)为了让广大用户用上压缩技术,他自己开发出一套压缩算法,也就是ZIP的早期算法。用来对抗互头的垄断。事实证明:ZIP优于其它算法!更重要的是ZIP是完全免费的!!于是ZIP就成了电脑用户的主流压缩软件。而到了Windows时代,WinZip Conputing,Inc第一个开发出图形界面的ZIP工具WinZip,虽然那时的WinZip还只是给命令行的ZIP增加了一个图形界面的外壳。但用户却真正体验到了图形界面的方便,于是WinZip就这样成长起来。
因此:使用[color=red]ZIP格式[/color]是完全免费的(WinZip不免费),而使用RAR格式是要交专利费的。因此,WinZip没有理由需要对RAR提供支持。

还有人可能会说:WinRAR的压缩率比WinZip高。这个问题,让我先做个实验再说:将一个47,061,000字节的MPG文件分别用Winzip9和WinRAR3.3压缩成ZIP和RAR格式(都采用标准压缩)。(我的CPU是超到140*8的Celeron2)
压缩成ZIP:用时25秒,得到的文件45,014,390 字节
压缩成RAR:用时105秒,得到的文件44,740,808 字节
两者的压缩包仅差273,582字节而用时却差了4倍以上!可以看出,WinRAR是通过牺牲压缩效率来增强压缩比的!
于是,我又尝试了WinZip的增强压缩,
ZIP增强压缩:用时39秒,得到的文件44,858,018 字节!这个成绩应该是相当优秀的了!
WinZip在压缩比与压缩效率之间取得了完美的平恒!比WinRAR只注重压缩比更优秀!
现在硬盘越来越便宜,大家不会为了节省几兆空间而浪费数倍的时间吧?

大家应该清楚谁才是最优秀的压缩工具了吧!在此建议大家:自己制作压缩包时用尽量使用ZIP格式,少用RAR。节省你宝贵的时间吧!
winzip在现有压缩文件里再添加文件比WINRAR更快。追求速度选WINZIP,追求功能选WINRAR

问rar与zip压缩文件的区别?:

RAR是一种专利文件格式,用于数据压缩与归档打包。

ZIP是指一种高储存密度的磁盘驱动器与磁盘。ZIP磁盘驱动器跟普通软驱类似,可读取传统3.5软盘片,一片ZIP磁盘的容量约100MB,200MB等多种,大小则和传统3.5软盘片差不多,但是其存取速度稍逊于ZIP,而且略厚一点。

同样是无损数据压缩,RAR文件通常比ZIP文件压缩比要高,但是压缩速度较慢。因为RAR文件头也要占据一定空间,在数据压缩余地不大时,压缩过的文件可能比原文件要大。RAR的一个主要优点是可以把文件压缩目标分割到多个文件,并且很容易从这样的分割的压缩文件解压出源文件。

怎样将多个文件夹压缩成文件包呢,要尽可能小的那种压缩方法: 7-ZIP 压缩率最高,速度也是最慢的,别的都一般,试试。
如果你是RAR,选择压缩方式为储存

zip 的压缩原理与实现: 1. 原理部分:
  有两种形式的重复存在于计算机数据中,zip 就是对这两种重复进行了压缩。
  一种是短语形式的重复,即三个字节以上的重复,对于这种重复,zip用两个数字:1.重复位置距当前压缩位置的距离;2.重复的长度,来表示这个重复,假设这两个数字各占一个字节,于是数据便得到了压缩,这很容易理解。
  一个字节有 0 - 255 共 256 种可能的取值,三个字节有 256 * 256 * 256 共一千六百多万种可能的情况,更长的短语取值的可能情况以指数方式增长,出现重复的概率似乎极低,实则不然,各种类型的数据都有出现重复的倾向,一篇论文中,为数不多的术语倾向于重复出现;一篇小说,人名和地名会重复出现;一张上下渐变的背景图片,水平方向上的像素会重复出现;程序的源文件中,语法关键字会重复出现(我们写程序时,多少次前后copy、paste?),以几十 K 为单位的非压缩格式的数据中,倾向于大量出现短语式的重复。经过上面提到的方式进行压缩后,短语式重复的倾向被完全破坏,所以在压缩的结果上进行第二次短语式压缩一般是没有效果的。
  第二种重复为单字节的重复,一个字节只有256种可能的取值,所以这种重复是必然的。其中,某些字节出现次数可能较多,另一些则较少,在统计上有分布不均匀的倾向,这是容易理解的,比如一个 ASCII 文本文件中,某些符号可能很少用到,而字母和数字则使用较多,各字母的使用频率也是不一样的,据说字母 e 的使用概率最高;许多图片呈现深色调或浅色调,深色(或浅色)的像素使用较多(这里顺便提一下:png 图片格式是一种无损压缩,其核心算法就是 zip 算法,它和 zip 格式的文件的主要区别在于:作为一种图片格式,它在文件头处存放了图片的大小、使用的颜色数等信息);上面提到的短语式压缩的结果也有这种倾向:重复倾向于出现在离当前压缩位置较近的地方,重复长度倾向于比较短(20字节以内)。这样,就有了压缩的可能:给 256 种字节取值重新编码,使出现较多的字节使用较短的编码,出现较少的字节使用较长的编码,这样一来,变短的字节相对于变长的字节更多,文件的总长度就会减少,并且,字节使用比例越不均匀,压缩比例就越大。
  在进一步讨论编码的要求以及办法前,先提一下:编码式压缩必须在短语式压缩之后进行,因为编码式压缩后,原先八位二进制值的字节就被破坏了,这样文件中短语式重复的倾向也会被破坏(除非先进行解码)。另外,短语式压缩后的结果:那些剩下的未被匹配的单、双字节和得到匹配的距离、长度值仍然具有取值分布不均匀性,因此,两种压缩方式的顺序不能变。
  在编码式压缩后,以连续的八位作为一个字节,原先未压缩文件中所具有的字节取值不均匀的倾向被彻底破坏,成为随机性取值,根据统计学知识,随机性取值具有均匀性的倾向(比如抛硬币试验,抛一千次,正反面朝上的次数都接近于 500 次)。因此,编码式压缩后的结果无法再进行编码式压缩。
  短语式压缩和编码式压缩是目前计算机科学界研究出的仅有的两种无损压缩方法,它们都无法重复进行,所以,压缩文件无法再次压缩(实际上,能反复进行的压缩算法是不可想象的,因为最终会压缩到 0 字节)。
  短语式重复的倾向和字节取值分布不均匀的倾向是可以压缩的基础,两种压缩的顺序不能互换的原因也说了,下面我们来看编码式压缩的要求及方法:
首先,为了使用不定长的编码表示单个字符,编码必须符合?前缀编码?的要求,即较短的编码决不能是较长编码的前缀,反过来说就是,任何一个字符的编码,都不是由另一个字符的编码加上若干位 0 或 1 组成,否则解压缩程序将无法解码。
看一下前缀编码的一个最简单的例子:
符号 编码
A 0
B 10
C 110
D 1110
E 11110
有了上面的码表,你一定可以轻松地从下面这串二进制流中分辨出真正的信息内容了:
1110010101110110111100010 - DABBDCEAAB
要构造符合这一要求的二进制编码体系,二叉树是最理想的选择。考察下面这棵二叉树:
        根(root)
       0  |   1
       +-------+--------+
    0  | 1   0  |  1
    +-----+------+ +----+----+
    |     | |     |
    a      | d     e
     0  |  1
     +-----+-----+
     |     |
     b     c要编码的字符总是出现在树叶上,假定从根向树叶行走的过程中,左转为0,右转为1,则一个字符的编码就是从根走到该字符所在树叶的路径。正因为字符只能出现在树叶上,任何一个字符的路径都不会是另一字符路径的前缀路径,符合要求的前缀编码也就构造成功了:
a - 00 b - 010 c - 011 d - 10 e - 11接下来来看编码式压缩的过程:
为了简化问题,假定一个文件中只出现了 a,b,c,d ,e四种字符,它们的出现次数分别是
a : 6次
b : 15次
c : 2次
d : 9次
e : 1次
如果用定长的编码方式为这四种字符编码: a : 000 b : 001 c : 010 d : 011 e : 100
那么整个文件的长度是 3*6 + 3*15 + 3*2 + 3*9 + 3*1 = 99
用二叉树表示这四种编码(其中叶子节点上的数字是其使用次数,非叶子节点上的数字是其左右孩子使用次数之和):
          根
           |
      +---------33---------+
      |        |
   +----32---+     +----1---+
   |    |     |    |
+-21-+   +-11-+    +--1--+  
|   |   |   |    |   |
6  15  2  9    1   
(如果某个节点只有一个子节点,可以去掉这个子节点。)
         根
         |
        +------33------+
       |     |
    +-----32----+     1
    |      |
  +--21--+  +--11--+
  |   |  |   |
  6   15 2    9
现在的编码是: a : 000 b : 001 c : 010 d : 011 e : 1 仍然符合?前缀编码?的要求。
第一步:如果发现下层节点的数字大于上层节点的数字,就交换它们的位置,并重新计算非叶子节点的值。
先交换11和1,由于11个字节缩短了一位,1个字节增长了一位,总文件缩短了10位。
           根
            |
       +----------33---------+
       |        |
   +-----22----+     +----11----+
   |      |     |     |
+--21--+    1      2     9
|     |
6   15
再交换15和1、6和2,最终得到这样的树:
           根
            |
       +----------33---------+
       |        |
     +-----18----+    +----15----+
    |      |    |     |
  +--3--+    15   6     9
  |   |
  2   1
这时所有上层节点的数值都大于下层节点的数值,似乎无法再进一步压缩了。但是我们把每一层的最小的两个节点结合起来,常会发现仍有压缩余地。
第二步:把每一层的最小的两个节点结合起来,重新计算相关节点的值。在上面的树中,第一、二、四三层都只有一或二个节点,无法重新组合,但第三层上有四个节点,我们把最小的3和6结合起来,并重新计算相关节点的值,成为下面这棵树。
           根
            |
       +----------33---------+
       |         |
    +------9-----+    +----24----+
    |      |    |     |
   +--3--+    6   15    9
   |   |
  2  1
然后,再重复做第一步。
这时第二层的9小于第三层的15,于是可以互换,有9个字节增长了一位,15个字节缩短了一位,文件总长度又缩短了6位。然后重新计算相关节点的值。
           根
            |
       +----------33---------+
       |        |
       15     +----18----+ 
            |    |
         +------9-----+   9
         |      |
         +--3--+   6
         |   |
         2  1
这时发现所有的上层节点都大于下层节点,每一层上最小的两个节点被并在了一起,也不可能再产生比同层其他节点更小的父节点了。这时整个文件的长度是 3*6 + 1*15 + 4*2 + 2*9 + 4*1 = 63这时可以看出编码式压缩的一个基本前提:各节点之间的值要相差比较悬殊,以使某两个节点的和小于同层或下层的另一个节点,这样,交换节点才有利益。
所以归根结底,原始文件中的字节使用频率必须相差较大,否则将没有两个节点的频率之和小于同层或下层其他节点的频率,也就无法压缩。反之,相差得越悬殊,两个节点的频率之和比同层或下层节点的频率小得越多,交换节点之后的利益也越大。在这个例子中,经过上面两步不断重复,得到了最优的二叉树,但不能保证在所有情况下,都能通过这两步的重复得到最优二叉树,下面来看另一个例子:
                         根
                         |
              +---------19--------+
              |                   |
      +------12------+            7
      |              |
  +---5---+      +---7---+
  |       |      |       |
+-2-+   +-3-+  +-3-+   +-4-+
|   |   |   |  |   |   |   |
1   1   1   2  1   2   2   2
这个例子中,所有上层节点都大于等于下层节点,每一层最小的两个节点结合在了一起,但仍然可以进一步优化:                         根
                         |
              +---------19--------+
              |                   |
      +------12------+            7
      |              |
  +---4---+      +---8---+
  |       |      |       |
+-2-+   +-2-+  +-4-+   +-4-+
|   |   |   |  |   |   |   |
1   1   1   1  2   2   2   2
通过最低一层的第4第5个节点对换,第3层的8大于第2层的7。
到这里,我们得出这样一个结论:一棵最优二叉编码树(所有上层节点都无法和下层节点交换),必须符合这样两个条件:
1.所有上层节点都大于等于下层节点。
2.某节点,设其较大的子节点为m,较小的子节点为n,m下的任一层的所有节点都应大于等于n下的该层的所有节点。当符合这两个条件时,任一层都无法产生更小的节点去和下层节点交换,也无法产生更大的节点去和上层节点交换。上面的两个例子是比较简单的,实际的文件中,一个字节有256种可能的取值,所以二叉树的叶子节点多达256个,需要不断的调整树形,最终的树形可能非常复杂,有一种非常精巧的算法可以快速地建起一棵最优二叉树,这种算法由D.Huffman(戴·霍夫曼)提出,下面我们先来介绍霍夫曼算法的步骤,然后再来证明通过这么简单的步骤得出的树形确实是一棵最优二叉树。
霍夫曼算法的步骤是这样的:·从各个节点中找出最小的两个节点,给它们建一个父节点,值为这两个节点之和。
·然后从节点序列中去除这两个节点,加入它们的父节点到序列中。重复上面两个步骤,直到节点序列中只剩下唯一一个节点。这时一棵最优二叉树就已经建成了,它的根就是剩下的这个节点。仍以上面的例子来看霍夫曼树的建立过程。
最初的节点序列是这样的:
a(6)  b(15)  c(2)  d(9)  e(1)
把最小的c和e结合起来
                   | (3)
a(6)   b(15)   d(9)   +------+------+
              |      |
              c     e不断重复,最终得到的树是这样的:
       根
        |
   +-----33-----+
   |     |
   15   +----18----+   
       |       |
       9  +------9-----+
          |       |
         6     +--3--+
              |   |
              2  1
这时各个字符的编码长度和前面我们说过的方法得到的编码长度是相同的,因而文件的总长度也是相同的: 3*6 + 1*15 + 4*2 + 2*9 + 4*1 = 63考察霍夫曼树的建立过程中的每一步的节点序列的变化:
6  15 2 9 1
6  15 9 3
15 9  9
15 18
33
下面我们用逆推法来证明对于各种不同的节点序列,用霍夫曼算法建立起来的树总是一棵最优二叉树:
对霍夫曼树的建立过程运用逆推法:
当这个过程中的节点序列只有两个节点时(比如前例中的15和18),肯定是一棵最优二叉树,一个编码为0,另一个编码为1,无法再进一步优化。
然后往前步进,节点序列中不断地减少一个节点,增加两个节点,在步进过程中将始终保持是一棵最优二叉树,这是因为:
1.按照霍夫曼树的建立过程,新增的两个节点是当前节点序列中最小的两个,其他的任何两个节点的父节点都大于(或等于)这两个节点的父节点,只要前一步是最优二叉树,其他的任何两个节点的父节点就一定都处在它们的父节点的上层或同层,所以这两个节点一定处在当前二叉树的最低一层。
2.这两个新增的节点是最小的,所以无法和其他上层节点对换。符合我们前面说的最优二叉树的第一个条件。
3.只要前一步是最优二叉树,由于这两个新增的节点是最小的,即使同层有其他节点,也无法和同层其他节点重新结合,产生比它们的父节点更小的上层节点来和同层的其他节点对换。它们的父节点小于其他节点的父节点,它们又小于其他所有节点,只要前一步符合最优二叉树的第二个条件,到这一步仍将符合。这样一步步逆推下去,在这个过程中霍夫曼树每一步都始终保持着是一棵最优二叉树。由于每一步都从节点序列中删除两个节点,新增一个节点,霍夫曼树的建立过程共需 (原始节点数 - 1) 步,所以霍夫曼算法不失为一种精巧的编码式压缩算法。
附:对于 huffman 树,《计算机程序设计艺术》中有完全不同的证明,大意是这样的:
1.二叉编码树的内部节点(非叶子节点)数等于外部节点(叶子节点)数减1。
2.二叉编码树的外部节点的加权路径长度(值乘以路径长度)之和,等于所有内部节点值之和。(这两条都可以通过对节点数运用数学归纳法来证明,留给大家做练习。)
3.对 huffman 树的建立过程运用逆推,当只有一个内部节点时,肯定是一棵最优二叉树。
4.往前步进,新增两个最小的外部节点,它们结合在一起产生一个新的内部节点,当且仅当原先的内部节点集合是极小化的,加入这个新的内部节点后仍是极小化的。(因为最小的两个节点结合在一起,并处于最低层,相对于它们分别和其他同层或上层节点结合在一起,至少不会增加加权路径长度。)
5.随着内部节点数逐个增加,内部节点集合总维持极小化。
2.实现部分
  如果世界上从没有一个压缩程序,我们看了前面的压缩原理,将有信心一定能作出一个可以压缩大多数格式、内容的数据的程序,当我们着手要做这样一个程序的时候,会发现有很多的难题需要我们去一个个解决,下面将逐个描述这些难题,并详细分析 zip 算法是如何解决这些难题的,其中很多问题带有普遍意义,比如查找匹配,比如数组排序等等,这些都是说不尽的话题,让我们深入其中,做一番思考。
我们前面说过,对于短语式重复,我们用?重复距当前位置的距离?和?重复的长度?这两个数字来表示这一段重复,以实现压缩,现在问题来了,一个字节能表示的数字大小为 0 -255,然而重复出现的位置和重复的长度都可能超过 255,事实上,二进制数的位数确定下来后,所能表示的数字大小的范围是有限的,n位的二进制数能表示的最大值是2的n次方减1,如果位数取得太大,对于大量的短匹配,可能不但起不到压缩作用,反而增大了最终的结果。针对这种情况,有两种不同的算法来解决这个问题,它们是两种不同的思路。一种称为 lz77 算法,这是一种很自然的思路:限制这两个数字的大小,以取得折衷的压缩效果。例如距离取15 位,长度取 8 位,这样,距离的最大取值为 32 k - 1,长度的最大取值为 255,这两个数字占 23 位,比三个字节少一位,是符合压缩的要求的。让我们在头脑中想象一下 lz77 算法压缩进行时的情况,会出现有意思的模型:
   最远匹配位置->          当前处理位置->
───┸─────────────────╂─────────────>压缩进行方向
   已压缩部分             ┃    未压缩部分
  在最远匹配位置和当前处理位置之间是可以用来查找匹配的?字典?区域,随着压缩的进行,?字典?区域从待压缩文件的头部不断地向后滑动,直到达到文件的尾部,短语式压缩也就结束了。
  解压缩也非常简单:
         ┎────────拷贝────────┒
 匹配位置    ┃          当前处理位置  ┃
   ┃<──匹配长度──>┃       ┠─────?────┨
───┸──────────┸───────╂──────────┸─>解压进行方向
   已解压部分              ┃    未解压部分
  不断地从压缩文件中读出匹配位置值和匹配长度值,把已解压部分的匹配内容拷贝到解压文件尾部,遇到压缩文件中那些压缩时未能得到匹配,而是直接保存的单、双字节,解压时只要依次直接拷贝到文件尾部即可,直到整个压缩文件处理完毕。
  lz77算法模型也被称为?滑动字典?模型或?滑动窗口?模型,由于它限制匹配的最大长度,对于某些存在大量的极长匹配的文件来说,这种折衷算法显出了缺陷。另有一种lzw算法对待压缩文件中存在大量极长匹配的情况进行了完全不同的算法设计,并且只用一个数字来表示一段短语,下面来描述一下lzw的压缩解压过程,然后来综合比较两者的适用情况。
  lzw的压缩过程:
1) 初始化一个指定大小的字典,把 256 种字节取值加入字典。
2) 在待压缩文件的当前处理位置寻找在字典中出现的最长匹配,输出该匹配在字典中的序号。
3) 如果字典没有达到最大容量,把该匹配加上它在待压缩文件中的下一个字节加入字典。
4) 把当前处理位置移到该匹配后。
5) 重复 2、3、4 直到文件输出完毕。
  lzw 的解压过程:
1) 初始化一个指定大小的字典,把 256 种字节取值加入字典。
2) 从压缩文件中顺序读出一个字典序号,根据该序号,把字典中相应的数据拷贝到解压文件尾部。
3) 如果字典没有达到最大容量,把前一个匹配内容加上当前匹配的第一个字节加入字典。
4) 重复 2、3 两步直到压缩文件处理完毕。
  从 lzw 的压缩过程,我们可以归纳出它不同于 lz77 算法的一些主要特点:
1) 对于一段短语,它只输出一个数字,即字典中的序号。(这个数字的位数决定了字典的最大容量,当它的位数取得太大时,比如 24 位以上,对于短匹配占多数的情况,压缩率可能很低。取得太小时,比如 8 位,字典的容量受到限制。所以同样需要取舍。)
2) 对于一个短语,比如 abcd ,当它在待压缩文件中第一次出现时,ab 被加入字典,第二次出现时,abc 被加入字典,第三次出现时,abcd 才会被加入字典,对于一些长匹配,它必须高频率地出现,并且字典有较大的容量,才会被最终完整地加入字典。相应地,lz77 只要匹配在?字典区域?中存在,马上就可以直接使用。
3) 一个长匹配被加入字典的过程,是从两个字节开始,逐次增长一个字节,确定了字典的最大容量,也就间接确定了匹配的可能的最大长度。相对于 lz77 用两个数字来表示一个短语,lzw 只用一个数字来表示一个短语,因此,?字典序号?的位数可以取得多一点(二进制数多一位,意味着数值大一倍),也就是说最长匹配可以比 lz77 更长,当某些超长匹配高频率地出现,直到被完整地加入字典后,lzw将开始弥补初期的低效,逐渐显出自己的优势。
  可以看出,在多数情况下,lz77 拥有更高的压缩率,而在待压缩文件中占绝大多数的是些超长匹配,并且相同的超长匹配高频率地反复出现时,lzw 更具优势,GIF 就是采用了 lzw 算法来压缩背景单一、图形简单的图片。zip 是用来压缩通用文件的,这就是它采用对大多数文件有更高压缩率的 lz77 算法的原因。  

  • mve面膜哪个国家

    这周是知识产权日,哪些平台有商标专利方面的活动优惠: 我们是快法务,一站式法律服务平台,这周我们有“知识变现大作战”活动,截止到5月2号,扫码领红包,最高可达1180元。 ...

    906条评论 2887人喜欢 1064次阅读 367人点赞
  • 175哪个门派好

    知识产权的最新报道: 2015年4月16日,国务院新闻办公室今日举行新闻发布会,介绍2014年中国知识产权发展状况。国家知识产权局局长申长雨表示,2014年知识产权数量持续快速增长,共受理发明专利、实用新型和外观设计申请236.1万件,其...

    922条评论 2961人喜欢 1797次阅读 461人点赞
  • m16a4和m416哪个好

    ip知识产权近两年的发展特色: ip知识产权近两年的发展特色:知识产权数量持续快速增长2015年4月16日,国务院新闻办公室今日举行新闻发布会,介绍2014年中国知识产权发展状况。国家知识产权局局长申长雨表示,2014年知识产权数量持续快速增长,共...

    905条评论 2556人喜欢 1703次阅读 292人点赞
  • pp助手为什么导入失败

    魅族mle 和魅族E是一样的吗: 不一样;2015年10月21日魅族发布新品魅蓝metal!!多彩金属机身的千元机,配备了8核旗舰级处理器,双卡双4G,5.5寸高清2.5D弧面屏,500 万像素前置+1300万像素相位对焦,更支持指纹识别功能,具备一...

    200条评论 4230人喜欢 2557次阅读 876人点赞