码迷,mamicode.com
首页 >  
搜索关键字:文本压缩    ( 31个结果
基于 Hive 的文件格式:RCFile 简介及其应用
例如: PS:下面的代码已经测试通过,木有问题。 http://hugh-wangp.iteye.com/blog/1405804 基于HIVE文件格式的map reduce代码编写http://smallboby.iteye.com/blog/1596776 普通文本压缩成RcFile的通用类ht ...
分类:其他好文   时间:2016-12-02 11:58:13    阅读次数:273
LZW压缩算法——简明原理与实现
LZW和哈夫曼编码一样,是无损压缩中的一种。该算法通过建立字典,实现字符重用与编码,适用于source中重复率很高的文本压缩。本文首先讲下LZW的编解码原理,然后给出LZW的实现code。*********************原理*********************编码:编码0-255用来...
分类:编程语言   时间:2015-11-07 16:07:12    阅读次数:172
linux之压缩解压缩及归档工具
压缩、解压缩及归档工具1.压缩文件:XXXXXzipfilename2.解压文件Xunzipfilename.Xzip3.查看压缩文件:Xcatfilename.Xzip4.关于压缩工具工具文件扩展名描述Bzip2.bz2使用Burrows-Wheeler块排序文本压缩算法和Huffman编码Compress.z原Unix文件压缩工具,现在以你个很少使用Gz..
分类:系统相关   时间:2015-09-30 01:05:47    阅读次数:307
.tar.bz2与.tar.gz格式的文本压缩率比较
对于文本压缩,据说bzip的算法要优于gzip,从而拥有更好的压缩比。特地找了两个文件来做一下测试,以下为测试结果:(1)源文件为591MB, .tar.bz2文件为61MB(10.32%), .tar.gz文件为92MB(15.57%)(2)源文件为427MB,.tar.bz2文件为43MB(10...
分类:其他好文   时间:2015-06-25 20:50:27    阅读次数:272
LZW压缩算法
介绍 LZW算法是非常常见的一种压缩算法,他的压缩原理是对于多次重复出现的字符串,进行压缩,至于怎么压缩,在后文中会细细描述,LZW算法可以用在很多的场合,诸如图像压缩,文本压缩等等,而且算法简单易懂,并不是人们想象中的那么深奥。 算法原理 在介绍算法原理之前,得先明白几个概念: 1、Prefix,在这里代表前缀字符的意思。 2、Suffix,对应的意思是后缀字符的意思。 为什么提到这...
分类:编程语言   时间:2015-02-27 21:41:07    阅读次数:272
HTTP协议实现服务器浏览器代码文本压缩
HTTP协议实现服务器浏览器代码文本压缩 一般我们在对网站进行优化是,一定会用到的一个就是文本代码压缩,我们压缩的一般都是文本格式文件,因为压缩效果明显,若果对视频等进行压缩,效果不大,并且耗费服务器和客户端的CPU来进行压缩和解压,得不偿失。废话多多说,我们上网是,使用浏览器F12来进行代码调试抓...
分类:Web程序   时间:2015-02-05 13:09:50    阅读次数:195
电子书格式探秘
1. epub格式我们非常熟悉,就是pk公司的压缩软件压制而成,所以可以用:右键-->打开方式-->压缩软件(很多种内核应该都差不多),开放使用,但核心是顶级机密的。我们不用也分析不了。 2.   mobi格式的(仅就英文文本和未加密的文档而言)相对比较压缩比较简单,有时我们看一眼也能猜到是什么内容,mobi的文本压缩大致如下:         a. 英文:开始时一定是完整的单词(因为前面什么...
分类:其他好文   时间:2014-12-07 06:32:39    阅读次数:173
基于Huffman编码的压缩软件的Python实现
哈夫曼编码是利?用贪?心算法进?行?文本压缩的算法,其算法思想是?首先统计?文件中各字符出现的次数, 保存到数组中,然后将各字符按照次数升序排序,挑选次数最?小的两个元素进?行连结形成?子树,?子 树的次数等于两节点的次数之和,接着把两个元素从数组删除,将?子树放?入数组,重新排序,重复 以上步骤。为了解压,在压缩时?首先往?文件中填?入huffman编码的映射表的?长度,该表的序列化字符串,编码...
分类:编程语言   时间:2014-11-21 23:21:08    阅读次数:444
linux压缩数据
linux文件压缩工具工具文件扩展名描述bzip2.bz2使用burrows-wheeler块排序文本压缩算法compress.Z原UNIX文件压缩工具gzip.gzGNU项目压缩工具zip.zipUnix版本的windowsPKZIP程序1.bzip2工具bzip用于压缩文件bzcat用于显示已压缩文本文件内容bunzip2用于解压.bz2文件bzip2recover..
分类:系统相关   时间:2014-11-06 15:05:55    阅读次数:236
LZW 文本压缩及解压
LZW就是通过建立一个字符串表,用较短的代码来表示较长的字符串来实现压缩。 压缩算法如下 #include #include std::ifstream fin; std::ofstream fout; using namespace std; const int D = 4096, alpha = 256, ByteSize = 8, HalfByte = 4, Al...
分类:其他好文   时间:2014-09-15 12:58:58    阅读次数:278
31条   上一页 1 2 3 4 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!