有关LZF算法的相关解析文档比较少,但是Apple对LZF的开源,可以让我们对该算法进行一个简单的解析。LZFSE基于Lempel-Ziv,并使用了有限状态熵编码。LZF采用类似lz77和lzss的混合编码。使用3种“起始标记”来代表每段输出的数据串。接下来看一下开源的LZF算法的实现源码。1.定义..
分类:
移动开发 时间:
2016-10-26 07:33:16
阅读次数:
214
有关LZF算法的相关解析文档比较少,但是Apple对LZF的开源,可以让我们对该算法进行一个简单的解析。LZFSE 基于 Lempel-Ziv ,并使用了有限状态熵编码。LZF采用类似lz77和lzss的混合编码。使用3种“起始标记”来代表每段输出的数据串。 接下来看一下开源的LZF算法的实现源码。 ...
分类:
移动开发 时间:
2016-10-26 07:09:06
阅读次数:
329
C4.5是另一个分类决策树算法,是基于ID3算法的改进,改进点如下: 1、分离信息 解释:数据集通过条件属性A的分离信息,其实和ID3中的熵; 2、信息增益率 解释:Gain(A)为获的A的信息增益,C4.5中选择具有最大增益率的属性作为分裂属性; 3、C4.5中所采用的悲观剪枝法 解释:数据的内容 ...
分类:
编程语言 时间:
2016-10-21 10:18:40
阅读次数:
124
1 指数格伦布熵编码算法原理 1.1 无符号整数k阶指数格伦布算法编码过程: 1) 将数字以二进制形式写出,去掉最低的k个比特位,之后加1 2) 计算留下的比特数,将此数减一,即是需要增加的前导零个数 3) 将第一步中去掉的最低k个比特位补回比特串尾部 例子(1阶指数格伦布算法编码整数9): 第1步 ...
分类:
编程语言 时间:
2016-10-17 11:30:10
阅读次数:
197
ID3算法(Iterative Dichotomiser 3 迭代二叉树3代),是一个由Ross Quinlan发明的用于决策树的算法;简单理论是越是小型的决策树越优于大的决策树。 算法归纳: 1、使用所有没有使用的属性并计算与之相关的样本熵值; 2、选取其中熵值最小的属性 3、生成包含该属性的节点 ...
分类:
编程语言 时间:
2016-10-13 09:28:25
阅读次数:
213
0. 概述:
Logistic回归是统计学中的经典分类方法,最大熵是概率模型学习的一个准则,将其推广到分类问题得到最大熵模型,
logistic回归模型与最大熵模型都是对数线性模型。
本文第一...
分类:
其他好文 时间:
2016-10-12 11:43:03
阅读次数:
254
什么是决策树?为什么要用决策树?决策树是一种二分树,或是多分数。对于大量数据的细分工作有很大帮助。在日常生活中,决策树的算法可谓是每天都在用。小到用户分类,大到辅助决策。实际上他的使用很多。至于为什么要用到决策树,个人认为就是因为这种算法简单。代码实现起来..
分类:
编程语言 时间:
2016-10-09 20:55:38
阅读次数:
197
初学神经网络算法--梯度下降、反向传播、优化(交叉熵代价函数、L2规范化) 柔性最大值(softmax)还未领会其要义,之后再说 有点懒,暂时不想把算法重新总结,先贴一个之前做过的反向传播的总结ppt 其实python更好实现些,不过我想好好学matlab,就用matlab写了 然后是算法源码,第一 ...
分类:
其他好文 时间:
2016-10-01 19:32:36
阅读次数:
279
再看《MATLAB数据分析与挖掘实战》,简单总结下今天看到的经典的决策树算法——ID3. ID3:在决策树的各级节点上,使用信息增益的方法作为属性的选择标准,来帮助确定生成每个节点时所应采取的合适属性。 关于信息增益,知乎上这个回答也讲的很不错。信息增益=熵 - 条件熵,信息增益越大,说明该条件对事 ...
分类:
其他好文 时间:
2016-09-18 01:07:31
阅读次数:
231
1 计算熵我们检查的属性是是否出去玩。用Excel对上面数据的play变量的各个取值排个序(这个工作簿里把“play”这个词去掉),一共是14条记录,你能数出取值为yes的记录有9个,取值为no的有5个,我们说这个样本里有9个正例,5 个负例,记为S(9+,5-),S是样本的意思(Sample)。这 ...
分类:
其他好文 时间:
2016-09-17 12:09:33
阅读次数:
128