码迷,mamicode.com
首页 >  
搜索关键字:熵    ( 678个结果
排序算法时间复杂度的下界
《算法导论》中有一节讲的是“(比较)排序算法时间的下界”,本文将论述同一个问题,思路略有差异。本文将从信息熵的角度论述排序算法时间复杂度的下界。若本文论述过程中有错误或是不足,还请各位指正。1. 问题归约 排序,涉及到被排序的序列和排序的方法。(比较)排序算法时间的下界对被排序的序列和排序方法做了以...
分类:编程语言   时间:2015-12-22 19:32:03    阅读次数:219
Logistic Regression 的前世今生(理论篇)
Logistic Regression可以说是机器学习的入门算法。不过,你真的有把握能够把LR从头到脚讲一遍吗?你会现场建模,数学推导?你知道它的正则化的作用?你能讲清楚它跟MaxEnt最大熵模型的关系吗?ok,你说这些你都会?那你知道并它的行化怎么做吗?有几种并行化的方式呢?啥?!你说你还会?大神,请受我一拜!...
分类:其他好文   时间:2015-12-19 18:04:09    阅读次数:3033
机器学习实践笔记3(树和随机森林)
的优点是,在一个决策树的形式数据是easy理解。和kNN最大的缺点是数据的内在含义,不能给予。1:这个概念很简单文字说明 决策树的类型有非常多。有CART、ID3和C4.5等。当中CART是基于基尼不纯度(Gini)的。这里不做具体解释,而ID3和C4.5都是基于信息熵的,它们两个得到的结果都是一样...
分类:其他好文   时间:2015-12-14 16:18:08    阅读次数:204
图像处理的一些方法
Atam教授:核希尔伯特空间( 再生Hilbert空间),蒙塔卡罗方法,KNN,多维线性回归,PSF方法回归,特征之间的非线性关系,deep learning,香农信息熵,回归贝叶斯,稀疏字典构造Jayaram:模糊连通性原理,稀疏分解,非负矩阵分解,svd分解图分割,adaboost,自适应稀疏模...
分类:其他好文   时间:2015-12-07 16:00:02    阅读次数:273
3 决策树(一)
3.1 决策树的构造3.1.1 信息增益熵(entropy)是信息的期望值。如果待分类的事物可能划分在多个分类中,则符号xi的信息定义为:,p(xi)为该分类的概率。为了计算熵,需计算所有类别所有可能包含的信息期望值:,n是分类的数目。3.1.2 划分数据集分类算法需要:上述的测量信息熵、划分数据集...
分类:其他好文   时间:2015-12-06 22:47:31    阅读次数:316
文本特征词提取算法
在文本分类中,需要先对文本分词,原始的文本中可能由几十万个中文词条组成,维度非常高。另外,为了提高文本分类的准确性和效率,一般先剔除决策意义不大的词语,这就是特征词提取的目的。本文将简单介绍几种文本特征词提取算法。信息增益(IG)对于一个系统,其信息熵为\(H(S)=-\sum_{i}^{C}P_i...
分类:编程语言   时间:2015-12-04 06:27:53    阅读次数:214
mapreduce导出MSSQL的数据到HDFS
今天想通过一些数据,来测试一下我的《基于信息熵的无字典分词算法》这篇文章的正确性。就写了一下MapReduce程序从MSSQLSERVER2008数据库里取数据分析。程序发布到hadoop机器上运行报SQLEXCEPTION错误 奇怪了,我的SQL语句中没有LIMIT,这LIMIT哪来的。我翻...
分类:数据库   时间:2015-12-04 01:01:56    阅读次数:284
基于信息熵的无字典分词算法
这几天在研究如何用统计方法来发现新词,扩充自己的词典。看到了几篇很有想法的文章,作者阐述了一下思路。文章里面的数据,我计算了一下,发现文有很多数据不够严谨,最主要的问题,并没有给出很详细的理论方面的说明。结合作者的思路,我进行了如下数学模型的构建和算法的实现。一、概念介绍1、词语分片设一个文档集.....
分类:编程语言   时间:2015-12-03 00:15:40    阅读次数:463
HEVC算法和体系结构:预测编码之帧间预测
预测编码之帧间预测(Inter-Picture Prediction)           帧间预测是指利用视频时间域相关性,使用临近已编码图像像素预测当前图像的像素,以达到有效去除视频时域冗余的目的。由于视频序列通常包括较强的时域相关性,因此预测残差值接近于0,将残差信号作为后续模块的输入进行变换、量化、扫描及熵编码,可实现对视频信号的高效压缩。   一、帧间预测编码原理      ...
分类:编程语言   时间:2015-11-26 15:25:39    阅读次数:555
HEVC算法和体系结构:预测编码之帧内预测
预测编码之帧内预测(Intra-Picture Prediction)         预测编码(Prediction Coding)是视频编码的核心技术之一,指利用已编码的一个或几个样本值,根据某种模型或方法,对当前的样本值进行预测,并对样本真实值和预测值之间的差值进行编码。视频编码器对预测后的残差而不是原始像素值进行变换、量化、熵编码,由此大幅度提高编码效率。       ...
分类:编程语言   时间:2015-11-24 21:17:00    阅读次数:463
678条   上一页 1 ... 48 49 50 51 52 ... 68 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!