引文: k均值算法是一种聚类算法,所谓聚类,他是一种无监督学习,将相似的对象归到同一个蔟中。蔟内的对象越相似,聚类的效果越好。聚类和分类最大的不同在于,分类的目标事先已知,而聚类则不一样。因为其产生的结果和分类相同,而只是类别没有预先定义。算法的目的: 使各个样本与所在类均值的误差平方和达到最小(这也是评价K-means算法最后聚类效果的评价标准)K-均值聚类
优点:容易实现
缺点:可能收敛到局部最...
分类:
编程语言 时间:
2015-06-03 15:55:40
阅读次数:
139
一 汇总数据 数据太多则很难一口气看完、看懂,除非先进行汇总,否则无法彻底领悟数据的意义。 先从数据分解成基本数据块着手,有了这些数据块,就能观察平均值或其他有用的汇总统计值。二 用Excel制作直方图 工具/加载宏/分析工具库---便将数据分析加载到工具中。 直方图的X轴一般表示某种数据的...
分类:
其他好文 时间:
2015-06-02 21:45:17
阅读次数:
113
题目传送门 1 /* 2 最小生成树(Kruskal):以权值为头,带入两个端点,自然的排序;感觉结构体的并查集很好看 3 注意:题目老头要的是两个农田的高度差,中文水平不好,题意理解成和平均值的高度差! 4 */ 5 #include 6 #include 7 #include...
分类:
其他好文 时间:
2015-06-01 18:19:34
阅读次数:
133
一、标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。实现时,有两种不同的方式:使用sklearn.preproc...
分类:
其他好文 时间:
2015-06-01 13:11:52
阅读次数:
153
Matlab中的randperm和randsample函数用法对比转载:http://blog.sina.com.cn/s/blog_a4034b280101k4gg.html构建替代数据的时候,一种常见的思路是打乱原数据的排列次序,通过随机置换原数据的排列次序从而产生和原数据系列统计特征(如均值、...
分类:
其他好文 时间:
2015-05-31 15:11:48
阅读次数:
192
算法如下:1.猜测一个要求数字的平方根2.用原数/猜测数字3.用计算步骤2的值与猜测数字的平均值4.步骤3得到的值为新的猜测值5.判断新的猜测值和原猜测值是否相同,相同则跳转至步骤2,不同则该猜测值为原数平方根#在计算机中相同与不同,参考浮点数相同方法python源码如下:impo..
分类:
编程语言 时间:
2015-05-30 18:29:11
阅读次数:
286
摘录自:OSCHINAMegan_zhouhttp://my.oschina.net/megan/blog/133918这个太简单, 没什么好说的,直接上例子:NSArray *testArray = [NSArray arrayWithObjects:@"2.0", @"2.3", @"3.0",...
分类:
移动开发 时间:
2015-05-30 13:26:34
阅读次数:
255
题意:给出多个double数,去掉其最小的和最大的,再对余下的求均值。思路:再输入时将最大和最小去掉,顺便统计非最值的和,输出时除一下个数即可。 1 #include 2 using namespace std; 3 4 int main() 5 { 6 //freopen("input...
分类:
其他好文 时间:
2015-05-29 17:49:20
阅读次数:
125
K均值算法可以分两步实现,一个是function [d] = dist(x,y) 其中x和y分别代表一个向量;另外一个是function [y,C] = Kmeans( D,k ) 其中y为聚类中心分类集合,C为聚类中心集,D为目标矩阵(即为待分类的矩阵),k为聚类中心个数。...
分类:
编程语言 时间:
2015-05-28 23:14:11
阅读次数:
165
向量的表示及协方差矩阵http://blog.csdn.net/songzitea/article/details/18219237PCA的数学原理http://blog.codinglabs.org/articles/pca-tutorial.html1、将X的每一行(代表一个属性字段)进行零均值...
分类:
其他好文 时间:
2015-05-27 12:05:36
阅读次数:
262