沙湖王 | 用Scipy实现K-means聚类算法用Scipy实现K-means聚类算法
分类:
其他好文 时间:
2014-06-11 21:55:28
阅读次数:
527
沙湖王 | 用Scipy实现K-means聚类算法用Scipy实现K-means聚类算法
分类:
其他好文 时间:
2014-06-11 21:52:09
阅读次数:
292
在数据挖掘中,K-Means是一种用来计算数据聚集的算法。具体来说,K-Means要解决的问题如下图所示
凭肉眼可以看出,大致可以分为4个点群。但是怎么通过计算机找出这几个点群呢?这就是K-Means要解决的问题。
普通的K-Means算法的步骤如下
(1)随机在图中取K个种子点
(2)对图中的每个点求到这K个点的距离,假设点距离种子点最近,那么属于点群...
分类:
其他好文 时间:
2014-06-05 07:39:11
阅读次数:
733
最近论文实验进行的非常的不顺利,一方面是实验聚类的效果十分的差,另一方面是做大数据的实验对计算机的性能要求很高,非常的耗费内存,每当矩阵的维度大于3000的时候,整个计算机就像中了魔法似的,像蜗牛一样慢。这样用小数据做实验效果非常的差,用大数据做实验计算机又跑不动,搞的自己很愚昧,不知道是自己数据集的问题,还是聚类算法的问题。...
分类:
其他好文 时间:
2014-06-03 05:54:21
阅读次数:
263
K-means是一种聚类算法,其要求用户设定聚类个数k作为输入参数,因此,在运行此算法前,需要估计需要的簇的个数。
假设有n个点,需要聚到k个簇中。K-means算法首先从包含k个中心点的初始集合开始,即随机初始化簇的中心。随后,算法进行多次迭代处理并调整中心位置,知道达到最大迭代次数或中性收敛于固定点。
k-means聚类实例。选择三个随机点用作聚类中心(左上),map阶段(右上)将...
分类:
其他好文 时间:
2014-05-25 21:11:25
阅读次数:
275
在数据分析和数据挖掘的过程中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如K最近邻(KNN)和K均值(K-Means)。当然衡量个体差异的方法有很多,最近查阅了相关的资料,这里整理罗列下。
为了方便下面的解释和举例,先设定我们要比较X个体和Y个体间的差异,它们都包含了N个维的特征,即X=(x1, x2, x3, ...
分类:
其他好文 时间:
2014-05-25 07:01:04
阅读次数:
317
最近在网上查看用MapReduce实现的Kmeans算法,例子是不错,http://blog.csdn.net/jshayzf/article/details/22739063但注释太少了,而且参数太多,如果新手学习的话不太好理解。所以自己按照个人的理解写了一个简单的例子并添加了详细的注释。大致的步...
分类:
其他好文 时间:
2014-05-24 10:41:01
阅读次数:
315
摘要: 对心电信号( ECG)
这种高维的时间序列进行聚类,最重要的方面之一即进行特征提取!本研究提出利用自回归和移动平均( ARMA)模型拟合?ZK
信号,以拟合系数的欧氏距离为结构不相似测度征进行聚类!但此方法没有考虑样本数据的各维特征对聚类的不同贡献率,所以本文提出可以把首次聚类每维特征在聚类...
分类:
其他好文 时间:
2014-05-23 05:45:57
阅读次数:
196
第一部分:
学习Mahout必须要知道的资料查找技能:
学会查官方帮助文档:
解压用于安装文件(mahout-distribution-0.6.tar.gz),找到如下位置,我将该文件解压到win7的G盘mahout文件夹下,路径如下所示:
G:\mahout\mahout-distribution-0.6\docs
学会查源代码的注释文档:
方案一:用ma...
分类:
其他好文 时间:
2014-05-22 10:37:07
阅读次数:
388
转自:http://blog.csdn.net/abcjennifer/article/details/8198352在聚类算法K-Means,
K-Medoids, GMM, Spectral clustering,Ncut一文中我们给出了GMM算法的基本模型与似然函数,在EM算法原理中对EM算法...
分类:
其他好文 时间:
2014-05-19 14:15:47
阅读次数:
384