写mapreduce程序实现kmeans算法。我们的想法可能是1.次迭代后的质心2. map里。计算每一个质心与样本之间的距离,得到与样本距离最短的质心,以这个质心作为key,样本作为value,输出3. reduce里,输入的key是质心,value是其它的样本,这时又一次计算聚类中心,将聚类中心...
分类:
编程语言 时间:
2015-07-11 13:33:25
阅读次数:
866
上一篇博客写了k-means聚类算法和改进的k-means算法,这篇博客就贴出对应的MATLAB和C++代码。以下是MATLAB代码,实现用k-means进行分割: %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
功能:实现如何利用Kmeans聚类实现图像的分割;
时间:2015-07
%%%%%%%%%%%%%%%%%%%%%...
分类:
编程语言 时间:
2015-07-06 14:16:53
阅读次数:
315
MATLAB基础知识l Imread: 读取图片信息;l axis:轴缩放:axis([xmin xmax ymin ymax zmin zmax cmin cmax])设置x、y和z轴范围以及颜色缩放范围(请参阅caxis)。v =axis返回包含x、y和z轴缩放因子的行矢量。v具有 4 或 6 ...
分类:
其他好文 时间:
2015-07-05 22:27:46
阅读次数:
321
利用模拟退火提高Kmeans的聚类精度Kmeans算法是一种非监督聚类算法,由于原理简单而在业界被广泛使用,一般在实践中遇到聚类问题往往会优先使用Kmeans尝试一把看看结果。本人在工作中对Kmeans有过多次实践,进行过用户行为聚类(MapReduce版本)、图像聚类(MPI版本)等。然而在实践中...
分类:
其他好文 时间:
2015-06-30 21:35:45
阅读次数:
151
http://www.cnblogs.com/LBSer/p/4605904.html Kmeans算法是一种非监督聚类算法,由于原理简单而在业界被广泛使用,一般在实践中遇到聚类问题往往会优先使用Kmeans尝试一把看看结果。本人在工作中对Kmeans有过多次实践,进行过用户行为聚类(MapR...
分类:
其他好文 时间:
2015-06-28 18:48:53
阅读次数:
178
1 Kmeans算法原理K-MEANS算法: 输入:聚类个数k,以及包含 n个数据对象的数据。输出:满足方差最小标准的k个聚类。 处理流程: (1)从 n个数据对象选择 k 个对象作为初始聚类中心; (2)循环(3)到(4)直到每个聚类不再发生变化为止 (3)根据每个聚类对象的均值...
分类:
其他好文 时间:
2015-06-28 14:14:23
阅读次数:
464
聚类算法,无监督学习的范畴,没有明确的类别信息。 给定n个训练样本{x1,x2,x3,...,xn} kmeans算法过程描述如下所示:1.创建k个点作为起始质心点,c1,c2,...,ck2.重复以下过程直到收敛 遍历所有样本xi 遍历所有质心cj 记录质心与...
分类:
其他好文 时间:
2015-06-19 18:35:39
阅读次数:
187
之前在用Hadoop写ML算法的时候就隐约感觉Hadoop实在是不适合ML这些比较复杂的算法。记得当时写完kmeans后,发现每个job完成后都需要将结果放在HDFS中,然后下次迭代的时候再从文件中读取,对于kmeans这种高迭代的算法,感觉Hadoop的瓶颈会出现在IO上,后来又写了个Naiveb...
分类:
其他好文 时间:
2015-06-18 19:03:50
阅读次数:
143
提出混合模型主要是为了能更好地近似一些较复杂的样本分布,通过不断增加component个数,可以任意地逼近任何连续的概率分布,所以我们认为任何样本分布都可以用混合模型来建模。因为高斯函数具有一些很实用的性质,所以高斯混合模型被广泛地使用。
GMM与kmeans类似,也是属于clustering,不同的是,kmeans是把每个样本点聚到其中一个cluster,而GMM是给出这些样本点到每个c...
分类:
编程语言 时间:
2015-06-12 01:02:10
阅读次数:
330
Kmeans是机器学习中最经典的无监督学习聚类算法,本文复习了无监督学习定义和Kmeans算法,然后提出了一种基于Kmeans算法的图像压缩方案,并给出了其在Matlab中的实现...
分类:
编程语言 时间:
2015-06-08 10:00:03
阅读次数:
3182