K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。matlab中有kmeans聚类算法的函数可以调用,如[ldx,C,su...
分类:
编程语言 时间:
2015-01-31 21:46:31
阅读次数:
290
昨天终于hadoop的项目验收完成了,终于可以松一口气了,总体还是比较满意的。
首先说一下项目流程,用mapreduce对数据进行预处理,然后用mahout中的聚类算法(kmeans)对数据进行处理,最后用peoplerank对数据进行处理。
根据老师交给我们的数据,包括Google+和Twitter的部分社交网络数据。以下是两个数据下载的链接
http://snap.stanford.ed...
分类:
其他好文 时间:
2015-01-27 18:24:46
阅读次数:
237
#include
#include
using namespace std;
using namespace cv;
int main(int argc, char** argv)
{
#define MAX_CLUSTERS 5
CvScalar color_table[MAX_CLUSTERS];
IplImage* img = cvCreateImage...
分类:
编程语言 时间:
2015-01-23 20:10:44
阅读次数:
253
Kmeans算法是一种极为常见的聚类算法。其算法过程大意如下:(1)通过问题分析,确定所要聚类的类别数k;(一般是难以直接确定,可以使用交叉验证法等方法,逐步进行确定。)(2)根据问题类型,确定计算数据间相似性的计算方法;(3)从数据集中随机选择k个数据作为聚类中心;(4)利用相似度计算公式,计算每...
分类:
其他好文 时间:
2015-01-22 11:00:54
阅读次数:
244
聚类是一种无监督的学习,它将相似的对象归到同一个簇中。它有点像全自动分类(类别体系是自动构建的)。聚类方法几乎可以应用于所有对象,簇内的对象越相似,聚类的效果越好。本文要介绍一种称为K-均值(K-means)聚类的算法。之所以称之为K-均值是因为它可以发现k个不同的簇,且每个簇的中心采用簇中所含值的均值计算而成。...
分类:
编程语言 时间:
2015-01-08 17:58:36
阅读次数:
324
package com.pachira.d;import java.util.ArrayList;import java.util.HashMap;import java.util.LinkedHashMap;import java.util.List;public class Kmeans { ....
分类:
编程语言 时间:
2014-12-14 01:56:48
阅读次数:
298
k-means:基于划分算法的典型、实现比较简单。特点是只能聚球形、受离群点的影响很大。
采用python实现:用二维矩阵来存点集和质心点、每次循环分两步:计算质心和重新分配点,循环直到最小平方误差SSE收敛为止,或者指定一个最大的迭代次数。
关于画图,我使用的是pylab和Matplotlib,Matplotlib中的很多函数和matlab用法一样,比较方便作图,安装它时花了很长的时间来解决...
分类:
其他好文 时间:
2014-12-03 15:43:56
阅读次数:
230
1. Scala集合学习:http://blog.csdn.net/lyrebing/article/details/203622272.scala实现kmeans算法http://www.thinksaas.cn/group/topic/93852/3. Spark之Scala学习网站http:/...
分类:
其他好文 时间:
2014-11-23 23:09:07
阅读次数:
280
目前,SPARK在大数据处理领域十分流行。尤其是对于大规模数据集上的机器学习算法,SPARK更具有优势。一下初步介绍SPARK在linux中的部署与使用,以及其中聚类算法的实现。...
分类:
编程语言 时间:
2014-11-12 21:21:04
阅读次数:
264
最近看到Andrew Ng的一篇论文,文中用到了Kmeans和DL结合的思想,突然发现自己对ML最基本的聚类算法都不清楚,于是着重的看了下Kmeans,并在网上找了程序跑了下。kmeans是unsupervised learning最基本的一个聚类算法,我们可以用它来学习无标签的特征,其基本思想如....
分类:
其他好文 时间:
2014-11-04 10:36:13
阅读次数:
269