Kmeans聚类算法1 Kmeans聚类算法的基本原理 K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。假设要把样本集分...
分类:
编程语言 时间:
2015-08-27 00:02:53
阅读次数:
408
1.聚类分析1.0 概念聚类分析简称聚类(clustering),是一个把数据集划分成子集的过程,每一个子集是一个簇(cluster),使得簇中的样本彼此相似,但与其他簇中的样本不相似。聚类分析不需要事先知道样本的类别,甚至不用知道类别个数,因此它是一种无监督的学习算法,一般用于数据探索,比如群组发现和离群点检测,还可以作为其他算法的预处理步骤。下面的动图展示的是一个聚类过程,感受一下:1.1 基本...
分类:
编程语言 时间:
2015-08-20 21:01:33
阅读次数:
1993
这次作业的coding任务量比较大,总的来说需要实现neural network, knn, kmeans三种模型。Q11~Q14为Neural Network的题目,我用单线程实现的,运行的时间比较长,因此把这几道题的正确答案记录如下:Q11: 6Q12: 0.001Q13: 0.01Q14: 0...
分类:
其他好文 时间:
2015-08-17 21:14:57
阅读次数:
274
Kmeans算法的Java实现,源码放在github上,大家有兴趣可以下下来看看, 源码地址:
https://github.com/l294265421/algorithm-kmeans
实现该算法主要阅读的书籍是:
《Web数据挖掘》第二版,作者:Bing Liu,译者:俞勇...
分类:
编程语言 时间:
2015-08-14 22:46:54
阅读次数:
202
0 K-means算法简介K-means是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。算法过程如下:1)从N个文档随机选取K个文档作为质...
分类:
编程语言 时间:
2015-07-28 12:38:26
阅读次数:
271
《Aggregating local descriptors into a compact image representation》论文笔记提取到VLAD特征后,要先用PCA降维,然后再用ADC方法对每一幅图像建立索引,这里先介绍ADC方法。ADC方法是对图片库中,除query vector x之外的所有图的vector Y=y1,y2...ynY={y_1,y_2...y_n},做kmeans产...
分类:
其他好文 时间:
2015-07-25 12:23:20
阅读次数:
173
k均值(kmeans)聚类是一种最为简单的聚类方法,直接根据数据点之间的距离(欧氏距离,几何距离等等)来划分数据是属于哪一类的,当所有数据点所属的类别不在变化的时候,聚类也就完成了。详细原理可索引下面一个博客:聚类分析笔记-K均值matlab算法(一)关于kmeans再谈几点认识:
重要的一点:聚类数目的问题。有的聚类、分类问题已经限制好了要聚类成几类,也就是聚类数目一定,那么这种聚类通常简单些,直...
分类:
编程语言 时间:
2015-07-24 14:29:21
阅读次数:
324
优点:原理简单(靠近中心点),实现容易(1、2 天),聚类效果中上(依赖K的选择)缺点:1. 无法确定K的个数 (根据什么指标确定K)2. 对离群点敏感 (容易导致中心点偏移)3. 算法复杂度不易控制 O(NKm), 迭代次数可能较多 (m可能会比较大)4. 局部最优解而不是全局优 (这个和初始点选...
分类:
编程语言 时间:
2015-07-23 13:43:56
阅读次数:
168
当初始簇心选择不好的时候聚类的效果会很差。所以后来又有一个人提出了二分k均值(bisectingkmeans),其核心思路是:将初始的一个簇一分为二计算出误差平方和最大的那个簇,对他进行再一次的二分。直至切分的簇的个数为k个停止。 其实质就是不断的对选中的簇做k=2的kmeans切分。...
分类:
编程语言 时间:
2015-07-17 18:52:49
阅读次数:
147
算法采用数据集为iris(鸢尾花)可以在UCI上下载 http://archive.ics.uci.edu/ml/datasets/Iris数据集介绍:1. sepal length in cm2. sepal width in cm3. petal length in cm4. petal wid...
分类:
编程语言 时间:
2015-07-14 20:03:17
阅读次数:
132