码迷,mamicode.com
首页 >  
搜索关键字:kmeans    ( 313个结果
数据挖掘十大算法总结--核心思想,算法优缺点,应用领域
参考了许多资料加上个人理解,对十大算法进行如下分类: ?分类算法:C4.5,CART,Adaboost,NaiveBayes,KNN,SVM ?聚类算法:KMeans ?统计学习:EM ?关联分析:Apriori ?链接挖掘:PageRank...
分类:编程语言   时间:2014-11-03 11:32:18    阅读次数:241
Canopy算法计算聚类的簇数
Kmeans算是是聚类中的经典算法,过程如下: 选择K个点作为初始质心 repeat 将每个点指派到最近的质心,形成K个簇 重新计算每个簇的质心 until 簇不发生变化或达到最大迭代次数 算法中的K需要人为的指定。确定K的做法有很多,比如多次进行试探,计算误差,得出最好的K。这样需要比较长的时间。我们可以根据Canopy算法来粗略确定K值(可以认为相等)。看一下Canopy算法的...
分类:编程语言   时间:2014-11-02 18:20:44    阅读次数:312
Mahout分步式程序开发 聚类Kmeans
阅读导读: 1.什么是聚类分析? 2.Mahout中的kmeans算法,默认的分融符是什么? 3.用kmeans算法得到的结果有什么特点? 1. 聚类算法kmeans   聚类分析是数据挖掘及机器学习领域内的重点问题之一,在数据挖掘、模式识别、决策支持、机器学习及图像分割等领域有广泛的应用,是最重要的数据分析方法之一。聚类是在给定的数据集合中寻找同类的数据子集合,每一...
分类:其他好文   时间:2014-10-29 00:25:22    阅读次数:359
Mahout分步式程序开发 基于物品的协同过滤ItemCF
阅读导读: 1.简述用Mahout实现协同过滤ItemCF的步骤? 2.如何用API实现Hadoop的各种HDFS命令? 3.Kmeans.java类报错,暂时可以怎么处理? 1. Mahout开发环境介绍   在用Maven构建Mahout项目文章中,我们已经配置好了基于Maven的Mahout的开发环境,我们将继续完成Mahout的分步式的程序开发。   本文的...
分类:其他好文   时间:2014-10-26 14:23:16    阅读次数:297
Spark MLBase分布式机器学习系统入门:以MLlib实现Kmeans聚类算法
1.什么是MLBaseMLBase是Spark生态圈的一部分,专注于机器学习,包含三个组件:MLlib、MLI、ML Optimizer。ML Optimizer: This layer aims to automating the task of ML pipeline construction....
分类:编程语言   时间:2014-10-19 18:30:41    阅读次数:336
聚类学习笔记——kmeans
kmeans是数据挖掘领域最为常用的聚类方法之一,最初起源于信号处理领域。它的目标是划分整个样本空间为若干个子空间,每个子空间中的样本点距离该空间中心点平均距离最小。因此,kmeans是划分聚类的一种。方法简单易懂,也很有说服力。但,不幸的是,这是一个NP-hard问题。首先来看一下NP问题。NP即...
分类:其他好文   时间:2014-10-13 23:20:57    阅读次数:1672
R:Kmeans
例如要把一组数据分成两个簇: > dataset = matrix(c(1,2, + 1.2,2, + 8,9, + 0.9,1.8, + 7,10, + 8.8,9.2), nrow=6, byrow=T) > dataset [,1] [,2] [1,] 1.0 2.0 [2,] 1.2 2.0 [3,] 8.0 9.0 [4,] 0....
分类:其他好文   时间:2014-10-05 12:29:28    阅读次数:221
Clustering of residential areas based on residential conditions
This paper provides an overview and some conclusions from the HOUSING datasets disposed by the classical algorithms Kmeans and Hierarchical clustering. The total process of the project is divided into five parts including data preprocessing, selecting the ...
分类:其他好文   时间:2014-10-03 13:14:24    阅读次数:141
Weka算法Clusterers-Xmeans源码分析
Weka算法Clusterers-Xmeans源码分析...
分类:其他好文   时间:2014-10-01 01:33:50    阅读次数:357
聚类算法总结
最近要在spark上做一个聚类的项目,数据规模和类的数目都比较大。因此总结了一下常见的聚类算法。最终选择mini-batch kmeans,并使用kmeans++来初始化类中心。这样算法的执行速度比较快,而且效果相对靠谱。...
分类:其他好文   时间:2014-09-13 00:51:24    阅读次数:420
313条   上一页 1 ... 28 29 30 31 32 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!