码迷,mamicode.com
首页 >  
搜索关键字:高斯分布 混合高斯分布 聚类 gmm    ( 2168个结果
R语言与数据分析之四:聚类算法2
今天继续和小伙伴们分享聚类算法和R语言的实现,上篇和大家分享了聚类中的距离、类间距离和最古典的层次聚类法,今天和大家分享几个动态聚类算法。 首先和大家分享被评为十大数据挖掘算法之一的K-means 算法(K为分类的个数,mean为平均值,该算法的难点即为K的指点) Step1:选择K个点作为初始质心; Step2:将剩余每个点指派到最近的质心,形成K个簇(聚类); Step3:重新计算簇的...
分类:编程语言   时间:2014-12-12 11:47:35    阅读次数:277
空间数据挖掘常用方法
问题1:空间数据挖掘有哪些常用方法,举例说明一种方法的原理及应用. 答:空间数据挖掘的常用方法有:统计法,聚类方法,关联规则发掘方法,Rough集方法,神经网络方法,云理论,证据理论,模糊集理论,遗传算法等算法(出自丁信宙,仇环,苏晓庆. 基于云理论的缺损数据推理和预测 山东理工大学学报 2006年11月)。除此以外还有老师课件上提到的聚类检测,决策树方法等。        以下对于一...
分类:其他好文   时间:2014-12-11 00:24:07    阅读次数:265
R语言与数据分析之四:聚类算法1
前面和大家分享的分类算法属于有监督学习的分类算法,今天继续和小伙伴们分享无监督学习分类算法---聚类算法。聚类算法也因此更具有大数据挖掘的味道 聚类算法本质上是基于几何距离远近为标准的算法,最适合数据是球形的问题,首先罗列下常用的距离: 绝对值距离(又称棋盘距离或城市街区距离) Euclide距离(欧几里德距离,通用距离) Minkowski 距离(闵可夫斯基距离),欧...
分类:编程语言   时间:2014-12-10 18:12:05    阅读次数:280
Mahout进阶课程|Mahout视频教程
Mahout进阶课程,网盘下载:链接:http://pan.baidu.com/s/1dDGPM4x密码:pqdk网盘失效的话,请加QQ:3113533060课程大纲:第一周Mahout概述Mahout安装Mahout安装测试Mahout算法库介绍解析聚类算法解析分类算法协同过滤算法第二周聚类算法详解一、canopy算法简介1)mahout中canop..
分类:其他好文   时间:2014-12-09 15:49:26    阅读次数:665
如何选择K-Means中K的值
K-Means需要设定一个簇心个数的参数,现实中,最常用于确定K数的方法,其实还是人手工设定。例如,当我们决定将衣服做成几个码的时候,其实就是在以人的衣服的长和宽为为特征进行聚类。所以,弄清楚我们更在意的是什么,能够引导选择更合适的K值。 有种方法能自动决定K值,也就是所谓的Elbow Met...
分类:其他好文   时间:2014-12-07 17:36:36    阅读次数:375
安装Numpy和matplotlib
最近由于毕业设计的需要开始学习使用Python的Numpy和matplotlib来做聚类算法和可视化的一些研究。就从Numpy和matplotlib的安装开始吧。
分类:其他好文   时间:2014-12-07 14:55:36    阅读次数:174
mahout入门指南之mahout单机版推荐算法
mahout入门指南之mahout单机版推荐算法   鄙人最近在研究mahout,网上找了一些入门资料来看,发现都整理的比较乱。折腾了一番,终于搞清楚了。为了让新手们较快入门,决定总结分享一下,写此入门指南。   mahout是什么? mahout是一个机器学习库,里面实现了一些算法,比如推荐算法,聚类算法。 实现方式有单机内存版,也有分布式(hadoop和spark)。...
分类:编程语言   时间:2014-12-06 15:26:15    阅读次数:368
Clustering by density peaks and distance
这次介绍的是Alex和Alessandro于2014年发表在的Science上的一篇关于聚类的文章[13],该文章的基本思想很简单,但是其聚类效果却兼具了谱聚类(Spectral Clustering)[11,14,15]和K-Means的特点,着实激起了我的极大的兴趣,该聚类算法主要是基于两个基本...
分类:其他好文   时间:2014-12-04 21:30:15    阅读次数:281
理解谱聚类
前面介绍过K-means聚类方法,这个方法简单易懂,主要在于如何定义距离计算公式(一般使用欧氏距离),如何选择K值,这两个问题。这次我们介绍谱聚类,它是K-means的升级版。我们计划从这样几个方面介绍谱聚类:K-measn聚类有什么缺点?谱聚类的基本思想,以及谱聚类的算法步骤。...
分类:其他好文   时间:2014-12-04 15:48:14    阅读次数:243
kmeans聚类
k-means:基于划分算法的典型、实现比较简单。特点是只能聚球形、受离群点的影响很大。 采用python实现:用二维矩阵来存点集和质心点、每次循环分两步:计算质心和重新分配点,循环直到最小平方误差SSE收敛为止,或者指定一个最大的迭代次数。 关于画图,我使用的是pylab和Matplotlib,Matplotlib中的很多函数和matlab用法一样,比较方便作图,安装它时花了很长的时间来解决...
分类:其他好文   时间:2014-12-03 15:43:56    阅读次数:230
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!