1.K-means算法K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小。算法采用...
分类:
编程语言 时间:
2014-11-28 17:45:43
阅读次数:
220
K-means聚类算法算法优缺点:优点:容易实现缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢使用数据类型:数值型数据算法思想k-means算法实际上就是通过计算不同样本间的距离来判断他们的相近关系的,相近的就会放到同一个类别中去。1.首先我们需要选择一个k值,也就是我们希望把数据分成多少类,...
分类:
编程语言 时间:
2014-11-28 06:13:30
阅读次数:
368
本文就高斯混合模型(GMM,Gaussian Mixture Model)参数如何确立这个问题,详细讲解期望最大化(EM,Expectation Maximization)算法的实施过程。单高斯分布模型GSM多维变量X服从高斯分布时,它的概率密度函数PDF为:x是维度为d的列向量,u是模型期望,Σ是...
分类:
其他好文 时间:
2014-11-27 12:21:23
阅读次数:
163
什么是聚类分析?聚类分析属于探索性的数据分析方法。通常,我们利用聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的。聚类结果要求组内对象相似性较高,组间对象相似性较低。在三国数据分析中,很多问题可以借助聚类分析来解决,比如三国人物身份划分。聚类分析的基本过程是怎样的?选择聚类变量...
分类:
编程语言 时间:
2014-11-25 23:00:37
阅读次数:
324
本文对于高斯混合模型(GMM)进行了简要的讨论。对于单高斯模型,高斯混合模型以及K-means等都进行了简要的介绍以及其关系的梳理,着重介绍了高斯混合模型的参数估计问题,这包括在样本分类已知情况下的MLE算法估计,以及在样本分类未知情况下的EM算法估计。...
分类:
其他好文 时间:
2014-11-22 16:07:13
阅读次数:
339
先说一下什么是密度聚类的方法参考文章:基于密度的聚类 这篇文章的大概意思通过一幅图来说明: 1 首先任意选定一个点假设就以图中最左边的h为第一个点,根据半径判断,在一定的范围内点的个数是否满足要求。 -如果满足把这个点标记为核心点,这个圆判定为一个聚类。 -如果不是,就把这个点判定为...
分类:
其他好文 时间:
2014-11-20 21:44:36
阅读次数:
688
一、两幅图像线性混合线性混合,就是g(x) = a*f1(x) +b*f2(x)。其中g为输出,f1、f2为输入。a+b=1。作用1:线性混合可以用于去噪,假设噪声的产生符合均值为零、标准差的独立分布。多个高斯分布求平均值,即可去除噪声。作用2:用于两张图片的切换。a从大到小变化,b从小到大变化。g...
分类:
其他好文 时间:
2014-11-20 11:36:29
阅读次数:
302
k-means算法: 第一步:选$K$个初始聚类中心,$z_1(1),z_2(1),\cdots,z_k(1)$,其中括号内的序号为寻找聚类中心的迭代运算的次序号.聚类中心的向量值可任意设定,例如可选开始的$K$个模式样本的向量值作为初始聚类中心。 第二步:逐个将需分类的模式样本$\{x\}$按.....
分类:
编程语言 时间:
2014-11-16 21:29:00
阅读次数:
257
1. 与K-均值算法的比较–K-均值算法通常适合于分类数目已知的聚类,而ISODATA算法则更加灵活;–从算法角度看, ISODATA算法与K-均值算法相似,聚类中心都是通过样本均值的迭代运算来决定的;–ISODATA算法加入了一些试探步骤,并且可以结合成人机交互的结构,使其能利用中间结果所取得的经...
分类:
编程语言 时间:
2014-11-16 15:53:14
阅读次数:
378
狄利克雷聚类算法 前面介绍的三种聚类算法都是基于划分的,下面我们简要介绍一个基于概率分布模型的聚类算法,狄利克雷聚类(Dirichlet Processes Clustering)。 首先我们先简要介绍一下基于概率分布模型的聚类算...
分类:
编程语言 时间:
2014-11-13 16:57:10
阅读次数:
306