一:算法介绍期望最大化算法,跟k-means一样属于基于划分的聚类,其实EM算法跟k-means算法思想很相似,主要步骤:期望步(E-步):给定当前的簇中心,每个对象都被指派到簇中心离该对象最近的簇。就是期望每个对象都属于最近的簇。最大化步(M-步):给定簇指派,对应每个簇,算法调整期中心,使得指派...
分类:
编程语言 时间:
2015-03-12 22:09:19
阅读次数:
196
1. 何谓机器学习机器学习就是把无序的数据转换成有用的信息。机器学习的主要任务是分类,另一项任务是回归。监督学习:之所以称之为监督学习,是因为这类算法必须知道预测什么,即目标变量的分类信息。(分类、回归)无监督学习:数据没有类别信息,也不会给定目标值。(聚类、密度估计)监督学习: k-邻近算法、线....
分类:
其他好文 时间:
2015-03-11 22:55:29
阅读次数:
284
怀着很纠结的心情来总结这篇论文,这主要是因为作者提虽然供了源代码,但是我并没有仔细去深究他的code,只是把他的算法加进了自己的项目。希望以后有时间能把MST这一结构自己编程实现!! 论文题目是基于非局部代价聚类(non-local cost aggregation)的立体匹配,从题目上看这篇论文....
分类:
其他好文 时间:
2015-03-11 21:29:44
阅读次数:
304
作者:daniel-D 在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如 K 最近邻(KNN)和 K 均值(K-Means...
分类:
其他好文 时间:
2015-03-09 21:02:05
阅读次数:
236
1、任意选取K个对象作为初始聚类中心(O1,O2,…Oi…Ok)。 2)将余下的对象分到各个类中去(该对象与哪一个聚类中心最近就被分配到哪一个聚类簇中); 3)对于每个类(Oi)中,顺序选取一个Or,重复步骤2,计算用Or代替Oi后的误差E=各个点到其对应的中心点欧式距离之和。选择E最小的那个O.....
分类:
编程语言 时间:
2015-03-08 11:39:58
阅读次数:
193
1、Preface因为一直在做的是聚类算法的研究,算是总结了一些心得,这里总结些知识性与思路性的东西,我想在其他地方也是很容易的找到类似的内容的。毕竟,世界就是那么小。
声明:本文比较不适合没有DM基础的人来阅读。我只是胡乱的涂鸦而已2、聚类算法在DM里的聚类算法里,有基于划分的算法,基于层次的算法,基于密度的算法,基于网格的算法,基于约束的算法。
其中每一种基于的算法都会衍生出一至几种算法...
分类:
编程语言 时间:
2015-03-07 22:50:05
阅读次数:
265
Mahout 是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现、分类、聚类等。Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能。
一、Mahout安装、配置
1、下载并解压Mahout
http://archive.apac...
分类:
其他好文 时间:
2015-03-07 17:15:35
阅读次数:
554
开一个机器学习方法科普系列,也做基础回顾之用。学而时习之。
content:
linear regression, Ridge, Lasso
Logistic Regression, Softmax
Kmeans, GMM, EM, Spectral Clustering
......
分类:
其他好文 时间:
2015-03-07 01:04:29
阅读次数:
231
Preface在相关聚类算法的实现过程中,用python语言实现,会经常出现array和matrix的混淆,这里做个总结。array数组numpy中最基本(默认)的类型是array,他的相关操作都是按元素操作的即用作数值计算当中(按元素操作有+,-,,/,*等)。相乘举例: from numpy import *
>>> a=array([1,2])
>>> a
ar...
分类:
其他好文 时间:
2015-03-07 01:02:12
阅读次数:
46655
首先介绍聚类中的层次聚类算法。层次法又分为凝聚的层次聚类和分裂的层次聚类。 凝聚的方法:也称自底向上的方法,首先将每个对象作为单独的一个聚类,然后根据性质和规则相继地合并相近的类,直到所有的对象都合并为一个聚类中,或者满足一定的终止条件。经典的层次凝聚算法以AGNES算法为代表,改进的层次凝聚算法....
分类:
编程语言 时间:
2015-03-06 15:27:35
阅读次数:
144