码迷,mamicode.com
首页 >  
搜索关键字:高斯分布 混合高斯分布 聚类 gmm    ( 2168个结果
探索推荐引擎内部的秘密
“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规...
分类:其他好文   时间:2015-03-31 18:20:14    阅读次数:132
Mahout的安装与配置
Mahout是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现、分类、聚类等。 Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能。下载Maho...
分类:其他好文   时间:2015-03-29 17:54:37    阅读次数:147
推荐系统--揭开推荐的神奇面纱
开篇先推荐几篇关于推荐的文章,个人感觉对于入门非常有实际意义,是IBM的project师写的,例如以下:探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探探索推荐引擎内部的秘密,第 2 部分: 深入推荐引擎相关算法 - 协同过滤探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类...
分类:其他好文   时间:2015-03-28 21:34:50    阅读次数:145
混合高斯模型GMM
转自:http://blog.csdn.net/carson2005/article/details/7467891运动目标检测可以分为摄像机固定和摄像机运动两类;对于摄像机运动情况下的运动目标检测,光流法是比较常用的解决方法,通过求解偏微分方程求得图像序列的光流场,从而预测摄像机的运动状态。对于摄...
分类:其他好文   时间:2015-03-20 20:30:02    阅读次数:165
K-d 树对聚类算法进行预处理
在用聚类算法如k-means对数据进行聚类处理的时候,按照一般的处理方法,需要将每个数据跟其他所有的元素进行比较,计算相似度,然后才能聚类。假定有N个元素,则需计算N*(N-1)/2 次,当N非常大的时候,则非常消耗时间,这种时候,可以使用K-d树数据结构,对所有数据进行重新组织,构成一棵而叉树。k...
分类:编程语言   时间:2015-03-19 18:02:21    阅读次数:135
R语言做文本挖掘Part4
Part4文本分类 Part3文本聚类里讲到过,分类跟聚类的简单差异。所以要做分类我们需要先整理出一个训练集,也就是已经有明确分类的文本;测试集,可以就用训练集来替代;预测集,就是未分类的文本,是分类方法最后的应用实现。 1.       数据准备 训练集准备是一个很繁琐的功能,暂时没发现什么省力的办法,根据文本内容去手动整理。这里还是使用的某品牌的官微数据,根据微博内容,我将它微博...
分类:编程语言   时间:2015-03-18 18:08:26    阅读次数:468
孙其功陪你学之——Spark MLlib之K-Means聚类算法
看到 程序员的自我修养 – SelfUp.cn 里面有Spark MLlib之K-Means聚类算法。 但是是java 语言的,于是我按照例程用Scala写了一个,分享在此。 由于在学习 spark mllib 但是如此详细的资料真的很难找,在此分享。 测试数据 1 2 3 4 5 6 7...
分类:编程语言   时间:2015-03-18 18:00:39    阅读次数:466
SPSS19.0实战之聚类分析
聚类分析是将物理或者抽象对象的集合分成相似的对象类的过程。本次实验我将对同一批数据做两种不同的类型的聚类;它们分别是系统聚类和K-mean聚类。其中系统聚类的聚类方法也采用3种不同方法,来考察对比它们之间的优劣。由于没有样本数据,因此不能根据其数据做判别分析。评价标准主要是观察各聚类方法的所得到的类...
分类:其他好文   时间:2015-03-18 17:32:19    阅读次数:147
机器学习笔记(一)——机器学习基础
1. 何谓机器学习机器学习就是把无序的数据转换成有用的信息。机器学习的主要任务是分类,另一项任务是回归。监督学习:之所以称之为监督学习,是因为这类算法必须知道预测什么,即目标变量的分类信息。(分类、回归)无监督学习:数据没有类别信息,也不会给定目标值。(聚类、密度估计)监督学习: k-邻近算法、线....
分类:其他好文   时间:2015-03-16 16:08:39    阅读次数:106
对离散点进行区域分割
问题: 需要对离散点所在区域进行分割,分割最好能体现离散点的聚集性。解决思路: 在Arcgis中没有找到对离散点空间聚类中心提取的工具所以暂且采用以下组合方法:(1)对离散点进行分组(2)提取各分组的凸壳(3)将凸壳转换为其内部一点(4)利用凸壳转换的点建立泰森多边形完成对区域的划分解决方法:(1)...
分类:其他好文   时间:2015-03-15 21:04:38    阅读次数:327
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!