码迷,mamicode.com
首页 >  
搜索关键字:高斯分布 混合高斯分布 聚类 gmm    ( 2168个结果
图像分割
让计算机代替人来完成对于红白细胞的自动分析,关键在于对红白细胞的分割与识别。 目前,已经出现了许多种分割和识别方法。在分割上有阈值分割、聚类、边缘检测以及区域提取等方法。特定地使用某种阈值分割法只能将其中的一部分红白细胞分割出来。聚类法是通过检测相似点的簇来对每个聚类进行标记,其缺点是聚类数目事先不可知,而且没有考虑到不同类别间的交叉性。边缘检测通过确定强度值的突变点的位置来区分不同的区域,...
分类:其他好文   时间:2014-10-11 00:33:34    阅读次数:336
个性化推荐入门
“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。本文作为这个系列的第一...
分类:其他好文   时间:2014-10-10 21:09:54    阅读次数:221
(原创)大数据时代:基于微软案例数据库数据挖掘知识点总结(结果预测篇)
前言本篇文章主要是继续前几篇Microsoft决策树分析算法、Microsoft聚类分析算法、Microsoft Naive Bayes 算法,算法介绍后,经过这几种算法综合挖掘和分析之后,对一份摆在公司面前的人员信息列表进行推测,挖掘出这些人员信息中可能购买自行车的群体,把他们交个营销部,剩下的事...
分类:数据库   时间:2014-10-10 19:13:44    阅读次数:219
Deep learning From Image to Sequence
本文笔记旨在概括地讲deep learning的经典应用。内容太大,分三块。 1. 回顾 deep learning在图像上的经典应用 1.1 Autoencoder 1.2 MLP 1.3 CNN 2. deep learning处理语音等时序信号 2.1 对什么时序信号解决什么问题 2.2 准备知识 2.2.1 Hidden Markov Model(HMM) 2.2.2 GMM-HMM for Speec...
分类:其他好文   时间:2014-10-10 11:21:04    阅读次数:368
(原创)大数据时代:基于微软案例数据库数据挖掘知识点总结(Microsoft Naive Bayes 算法)
本篇文章主要是继续上两篇Microsoft决策树分析算法和Microsoft聚类分析算法后,采用另外更为简单一种分析算法对目标顾客群体的挖掘,同样的利用微软案例数据进行简要总结。有兴趣的同学可以先参照上面两种算法过程。应用场景介绍通过前面两种算法的应用场景介绍,此次总结的Microsoft Naiv...
分类:数据库   时间:2014-10-09 17:41:57    阅读次数:241
数据挖掘算法之-关联规则挖掘(Association Rule)(购物篮分析)
在各种数据挖掘算法中,关联规则挖掘算是比较重要的一种,尤其是受购物篮分析的影响,关联规则被应用到很多实际业务中,本文对关联规则挖掘做一个小的总结。 首先,和聚类算法一样,关联规则挖掘属于无监督学习方法,它描述的是在一个事物中物品间同时出现的规律的知识模式,现实生活中,比如超市购物时,顾客购买记录常常隐含着很多关联规则,比如购买圆珠笔的顾客中有65%也购买了笔记本,利用这些规则,商场人员可以很...
分类:其他好文   时间:2014-10-08 18:24:35    阅读次数:251
(原创)大数据时代:基于微软案例数据库数据挖掘知识点总结(Microsoft 聚类分析算法)
本篇文章主要是继续上一篇Microsoft决策树分析算法后,采用另外一种分析算法对目标顾客群体的挖掘,同样的利用微软案例数据进行简要总结。应用场景介绍通过上一篇中我们采用Microsoft决策树分析算法对已经发生购买行为的订单中的客户属性进行了分析,可以得到几点重要的信息,这里做个总结:1、对于影响...
分类:数据库   时间:2014-10-07 23:34:24    阅读次数:265
第1次实验——NPC问题(回溯算法、聚类分析)
题目:八皇后问题,是一个古老而著名的问题,是回溯算法的典型案例。该问题是国际西洋棋棋手马克斯·贝瑟尔于1848年提出:在8X8格的国际象棋上摆放八个皇后,使其不能互相攻击,即随意两个皇后都不能处于同一行、同一列或同一斜线上,问有多少种摆法。 高斯觉得有76种方案。1854年在柏林的象棋杂志上不同的作...
分类:其他好文   时间:2014-10-06 18:02:50    阅读次数:225
Mahout初步认识
Apache Mahout项目主要包括以下五个部分: 频繁模式挖掘:挖掘数据中频繁出现的项集。 聚类:将诸如文本、文档之类的数据分成局部相关的组。 分类:利用已经存在的分类文档训练分类器,对未分类的文档进行分类。 推荐引擎(协同过滤):获得用户的行为并从中发现用户可能喜欢的事务。 频繁子项挖掘:利用一个项集(查询记录或购物目录)去识别经常一起出现的项目。 在Maho...
分类:其他好文   时间:2014-10-06 00:55:49    阅读次数:346
GMM的EM算法实现
在 聚类算法K-Means, K-Medoids, GMM, Spectral clustering,Ncut一文中我们给出了GMM算法的基本模型与似然函数,在EM算法原理中对EM算法的实现与收敛性证明进行了具体说明。本文主要针对怎样用EM算法在混合高斯模型下进行聚类进行代码上的分析说明。1. GM...
分类:其他好文   时间:2014-10-05 15:42:18    阅读次数:312
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!