主讲人 网络上的尼采
(新浪微博: @Nietzsche_复杂网络机器学习)
网络上的尼采(813394698) 9:11:56
开始吧,先不要发言了,先讲PRML第二章Probability Distributions。今天的内容比较多,还是边思考边打字,会比较慢,大家不要着急,上午讲不完下午会接着讲。 顾名思义,PRML第二章Probability Distributions的...
分类:
其他好文 时间:
2015-02-03 17:19:37
阅读次数:
295
聚类分析(Cluster Analysis)一、聚类分析与判别分析?判别分析:已知分类情况,将未知个体归入正确类别 ?聚类分析:分类情况未知,对数据结构进行分类 二、Q型和R型 聚类Q型是对样本进行分类处理,其作用在于: 1.能利用多个变量对样本进行分类 2.分类结果直观,聚类谱系图能明白、清楚地表...
分类:
其他好文 时间:
2015-02-03 10:50:08
阅读次数:
239
在 聚类算法K-Means, K-Medoids, GMM, Spectral clustering,Ncut一文中我们给出了GMM算法的基本模型与似然函数,在EM算法原理中对EM算法的实现与收敛性证明进行了具体说明。本文主要针对怎样用EM算法在混合高斯模型下进行聚类进行代码上的分析说明。1. GM...
分类:
编程语言 时间:
2015-02-01 21:47:26
阅读次数:
264
K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。matlab中有kmeans聚类算法的函数可以调用,如[ldx,C,su...
分类:
编程语言 时间:
2015-01-31 21:46:31
阅读次数:
290
数据预处理章节,整理于《数据挖掘·概念与技术》第三章,如有错误,请指正,谢谢~1、概述 数据清理可以去除数据中的噪声,纠正不一致。数据集成将数据由多个数据源合并成一个一致的数据进行存储,如数据仓库。数据规约可以通过如聚集,删除冗余特征或聚类降低数据的规模。数据变换(如规约化)可以把数据压缩到较小的....
分类:
其他好文 时间:
2015-01-31 15:59:47
阅读次数:
238
转自http://blog.csdn.net/abcjennifer/article/category/1173803/3本文简明讲述GMM-HMM在语音识别上的原理,建模和测试过程。这篇blog只回答三个问题:1.什么是Hidden Markov Model?HMM要解决的三个问题:1) Like...
分类:
其他好文 时间:
2015-01-30 14:33:18
阅读次数:
244
一、广义线性模型概念 在讨论广义线性模型之前,先回顾一下基本线性模型,也就是线性回归。 在线性回归模型中的假设中,有两点需要提出: (1)假设因变量服从高斯分布:$Y={{\theta }^{T}}x+\xi $,其中误差项$\xi \sim N(0,{{\sigma }^{2}})$,那么因...
分类:
其他好文 时间:
2015-01-29 14:13:11
阅读次数:
523
dlib库学习之一1、介绍跨平台 C++ 通用库 Dlib 发布 ,带来了一些新特性,包括概率 CKY 解析器,使用批量同步并行计算模型来创建应用的工具,新增两个聚合算法:中国低语 (Chinese Whispers) 和纽曼的模块化聚类。Dlib是一个使用现代C++技术编写的跨平台的通用库,遵守B...
分类:
其他好文 时间:
2015-01-29 11:51:33
阅读次数:
238
昨天终于hadoop的项目验收完成了,终于可以松一口气了,总体还是比较满意的。
首先说一下项目流程,用mapreduce对数据进行预处理,然后用mahout中的聚类算法(kmeans)对数据进行处理,最后用peoplerank对数据进行处理。
根据老师交给我们的数据,包括Google+和Twitter的部分社交网络数据。以下是两个数据下载的链接
http://snap.stanford.ed...
分类:
其他好文 时间:
2015-01-27 18:24:46
阅读次数:
237
正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及project等领域都很重要的概率分布,在统计学的很多方面有着重大的影响力。若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为:X~N(μ,σ2),则其概率...
分类:
其他好文 时间:
2015-01-26 11:33:39
阅读次数:
490