实验名称: k-meas非监督聚类分析一、实验目的和要求
目的:加深对非监督学习的理解和认识掌握聚类方法K-Means算法的设计方法要求:根据聚类数据,采用k-Means聚类方法画出聚类中心二、实验环境、内容和方法环境:windows
7,python2.6 ,Eclipse,Pydev 内容: 1...
分类:
其他好文 时间:
2014-05-19 11:48:59
阅读次数:
416
混合高斯模型(Mixtures of Gaussians)和EM算法 主要内容: 1、
概率论预备知识 2、 单高斯模型 3、 混合高斯模型 4、 EM算法 5、 K-means聚类算法 一、概率论预备知识 1、 数学期望/均值、方差/标准差
设离散型随机变量X的分布律为 则称为X的数学期望或均值 ...
分类:
其他好文 时间:
2014-05-17 21:50:45
阅读次数:
597
本文用讲一下指定分布的随机抽样方法:MC(Monte Carlo), MC(Markov Chain), MCMC(Markov Chain Monte Carlo)的基本原理,并用R语言实现了几个例子:
1. Markov Chain (马尔科夫链)
2. Random Walk(随机游走)
3. MCMC具体方法:
3.1 M-H法
3.2 Gibbs采样
PS:本篇blog为ese机器学习短期班参考资料(20140516课程)。...
分类:
其他好文 时间:
2014-05-15 23:58:14
阅读次数:
536
自从人工智能被提出之日起,已经过去了半个世纪,至今也没有达到人们期待的水准。也许,真正的人工智能永远也不会实现。
最近在研究图像检索时突然想到这个问题,在这里写下一些自己的思考。
人们最终所期望实现的人工智能应该是与人类具有一样的智慧或者超越人类的智慧,我们可以称之为智慧生命。但是智慧生命真的能够实现吗?
人工智能学科大致分为两派,一派是推理派,另一派是学习派。
推理派认为智慧生命应该像人...
分类:
其他好文 时间:
2014-05-15 23:07:10
阅读次数:
409
Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy。其中Numpy是一个用python实现的科学计算包。包括:一个强大的N维数组对象Array;比较成熟的(广播)函数库;用于整合C/C++和Fortran代码的工具包;实用的线性代数、傅里叶变换和随机数生成函数。
SciPy是....
分类:
编程语言 时间:
2014-05-15 14:06:15
阅读次数:
505
本文根据Daphne Koller的课程整理。
PDM(ProbabilisticGraphiccal Models)
称为概率图模型。下面分别说明3个词对应的意义。
概率
-给出了不确定性的明确量度。
-给出了根据不确定性进行推断的有力工具。
-利用数据结构,建立了进行学习的方法,解决十分大规模的问题。
图
这里主要用到2种概率图,用于表示依赖关系。如图1所示...
分类:
其他好文 时间:
2014-05-15 13:00:48
阅读次数:
295
主要内容来自stanford Andrew Ng视频课程的总结。讲的很好,还有对应的习题,课程可以在下面网站搜索到。
https://www.coursera.org/
机器学习的目的是在训练数据的基础上得出一个模型,该模型对于给定的输入x,给出相应的输出y。用公式表示就是:y = h(x)。注意x表示一维向量,x={x1,x2,x3...}。这里的xi也就是特征(featur...
分类:
其他好文 时间:
2014-05-15 08:20:58
阅读次数:
366
k-近邻算法原理:存在一个样本的数据集合,也叫训练的样本集,样本集中每个数据都有标签,算法分类时,输入没有分类的新数据,将新数据的每个特征与样本集中每个数据对应的特征进行比较,然后样本集可以计算得到与新数据的相似度,然后取前k(通常不大于20)大相似度所对应的类标签,然后将新数据标识为k个中类标签最...
分类:
其他好文 时间:
2014-05-15 07:42:07
阅读次数:
401
利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它们分别从不同的角度对数据进行挖掘。①
分类。分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。它可以...
分类:
其他好文 时间:
2014-05-15 07:40:07
阅读次数:
213