主成份分析就是求出原始数据矩阵的协方差矩阵对应的特征值和特征向量,对特征值进行由大而小的排序,再根据特征值对应的特征向量进行线性变换,得到新的向量(新的向量间相互正交)。通过设定阈值可以用低维的新向量近似表示高维的原向量(协方差矩阵为非奇异的);若协方差矩阵为奇异的,且零特征值较多,这种情况使用低维的新向量也可以完全表示高维原向量。...
分类:
其他好文 时间:
2014-12-26 16:51:22
阅读次数:
255
北京大学视觉与听觉信息处理实验室北京邮电大学模式识别与智能系统学科复旦大学智能信息处理开放实验室IEEE Computer Society北京映象站点计算机科学论坛机器人足球赛模式识别国家重点实验室南京航空航天大学模式识别与神经计算实验室 - PARNEC南京大学机器学习与数据挖掘研究所 - LAM...
分类:
Web程序 时间:
2014-12-26 16:24:13
阅读次数:
212
R中的adabag包均有函数实现bagging和adaboost的分类建模(另外,ipred包中的bagging()函数可以实现bagging回归)。第一题就利用adabag包实现bagging和adaboost建模,并根据预测结果选择最优模型。
a) 为了描述这两种方式,先利用全部数据建立模型:
利用boosting()(原来的adaboost.M1()函数)建立adaboost分...
分类:
其他好文 时间:
2014-12-26 14:42:54
阅读次数:
274
数据源:在以下链接下载酒类化学成分数据,分为红酒,白酒两种数据文件,红酒和白酒在化学成分上有较明显的差异
http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/
分析过程:
# 1)先将两组数据混合为一组
# 导入数据源
red
white
# 增加新字段type,1-红酒,2-白酒...
分类:
编程语言 时间:
2014-12-26 14:41:50
阅读次数:
425
一、到底什么是Spark?Spark是一个通用的大数据计算平台,基于“OneStacktorulethemall”的理念成功成为了一体化多元化的大数据处理平台,轻松应对大数据处理中的实时流计算、SQL交互式查询、机器学习和图计算等:Spark源于BDAS:基于该技术堆栈,Spark目前已经成为大数据...
分类:
其他好文 时间:
2014-12-26 14:16:41
阅读次数:
149
斯坦福NG机器学习:K-means笔记 ,无监督学习:经典聚类算法...
分类:
其他好文 时间:
2014-12-25 23:40:41
阅读次数:
203
前言 本文介绍机器学习分类算法中的朴素贝叶斯分类算法并给出伪代码,Python代码实现。词向量 朴素贝叶斯分类算法常常用于文档的分类,而且实践证明效果是挺不错的。 在说明原理之前,先介绍一个叫词向量的概念。 --- 它一般是一个布尔类型的集合,该集合中每个元素都表示其对应的单词是否在文档中出现...
分类:
编程语言 时间:
2014-12-25 23:21:32
阅读次数:
383
参考博客 Liam Q博客 和李航的《统计学习方法》感知机学习旨在求出将训练数据集进行线性划分的分类超平面,为此,导入了基于误分类的损失函数,然后利用梯度下降法对损失函数进行极小化,从而求出感知机模型。感知机模型是神经网络和支持向量机的基础。下面分别从感知机学习的模型、策略和算法三个方面来介绍。1....
分类:
编程语言 时间:
2014-12-25 21:57:06
阅读次数:
252
引入
一个机器可以根据照片来辨别鲜花的品种吗?在机器学习角度,这其实是一个分类问题,即机器根据不同品种鲜花的数据进行学习,使其可以对未标记的测试图片数据进行分类。
这一小节,我们还是从scikit-learn出发,理解基本的分类原则,多动手实践。
Iris数据集
Iris flower数据集是1936年由Sir Ronald Fisher引入的经典多维数据集,可以作为判别分析(...
分类:
编程语言 时间:
2014-12-25 11:19:34
阅读次数:
402
reference: http://dataunion.org/?p=5044机器学习和深度学习学习资料比较全面的收集了机器学习的介绍文章,从感知机、神经网络、决策树、SVM、Adaboost到随机森林、Deep Learning。《机器学习经典论文/survey合集》 介绍:看题目你已经知道了是什...
分类:
其他好文 时间:
2014-12-25 00:05:56
阅读次数:
375