【转载】主成分分析(Principal components analysis)-最小平方误差解释
分类:
其他好文 时间:
2015-01-16 12:42:12
阅读次数:
226
主成分分析(PCA)是一种基于变量协方差矩阵对数据进行压缩降维、去噪的有效方法,PCA的思想是将n维特征映射到k维上(k0时说明 X和 Y是正相关关系,协方差<0时 X和Y是负相关关系,协方差为0时 X和Y相互独立。 协方差的计算是针对两维的,对于n维的数据集,可以计算C(n,2)种协方差...
分类:
编程语言 时间:
2015-01-05 23:08:15
阅读次数:
453
http://ufldl.stanford.edu/wiki/index.php/主成分分析if ~exist('train_IM_all','var')||~exist('train_LA_all','var')%为加快程序运行,以便重复运行本文件时不需要重复载入数据 load train_res...
分类:
编程语言 时间:
2014-12-29 01:00:19
阅读次数:
241
scikit-learn中PCA的使用方法
@author:wepon
@blog:http://blog.csdn.net/u012162613/article/details/42192293
在前一篇文章 主成分分析(PCA) 中,我基于python和numpy实现了PCA算法,主要是为了加深对算法的理解,算法的实现很粗糙,实际应用中我们一般调用成熟的包,本文就结束...
分类:
其他好文 时间:
2014-12-27 17:40:42
阅读次数:
497
一、PCA(Principal Component Analysis)主成分分析,数据从原来的坐标系转换到新的坐标系,只保留新坐标系中的前面几个坐标轴,即对数据进行了降维处理1、算法描述(1)第一个新坐标轴:原数据集中方差最大的方向(2)第二个新坐标轴:与第一个新坐标轴正交且具有最大方差的方向(3)...
分类:
其他好文 时间:
2014-12-25 06:34:34
阅读次数:
271
主成份分析历史:
Pearson于1901年提出,再由Hotelling(1933)加以发展的一种多变量统计方法。通过析取主成分显出最大的个别差异,也用来削减回归分析和聚类分析中变量的数目,可以使用样本协方差矩阵或相关系数矩阵作为出发点进行分析。
通过对原始变量进行线性组合,得到优化的指标:把原先多个指标的计算降维为少量几个经过优化指标的计算(占去绝大部分份额)
基本思想:设法将原先众多具有...
分类:
编程语言 时间:
2014-12-15 10:29:54
阅读次数:
290
系统地讲解了线性判别分析,主成分分析,奇异值分解的数学原理...
分类:
其他好文 时间:
2014-12-14 08:22:37
阅读次数:
365
原文链接自从上次谈了协方差矩阵之后,感觉写这种科普性文章还不错,那我就再谈一把协方差矩阵吧。上次那篇文章在理论层次介绍了下协方差矩阵,没准很多人觉得这东西用处不大,其实协方差矩阵在好多学科里都有很重要的作用,比如多维的正态分布,再比如今天我们今天的主角——主成分分析(Principal Compon...
分类:
其他好文 时间:
2014-12-13 23:18:59
阅读次数:
265
Principal Component Analysis算法优缺点:优点:降低数据复杂性,识别最重要的多个特征缺点:不一定需要,且可能损失有用的信息适用数据类型:数值型数据算法思想:降维的好处:使得数据集更易使用降低很多算法计算开销去除噪声使得结果易懂主成分分析(principal componen...
分类:
其他好文 时间:
2014-12-11 00:06:46
阅读次数:
259
问:为什么要去均值?1、我认为归一化的表述并不太准确,按统计的一般说法,叫标准化。数据的标准化过程是减去均值并除以标准差。而归一化仅包含除以标准差的意思或者类似做法。2、做标准化的原因是:减去均值等同于坐标的移动,把原始数据点的重心移到和原点重合,这样利于很多表达,比如数据的协方差矩阵可以写成XX'...
分类:
其他好文 时间:
2014-12-08 00:34:02
阅读次数:
303