http://ufldl.stanford.edu/wiki/index.php/主成分分析if ~exist('train_IM_all','var')||~exist('train_LA_all','var')%为加快程序运行,以便重复运行本文件时不需要重复载入数据 load train_res...
分类:
编程语言 时间:
2014-12-29 01:00:19
阅读次数:
241
scikit-learn中PCA的使用方法
@author:wepon
@blog:http://blog.csdn.net/u012162613/article/details/42192293
在前一篇文章 主成分分析(PCA) 中,我基于python和numpy实现了PCA算法,主要是为了加深对算法的理解,算法的实现很粗糙,实际应用中我们一般调用成熟的包,本文就结束...
分类:
其他好文 时间:
2014-12-27 17:40:42
阅读次数:
497
主成份分析就是求出原始数据矩阵的协方差矩阵对应的特征值和特征向量,对特征值进行由大而小的排序,再根据特征值对应的特征向量进行线性变换,得到新的向量(新的向量间相互正交)。通过设定阈值可以用低维的新向量近似表示高维的原向量(协方差矩阵为非奇异的);若协方差矩阵为奇异的,且零特征值较多,这种情况使用低维的新向量也可以完全表示高维原向量。...
分类:
其他好文 时间:
2014-12-26 16:51:22
阅读次数:
255
白化是一种重要的预处理过程,其目的就是降低输入数据的冗余性,使得经过白化处理的输入数据具有如下性质:(i)特征之间相关性较低;(ii)所有特征具有相同的方差。
白化处理分PCA白化和ZCA白化,PCA白化保证数据各维度的方差为1,而ZCA白化保证数据各维度的方差相同。PCA白化可以用于降维也可以去相关性,而ZCA白化主要用于去相关性,且尽量使白化后的数据接近原始输入数据。
1...
分类:
其他好文 时间:
2014-12-25 16:25:46
阅读次数:
312
一、PCA(Principal Component Analysis)主成分分析,数据从原来的坐标系转换到新的坐标系,只保留新坐标系中的前面几个坐标轴,即对数据进行了降维处理1、算法描述(1)第一个新坐标轴:原数据集中方差最大的方向(2)第二个新坐标轴:与第一个新坐标轴正交且具有最大方差的方向(3)...
分类:
其他好文 时间:
2014-12-25 06:34:34
阅读次数:
271
斯坦福NG机器学习课程:Dimensionality_reduction笔记,很好讲解降维和PCA算法。...
分类:
其他好文 时间:
2014-12-20 15:37:22
阅读次数:
434
系统地讲解了线性判别分析,主成分分析,奇异值分解的数学原理...
分类:
其他好文 时间:
2014-12-14 08:22:37
阅读次数:
365
分类问题也可以用降维来理解,比如一个D维的数据点x,我们可以采用下面的映射进行线性的降维,y=θTx在计算出y后,就可以选择一个阈值h,来进行分类。正如我们在前面的PCA模型中看到的,降维会有信息的损失,可能会在降维过程中,丢失使数据可分的特征,导致分类的效果不理想。那采用什么样的降维方式,可以尽量...
分类:
其他好文 时间:
2014-12-13 23:16:17
阅读次数:
329
Principal Component Analysis算法优缺点:优点:降低数据复杂性,识别最重要的多个特征缺点:不一定需要,且可能损失有用的信息适用数据类型:数值型数据算法思想:降维的好处:使得数据集更易使用降低很多算法计算开销去除噪声使得结果易懂主成分分析(principal componen...
分类:
其他好文 时间:
2014-12-11 00:06:46
阅读次数:
259
PCA是一种非监督学习算法,它能够在保留大多数有用信息的情况下,有效降低数据纬度。它主要应用在以下三个方面:1. 提升算法速度2. 压缩数据,减小内存、硬盘空间的消耗3. 图示化数据,将高纬数据映射到2维或3维总而言之,PCA干的事情就是完成一个将原始的n维数据转化到k维的映射。其中,k<n它的核心...
分类:
编程语言 时间:
2014-12-10 17:44:02
阅读次数:
256