一、特征规约/降维:去掉可分性不强和冗余的特征 特征选择:去掉可分性不强的特征 特征抽取/变换:去掉多余的特征,即抽取出来的特征不存在线性or非线性关系 =========================================================================...
分类:
其他好文 时间:
2015-07-10 11:04:11
阅读次数:
95
Kernel PCA 原理和演示主成份(Principal Component Analysis)分析是降维(Dimension Reduction)的重要手段。每一个主成分都是数据在某一个方向上的投影,在不同的方向上这些数据方差Variance的大小由其特征值(eigenvalue)决定。一般我们...
分类:
其他好文 时间:
2015-07-03 18:43:32
阅读次数:
825
主因子分析,在炼数成金课程中提到:?降维的一种方法,是主成分分析的推广和发展?是用于分析隐藏在表面现象背后的因子作用的统计模型。试图用最少个数的不可测的公共因子的线性函数与特殊因子之和来描述原来观测的每一分量?例子:各科学习成绩(数学能力,语言能力,运劢能力等)?例子:生活满意度(工作满意度,家庭满...
分类:
编程语言 时间:
2015-06-29 23:57:03
阅读次数:
311
PCA要做的事降噪和去冗余,其本质就是对角化协方差矩阵。一.预备知识 1.1 协方差分析 对于一般的分布,直接代入E(X)之类的就可以计算出来了,但真给你一个具体数值的分布,要计算协方差矩阵,根据这个公式来计算,还真不容易反应过来。网上值得参考的资料也不多,这里用一个例子说明协方差矩阵是怎么...
分类:
其他好文 时间:
2015-06-27 15:46:18
阅读次数:
150
课程2课程2
归纳
回归就是变量之间的关系
相关系数
RSS
线性回归通过R语言
多元线性模型
虚拟变量哑变量
多元线性回归模型
回归诊断
广义线性模型一元以及多元的线性回归,统计学东西比较多,统计学术语一堆堆的
《大数据的统计学基础》基础的基础
logistic回归,划入广义线性回归模型。
变量筛选,从一堆变量中求解出来,以及降维。
1.归纳拟合,一般选择直线或者次数比较低得曲线。(测试有误差,曲...
分类:
其他好文 时间:
2015-06-26 13:04:58
阅读次数:
263
http://blog.json.tw/using-matlab-implementing-pca-dimension-reduction設有m筆資料, 每筆資料皆為n維, 如此可將他們視為一個mxn matrix。若資料的維度太大時, 可能不利於分析, 例如這m筆資料用作機器學習。PCA的想法是算...
分类:
其他好文 时间:
2015-06-25 22:43:49
阅读次数:
199
PCA算法算法步骤:
假设有m条n维数据。
1. 将原始数据按列组成n行m列矩阵X
2. 将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值
3. 求出协方差矩阵C=1/mXXT
4. 求出协方差矩阵的特征值以及对应的特征向量
5. 将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P
6. Y=PX即为降维到k维后的数据实例
以这个为例,我们用PCA...
分类:
编程语言 时间:
2015-06-20 10:38:22
阅读次数:
448
降维(一)----说说主成分分析(PCA)的源头降维系列:降维(一)----说说主成分分析(PCA)的源头降维(二)----Laplacian Eigenmaps---------------------主成分分析(PCA)在很多教程中做了介绍,但是为何通过协方差矩阵的特征值分解能够得到数据的主成分...
分类:
其他好文 时间:
2015-06-19 21:29:49
阅读次数:
199
降维(二)----Laplacian Eigenmaps降维系列:降维(一)----说说主成分分析(PCA)的源头降维(二)----Laplacian Eigenmaps---------------------前一篇文章中介绍了主成分分析。PCA的降维原则是最小化投影损失,或者是最大化保留投影后数...
分类:
其他好文 时间:
2015-06-19 21:29:35
阅读次数:
198
数据降维--低秩恢复在实际的信号或图像采集与处理中,数据的维度越高, 给数据的采集和处理带来越大的限制。例如,在采集三维或四维(三个空间维度再加上一个频谱维度或一个时间维度) 信号时,往往比较困难。然而,随着数据维数的升高,这些高维数据之间往往存在较多的相关性和冗余度。信号的维度越高,由于数据本身信...
分类:
其他好文 时间:
2015-06-19 20:14:55
阅读次数:
157