标签:tab 映射 样本 height strong 特征 font padding 需要
一、PCA:(principal component analysis)
1、为何需要PCA
2、PCA 的思想
将 n维特征映射到 k 维上(k<n) ,这 k 维是全新的特征,称为主元,是重新构造出来的 k 维特征,而不是简单地从 n 维特征中去除其余 n‐k 维特征
3、实例讲解过程
| x | y |
| 2.5 | 2.4 |
| 0.5 | 0.7 |
| 2.2 | 2.9 |
| 1.9 | 2.2 |
| 3.1 | 3.0 |
| 2.3 | 2.7 |
| 2 | 1.6 |
| 1 | 1.1 |
| 1.5 | 1.6 |
| 1.1 | 0.9 |
假设我们有2 维数据,行代表样例,列代表特征,这里有 10 个样例,每个样例两个特征
step1:求每个特征的均值,然后对于所有的样例,都减去对应的均值。这里 x 的均值是 1.81,y 的均值是 1.91,减去后得到:
| x-average(x) | y-average(y) |
| 0.69 | 0.49 |
| -1.31 | -1.21 |
| 0.39 | 0.99 |
| 0.09 | 0.29 |
| 1.29 | 1.09 |
| 0.49 | 0.79 |
| 0.19 | -0.31 |
| -0.81 | -0.81 |
| -0.31 | -0.31 |
| -0.71 | -1.01 |
标签:tab 映射 样本 height strong 特征 font padding 需要
原文地址:https://www.cnblogs.com/always-fight/p/8847403.html