搜索关键字：特征选择，搜索到398个结果！码迷,mamicode.com！

8、特征选择

用过滤法对以下数据进行特征选择： [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求： 1、Variance Threshold（threshold =1.0） 2、将结果截图放上来（没有条件的备注说明原因）注意：每个人的电脑ID是不一样的 ...

分类：其他好文时间：2020-06-07 15:08:58 阅读次数：41

8.特征选择

用过滤法对以下数据进行特征选择： [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求： 1、Variance Threshold（threshold =1.0） 2、将结果截图 1 from sklearn.feature_selection import VarianceTh ...

分类：其他好文时间：2020-06-06 18:39:53 阅读次数：53

条件独立性以及特征选择算法

...

分类：编程语言时间：2020-05-31 11:13:32 阅读次数：72

机器学习---正则化

正则化的目的是为了防止过拟合，降低模型的复杂度。正则化的打开方式：在目标函数后面添加一个系数的“惩罚项”。式中，是一个常数，为样本个数，是一个超参数，用于控制正则化程度。 1、L1正则化：在目标函数后面加了所有特征系数的绝对值之和。L1正则化更适用于特征选择，每次更新过程中会减去或加上一 ...

分类：其他好文时间：2020-05-30 22:03:08 阅读次数：108

机器学习实战基础（十七）：sklearn中的数据预处理和特征工程（十）特征选择之 Embedded嵌入法

Embedded嵌入法嵌入法是一种让算法自己决定使用哪些特征的方法，即特征选择和算法训练同时进行。在使用嵌入法时，我们先使用某些机器学习的算法和模型进行训练，得到各个特征的权值系数，根据权值系数从大到小选择特征。这些权值系数往往代表了特征对于模型的某种贡献或某种重要性，比如决策树和树的集成模型中 ...

分类：其他好文时间：2020-05-29 13:49:27 阅读次数：57

机器学习实战基础（十六）：sklearn中的数据预处理和特征工程（九）特征选择之 Filter过滤法（三）总结

过滤法总结到这里我们学习了常用的基于过滤法的特征选择，包括方差过滤，基于卡方，F检验和互信息的相关性过滤，讲解了各个过滤的原理和面临的问题，以及怎样调这些过滤类的超参数。通常来说，我会建议，先使用方差过滤，然后使用互信息法来捕捉相关性，不过了解各种各样的过滤方式也是必要的。所有信息被总结在下表，大 ...

分类：其他好文时间：2020-05-29 13:33:00 阅读次数：102

机器学习实战基础（十五）：sklearn中的数据预处理和特征工程（八）特征选择之 Filter过滤法（二）相关性过滤

相关性过滤方差挑选完毕之后，我们就要考虑下一个问题：相关性了。我们希望选出与标签相关且有意义的特征，因为这样的特征能够为我们提供大量信息。如果特征与标签无关，那只会白白浪费我们的计算内存，可能还会给模型带来噪音。在sklearn当中，我们有三种常用的方法来评判特征与标签之间的相关性：卡方，F检验 ...

分类：其他好文时间：2020-05-29 13:27:44 阅读次数：149

机器学习实战基础（十八）：sklearn中的数据预处理和特征工程（十一）特征选择之 Wrapper包装法

Wrapper包装法包装法也是一个特征选择和算法训练同时进行的方法，与嵌入法十分相似，它也是依赖于算法自身的选择，比如coef_属性或feature_importances_属性来完成特征选择。但不同的是，我们往往使用一个目标函数作为黑盒来帮助我们选取特征，而不是自己输入某个评估指标或统计量的阈值 ...

分类：移动开发时间：2020-05-29 13:24:47 阅读次数：159

sklearn中正则化的Lasso问题

Lasso，也就是L1正则项，它倾向于完全消除最不重要特征的权重（置为0），就是说Lasso会自动执行特征选择，并输出一个稀疏模型。问题：Lasso在特征数量超过训练实例的数量时（比如10条数据20个特征），或者特征之间相关性比较强，Lasso就会很不稳定。总结：Lasso可进行特征选择，不代表 ...

分类：其他好文时间：2020-05-25 10:52:02 阅读次数：55

9、主成分分析

一、用自己的话描述出其本身的含义： 1、特征选择提取到的所有特征中选择和类标签有关的特征作为训练集特征，特征在选择前和选择后不改变值。 2、PCA PCA即主成分技术，又称主分量分析。主成分分析也称主分量分析，旨在利用降唯的思想，把多指标转化为少数几个综合指标一种常见的数据分析方式，常用于高维数据 ...

分类：其他好文时间：2020-05-04 21:13:08 阅读次数：54

共398条上一页 1 2 3 4 5 ... 40 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)