码迷,mamicode.com
首页 >  
搜索关键字:特征选择    ( 398个结果
python数据挖掘(从数据集中抽取特征)
大多数数据挖掘算法都依赖于数值或类别型特征,从数据集中抽取数值和类别型特征,并选出最佳特征。 特征可用于建模, 模型以机器挖掘算法能够理解的近似的方式来表示现实 特征选择的另一个优点在于:降低真实世界的复杂度,模型比现实更容易操纵 特征选择 scikit-learn中的VarianceThresho ...
分类:编程语言   时间:2018-06-01 22:20:29    阅读次数:1331
机器学习之特征选择方法
特征选择是一个重要的数据预处理过程,在现实机器学习任务中,获得数据之后通常先进行特征选择,此后在训练学习器,如下图所示: 进行特征选择有两个很重要的原因: 避免维数灾难:能剔除不相关(irrelevant)或冗余(redundant )的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的 ...
分类:其他好文   时间:2018-05-29 01:52:56    阅读次数:248
特征工程之特征预处理
在前面我们分别讨论了特征工程中的特征选择与特征表达,本文我们来讨论特征预处理的相关问题。主要包括特征的归一化和标准化,异常特征样本清洗与样本数据不平衡问题的处理。 1. 特征的标准化和归一化 由于标准化和归一化这两个词经常混用,所以本文不再区别标准化和归一化,而通过具体的标准化和归一化方法来区别具体 ...
分类:其他好文   时间:2018-05-26 21:26:57    阅读次数:163
从信用卡欺诈模型看不平衡数据分类(1)数据层面:使用过采样是主流,过采样通常使用smote,或者少数使用数据复制。过采样后模型选择RF、xgboost、神经网络能够取得非常不错的效果。(2)模型层面:使用模型集成,样本不做处理,将各个模型进行特征选择、参数调优后进行集成,通常也能够取得不错的结果。(3)其他方法:偶尔可以使用异常检测技术,IF为主
总结:不平衡数据的分类,(1)数据层面:使用过采样是主流,过采样通常使用smote,或者少数使用数据复制。过采样后模型选择RF、xgboost、神经网络能够取得非常不错的效果。(2)模型层面:使用模型集成,样本不做处理,将各个模型进行特征选择、参数调优后进行集成,通常也能够取得不错的结果。(3)其他 ...
分类:其他好文   时间:2018-05-25 19:27:18    阅读次数:587
决策树模型、本质、连续值
摘自《统计学习方法》 李航 第五章 决策树学习通常包括3个步骤:特征选择、决策树的生成、决策树的剪枝 决策树学习本质上是从训练集中归纳出一组分类规则。 决策树学习的损失函数通常是正则化的极大似然函数。 决策树的学习算法通常是采用启发式的方法,近似求解最优化问题 特征选择问题 特征选择在于选取对训练数 ...
分类:其他好文   时间:2018-05-23 00:01:55    阅读次数:169
特征工程之特征表达
在特征工程之特征选择中,我们讲到了特征选择的一些要点。本篇我们继续讨论特征工程,不过会重点关注于特征表达部分,即如果对某一个特征的具体表现形式做处理。主要包括缺失值处理,特殊的特征处理比如时间和地理位置处理,离散特征的连续化和离散化处理,连续特征的离散化处理几个方面。 1. 缺失值处理 特征有缺失值 ...
分类:其他好文   时间:2018-05-19 23:21:07    阅读次数:220
特征选择- Sklearn.feature_selection的理解
Sklearn的feature_selection模块中给出了其特征选择的方法,实际工作中选择特征的方式肯定不止这几种的,IV,GBDT等等都ok; 一、移除低方差特征(Removing features with low variance) API函数:sklearn.feature_select ...
分类:其他好文   时间:2018-05-14 19:55:20    阅读次数:5964
特征工程:特征生成,特征选择(三)
转自:https://blog.csdn.net/cymy001/article/details/79169862 特征生成 特征工程中引入的新特征,需要验证它确实能提高预测得准确度,而不是加入一个无用的特征增加算法运算的复杂度。 1. 时间戳处理 时间戳属性通常需要分离成多个维度比如年、月、日、小 ...
分类:其他好文   时间:2018-05-07 10:17:30    阅读次数:161
【特征选择】嵌入式特征选择法
原创博文,转载请注明出处! 嵌入式特征选择法使用机器学习模型进行特征选择。特征选择过程与学习器相关,特征选择过程与学习器训练过程融合,在学习器训练过程中自动进行特征选择。 通过L1正则化来选择特征 sklearn在feature_selection模块中集成的模型SelectFromModel实现了... ...
分类:其他好文   时间:2018-05-02 02:24:40    阅读次数:262
【特征选择】过滤式特征选择法
# 过滤式特征选择法的原理 使用发散性或相关性指标对各个特征进行评分,选择分数大于阈值的特征或者选择前K个分数最大的特征。 # 过滤式特征选择法的特点 特征选择过程与学习器无关,相当于先对初始特征进行过滤,再用过滤后的特征训练学习器。过滤式特征选择法简单、易于运行、易于理解,通常对于理解数据有较好的... ...
分类:其他好文   时间:2018-04-30 16:34:55    阅读次数:318
398条   上一页 1 ... 19 20 21 22 23 ... 40 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!