码迷,mamicode.com
首页 >  
搜索关键字:特征选择    ( 398个结果
04_数据降维
04 数据降维 降维: 降低特征的数量 特征选择 主成分分析 特征选择: 特征选择的原因 冗余:部分特征的相关度高,容易消耗计算性能 噪声:部分特征对计算结构有影响 特征选择是什么? 1. 定义: 特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征,特征在选择前和选择后可以改变值,也可 ...
分类:其他好文   时间:2019-11-10 19:31:03    阅读次数:124
机器学习之决策树算法
决策树 (decision tree) 是一种常用的有监督算法。 决策树算法有很多类型,其中最大的差别就是最优特征选择的方法不同。最优特征指的是,在每个结点处,如何选择最好的特征(属性)对样本进行分类,这里最佳的意义即经过这步划分,能使分类精度最好,直到这棵树能准确分类所有训练样本。 通常特征选择的 ...
分类:编程语言   时间:2019-11-07 19:39:05    阅读次数:95
scikit-learn 应用
首先是sklearn的官网:http://scikit-learn.org/stable/ 在官网网址上可以看到很多的demo,下边这张是一张非常有用的流程图,在这个流程图中,可以根据数据集的特征,选择合适的方法。 2.sklearn使用的小例子 3.sklearn数据集 在上边例子中,直接使用了s ...
分类:其他好文   时间:2019-10-31 18:30:34    阅读次数:76
特征预处理
在前面我们分别讨论了特征工程中的特征选择与特征表达,本文我们来讨论特征预处理的相关问题。主要包括特征的归一化和标准化,异常特征样本清洗与样本数据不平衡问题的处理。 1. 特征的标准化和归一化 由于标准化和归一化这两个词经常混用,所以本文不再区别标准化和归一化,而通过具体的标准化和归一化方法来区别具体 ...
分类:其他好文   时间:2019-10-24 00:23:40    阅读次数:73
特征工程-特征选择
转自:https://www.cnblogs.com/pinard/p/9032759.html 1. 特征的来源 在做数据分析的时候,特征的来源一般有两块,一块是业务已经整理好各种特征数据,我们需要去找出适合我们问题需要的特征;另一块是我们从业务特征中自己去寻找高级数据特征。我们就针对这两部分来分 ...
分类:其他好文   时间:2019-10-23 18:38:06    阅读次数:59
02-24 决策树总结
[TOC]更新、更全的《机器学习》的更新网站,更有python、go、数据结构与算法、爬虫、人工智能教学等着你:https://www.cnblogs.com/nickchen121/# 决策树总结# 一、ID3算法、C4.5算法和CART算法比较| 算法 | 树结构 | 支持模型 | 特征选择 |... ...
分类:其他好文   时间:2019-10-16 17:59:30    阅读次数:98
02-06 普通线性回归(波斯顿房价预测)+特征选择
[TOC]更新、更全的《机器学习》的更新网站,更有python、go、数据结构与算法、爬虫、人工智能教学等着你:https://www.cnblogs.com/nickchen121/# 普通线性回归(波士顿房价预测)# 一、导入模块```pythonimport pandas as pdimpor... ...
分类:其他好文   时间:2019-10-16 17:54:38    阅读次数:101
决策树代码
sklearn.tree.DecisionTreeClassifier 特征选择标准criterion 可以使用"gini"或者"entropy",前者代表基尼系数,后者代表信息增益。一般说使用默认的基尼系数"gini"就可以了,即CART算法。除非你更喜欢类似ID3, C4.5的最优特征选择方法。 ...
分类:其他好文   时间:2019-10-15 11:37:44    阅读次数:129
决策树算法原理(下)
1. CART分类树算法的最优特征选择方法 2. CART分类树算法对于连续特征和离散特征处理的改进 3. CART分类树建立算法的具体流程 4. CART回归树建立算法 5. CART树算法的剪枝 6. CART算法小结 7. 决策树算法小结在决策树算法原理(上)这篇里,我们讲到了决策树里ID3算... ...
分类:编程语言   时间:2019-10-01 14:37:01    阅读次数:122
随机森林算法OOB_SCORE最佳特征选择
Sklearn RandomForest算法(有监督学习),可以根据输入数据,选择最佳特征组合,减少特征冗余; 原理:由于随机决策树生成过程采用的Boostrap,所以在一棵树的生成过程并不会使用所有的样本,未使用的样本就叫(Out_of_bag)袋外样本,通过袋外样本,可以评估这个树的准确度,其他 ...
分类:编程语言   时间:2019-09-30 23:18:00    阅读次数:204
398条   上一页 1 ... 10 11 12 13 14 ... 40 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!