特征选择的一般过程 从特征全集中产生出一个特征子集,然后用评价函数对该特征子集进行评价,评价的结果与停止准则进行比较,若满足停止准则就停止,否则就继续产生下一组特征子集,继续进行特征选择。 特征子集产生过程( Generation Procedure ) 采取一定的子集选取办法,为评价函数提供特征子 ...
分类:
编程语言 时间:
2018-02-12 15:16:46
阅读次数:
203
机器不学习(jqbxx.com)-机器学习好网站 我们第一部分先讲 Convolution,到底什么是卷积,别忙,大家都用过某美颜软件吧, 比如我老婆新垣结衣: 美的不要的不要的。。。。。 然后我锐化了一下,变成如下图所示: 我们会发现,锐化后的图像边缘细节的对比度加大了。 然后我强调边缘,变成如下 ...
分类:
其他好文 时间:
2018-02-03 23:08:49
阅读次数:
235
特征选择 RFormula RFormula是一个很方便,也很强大的Feature选择(自由组合的)工具。 输入string 进行独热编码(见下面例子country) 输入数值型转换为double(见下面例子hour) label为string,也用StringIndexer进行编号 卡方独立检验 ...
分类:
编程语言 时间:
2018-01-31 20:24:50
阅读次数:
1193
随机:数据采样随机,特征选择随机 (数据采样,有放回) ...
分类:
编程语言 时间:
2018-01-30 21:20:54
阅读次数:
148
决策树的训练与测试 如何切分特征(选择节点) 衡量标准-熵 衡量标准-熵 信息增益 信息增益 决策树构造实例 信息增益:表示特征X使得类Y的不确定性减小的程度。(分类后的专一性,希望分类后的结果是同类在一起) Outlook = sunny时,熵值 = (-2/5)*log(2/5)/log2 - ...
分类:
编程语言 时间:
2018-01-29 17:33:56
阅读次数:
220
在进行数据挖掘时,我们并不需要将所有的自变量用来建模,而是从中选择若干最重要的变量,这称为特征选择(feature selection)。一种算法就是后向选择,即先将所有的变量都包括在模型中,然后计算其效能(如误差、预测精度)和变量重要排序,然后保留最重要的若干变量,再次计算效能,这样反复迭代,找出 ...
分类:
编程语言 时间:
2018-01-16 18:41:34
阅读次数:
902
caret包(Classification and Regression Training)是一系列函数的集合,它试图对创建预测模型的过程进行流程化。本系列将就数据预处理、特征选择、抽样、模型调参等进行介绍学习。 本文将就caret包中的数据预处理部分进行介绍学习。主要包括以下函数:model.ma ...
分类:
编程语言 时间:
2018-01-15 20:20:27
阅读次数:
5193
002.Python怎么学 把python当作一个工具,用到时候知道在那里找,知道这个库能做什么,用到的时候在查API,一定要动手能力和动手查东西的能力强 003人工智能的核心—机器学习 计算机视觉(人脸识别,神经网络),语音识别,自然语言处理发展特别快 收据收集可以通过爬虫爬取 特征选择转换成计算 ...
分类:
其他好文 时间:
2018-01-07 11:42:41
阅读次数:
172
目录 1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2.4 缺失值计算 2.5 数据变换 2.6 回顾3 特征选择 3.1 Filter 3.1.1 方差选择法 ...
分类:
其他好文 时间:
2017-12-23 17:24:05
阅读次数:
186
目录 什么是神经网络(Neural Networks) 特征选择 使用ID3算法生成决策树 使用C4.5算法生成决策树 使用CART算法生成决策树 预剪枝和后剪枝 应用:遇到连续与缺失值怎么办? 多变量决策树 Python代码(sklearn库) 什么是神经网络(Neural Networks) 引 ...
分类:
编程语言 时间:
2017-12-09 16:56:58
阅读次数:
283