我是在差分隐私下看到的,新解决方案的可用性肯定小于原有解决方案的可用性,也就是说信息的后续处理只会降低所拥有的信息量。 那么如果这么说的话为什么还要做特征工程呢,这是因为该不等式有一个巨大的前提就是数据处理方法无比的强大,比如很多的样本要分类,我们做特征提取后,SVM效果很好 ,但是如果用DNN之类 ...
分类:
其他好文 时间:
2017-11-02 13:17:06
阅读次数:
165
1.简介 逻辑回归作为机器学习中,大家最耳熟能详一种算法。在工业界当中也有非常广泛的应用。主要有几个原因: 逻辑回归的形式非常的简单,如果特征工程做的非常好,效果会比较的不错。最为重要的是特征工程这件事情可以大家并行开发,可以大大加快开发的速度。 逻辑回归的训练速度会比较块,并且逻辑回归的分布式优化 ...
分类:
其他好文 时间:
2017-10-26 19:03:49
阅读次数:
2829
课程介绍 信用风险评分卡为信用风险管理提供了一种有效的、经验性的解决方法,是消费信贷管理中广泛应用的技术手段。 评分卡是信用风险评估领域常见的建模方法。评分卡并不加单对应于某一种机器学习算法,而是一种通用的建模框架,讲原始数据通过分箱后进行特征工程变换,继而应用于线性模型进行建模的一种方法。 课时列 ...
分类:
其他好文 时间:
2017-10-09 16:49:49
阅读次数:
175
https://www.jiqizhixin.com/articles/2017-09-12-5 By 蒋思源2017年9月12日 09:54 时序数据经常出现在很多领域中,如金融、信号处理、语音识别和医药。传统的时序问题通常首先需要人力进行特征工程,才能将预处理的数据输入到机器学习算法中。并且这种 ...
分类:
其他好文 时间:
2017-09-15 12:06:28
阅读次数:
8683
PAI简介 阿里云机器学习PAI(Platform of Artificial Intelligence)是一款一站式的机器学习平台,包含数据预处理、特征工程、常规机器学习算法、深度学习框架、模型的评估以及预测这一整套机器学习相关服务。由于目前PAI还属于公测阶段,所以是不收费的。但是PAI底层依赖 ...
分类:
其他好文 时间:
2017-09-13 01:39:42
阅读次数:
296
目录 1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2.4 缺失值计算 2.5 数据变换 2.6 回顾3 特征选择 3.1 Filter 3.1.1 方差选择法 ...
分类:
其他好文 时间:
2017-09-11 19:45:07
阅读次数:
229
特征表达 接下来要谈到的特征工程类型虽然简单却影响巨大。我们将其称为特征表达。 你的数据并不一定总是理想格式。你需要考虑是否有必要通过另一种形式进行特征表达以获取有用信息。 日期与时间特征: 我们假设你拥有purchase_datetime特征。从中提取purchase_day_of_week与pu ...
分类:
其他好文 时间:
2017-08-09 21:10:41
阅读次数:
2206
http://blog.csdn.net/wangyibo0201/article/details/51705966 在数据挖掘方面,经常需要在做特征工程和模型训练之前对数据进行清洗,剔除无效数据和异常数据。异常检测也是数据挖掘的一个方向,用于反作弊、伪基站、金融诈骗等领域。 异常检测方法,针对不同 ...
分类:
编程语言 时间:
2017-08-04 20:34:39
阅读次数:
265
传统机器学习依赖良好的特征工程。深度学习解决有效特征难人工提取问题。无监督学习,不需要标注数据,学习数据内容组织形式,提取频繁出现特征,逐层抽象,从简单到复杂,从微观到宏观。 稀疏编码(Sparse Coding),基本结构组合。自编码器(AutoEncoder),用自身高阶特征编码自己。期望输入/ ...
分类:
其他好文 时间:
2017-07-10 00:33:22
阅读次数:
283
导读: 分类问题是机器学习应用中的常见问题,而二分类问题是其中的典型,例如垃圾邮件的识别。本文基于UCI机器学习数据库中的银行营销数据集,从对数据集进行探索,数据预处理和特征工程,到学习模型的评估与选择,较为完整的展示了解决分类问题的大致流程。文中包含了一些常见问题的处理方式,例如缺失值的处理、非数 ...
分类:
其他好文 时间:
2017-07-01 12:43:10
阅读次数:
419