摘要:基于检测的自适应跟踪已经被广泛研究了且前景很好。这些追踪器的关键理念是如何训练一个在线有识别力的分类器,这个分类器可以把一个对象从局部背景中分离出来。利用从检测目标位置附近的当前帧中提取的正样本和负样本不断更新分类器。然而,如果检测不准确,样本可能提取的不太准确,从而导致视觉漂移。最近,基于跟踪的多实例学习(MIL)已经在某些程度上提出了一些解决这些问题的办法。它将样本放入正负包中,然后通过最...
分类:
其他好文 时间:
2016-07-01 16:24:47
阅读次数:
154
关于特征工程(Feature Engineering),已经是很古老很常见的话题了,坊间常说:“数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已”。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键。纵观Kaggle、KDD等国内外大大小小的比赛,每个竞赛的冠军其实并没有用到很高深的算法,大多数都是在特征工程这个环节做出了出色的工作...
分类:
其他好文 时间:
2016-06-24 10:57:22
阅读次数:
838
特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。 特征选择主要有两个功能: 拿到数据集,一个特征选择方法,往往很难同时完成这两个目的。通常情况下,我们经常不管三七二十一,选择一种 ...
分类:
其他好文 时间:
2016-06-22 12:46:42
阅读次数:
203
特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。
特征选择主要有两个功能:
减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解...
分类:
其他好文 时间:
2016-06-12 03:17:06
阅读次数:
324
Lasso Regression标签(空格分隔): 监督学习在数据挖掘和机器学习算法的模型建立之初,为了尽量的减少因缺少重要变量而出现的模型偏差问题,我们通常会尽可能的多的选择自变量。但是在实际建模的过程中,通常又需要寻找 对响应变量具有解释能力的自变量子集,以提高模型的解释能力与预测精度,这个过程称为特征选择。...
分类:
其他好文 时间:
2016-06-12 02:56:22
阅读次数:
2307
决策树 决策树是一种基本的分类与回归方法,通常包括三个步骤:特征选择、决策树的生成和决策树的修剪。 树由节点和有向边组成,节点分内部节点(特征或属性)和叶节点(表示一个类) 用决策树分类,从根节点开始,对实例的某一特征进行测试,根据测试结果,将实例分配到其子节点。重复上述过程,直到达到叶节点。 首先 ...
分类:
编程语言 时间:
2016-06-11 09:18:51
阅读次数:
314
特征选择实质上包括两个部分:特征词的选择和特征词权重的计算。 特征词选择的方法分为有监督的方法和无监督的方法。 有监督的方法包括IG和CHI,无监督的方法包括Document Frequency (DF), Term Strength (TS)和 Entropy-based (En)。 可以参考ht ...
分类:
其他好文 时间:
2016-06-08 15:20:50
阅读次数:
1314
一、决策树的生成算法 基本的决策树生成算法主要有ID3和C4.5, 它们生成树的过程大致相似,ID3是采用的信息增益作为特征选择的度量,而C4.5采用信息增益比。构建过程如下:
从根节点开始,计算所有可能的特征的信息增益(信息增益比),选择计算结果最大的特征。
根据算出的特征建立子节点,执行第一步,直到所有特征的信息增益(信息增益比)很小或者没有特征可以选择为止。...
分类:
其他好文 时间:
2016-05-13 01:33:21
阅读次数:
191
在各种模型训练,特征选择相关的算法中,大量涉及到数据归一化的问题。比如最常见的情况是计算距离,如果不同维度之间的取值范围不一样,比如feature1的取值范围是[100,200],feature2的取值范围是[1,2],如果数据不做归一化处理,会造成feature1在距离计算中占压倒性的优势,feature2完全体现不出来作用。而数据做归一化处理以后,会让各个不同特征对距离计算的贡献大致相同,从而避...
分类:
其他好文 时间:
2016-05-12 17:52:49
阅读次数:
191
目录 1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 无量纲化与正则化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2.4 缺失值计算 2.5 数据变换 2.6 回顾3 特征选择 3.1 Filter 3.1.1 方差选择法 ...
分类:
编程语言 时间:
2016-05-02 18:31:47
阅读次数:
476