码迷,mamicode.com
首页 >  
搜索关键字:泛化能力    ( 124个结果
结合Scikit-learn介绍几种常用的特征选择方法
作者:Edwin Jarvis 特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。 特征选择主要有两个功能: 减少特征数量、降维,使模型泛化能力更强,减少过拟合 增强对特征和特征值
分类:其他好文   时间:2016-02-11 00:29:01    阅读次数:474
统计学习
同类数据具有一定的统计规律性。随机变量->数据特征;概率分布->数据规律步骤如下: 过拟合——学习时选择的模型所包含的参数过多,以至于出现这一模型对已知数据预测得很好,但对未知数据预测得很差的现象。M次多项式函数拟合问题泛化能力——指学习方法对未知数据的预测能力。 选择经验风险与模型复杂度同时较.....
分类:其他好文   时间:2015-12-29 12:31:27    阅读次数:212
结合Scikit-learn介绍几种常用的特征选择方法
特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能:减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解拿到数据集,一个特征选择方法...
分类:其他好文   时间:2015-12-10 13:09:43    阅读次数:187
模式识别(1)
如何选择特征,画出密度曲线来判断,看哪些特征能更好地进行分类泛化: 概括地说,所谓泛化能力(generalization ability)是指机器学习算法对新鲜样本的适应能力。学习的目的是学到隐含在数据对背后的规律,对具有同一规律的学习集以外的数据,经过训练的网络也能给出合适的输出,该能力称为泛化....
分类:其他好文   时间:2015-09-15 16:12:15    阅读次数:174
机器学习 libsvm交叉验证与网格搜索(参数选择)
首先说交叉验证。 交叉验证(Cross validation)是一种评估统计分析、机器学习算法对独立于训练数据的数据集的泛化能力(generalize), 能够避免过拟合问题。 交叉验证一般要尽量满足: 1)训练集的比例要足够多,一般大于一半 2)训练集和测试集要均匀抽样 交叉验证主要分成以下几类: 1)Double cross-validation Double cross...
分类:其他好文   时间:2015-08-27 23:03:09    阅读次数:814
台大机器学习基石课程之机器学习基本原理和概念
机器学习中非常重要的四个基础概念,总结自台大机器学习基石课程,解释机器为什么能够学习.........
分类:其他好文   时间:2015-08-16 18:26:00    阅读次数:154
如何进行特征选择?
特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。 特征选择主要有两个功能: 减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解    拿到数据集,一个特征选择方法,往往很难同时完成这两个目的。通常情况下,我们经常不管三七二十一,选择...
分类:其他好文   时间:2015-08-04 19:29:04    阅读次数:312
常用特征选取算法
特征选取是机器学习领域非常重要的一个方向。主要有两个功能:(1)减少特征数量、降维,使模型泛化能力更强,减少过拟合(2)增强度特征和特征值之间的理解几种常用的特征选取方法一、去掉取值变化小的特征考察某个特征下,样本的方差值,可以人为给定一个阈值,抛开那些小于这个阈值的特征。二、单变量特征选择单变量特...
分类:编程语言   时间:2015-06-11 18:49:59    阅读次数:256
径向基(RBF)神经网络
RBF网络能够逼近任意非线性的函数。可以处理系统内难以解析的规律性,具有很好的泛化能力,并且具有较快的学 习速度。当网络的一个或多个可调参数(权值或阈值)对任何一个输出都有影响时,这样的网络称为全局逼近网络。 由于对于每次输入,网络上的每一个权值都要调整,从而导致全局逼近网络的学习速度很慢,比如BP网络。如果对于 输入空间的某个局部区域只有少数几个连接权值影响输出,则该网络称为局部逼近网络,...
分类:其他好文   时间:2015-06-02 17:54:08    阅读次数:191
L2正则化方法
在机器学习中,无论是分类还是回归,都可能存在由于特征过多而导致的过拟合问题。当然解决的办法有     (1)减少特征,留取最重要的特征。   (2)惩罚不重要的特征的权重。   但是通常情况下,我们不知道应该惩罚哪些特征的权重取值。通过正则化方法可以防止过拟合,提高泛化能力。   先来看看L2正则化方法。对于之前梯度下降讲到的损失函数来说,在代价函数后面加上一个正则化项,得到...
分类:其他好文   时间:2015-05-30 13:35:15    阅读次数:183
124条   上一页 1 ... 9 10 11 12 13 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!