搜索关键字：泛化能力，搜索到124个结果！码迷,mamicode.com！

结合Scikit-learn介绍几种常用的特征选择方法

作者：Edwin Jarvis 特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能，更能帮助我们理解数据的特点、底层结构，这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能：减少特征数量、降维，使模型泛化能力更强，减少过拟合增强对特征和特征值

分类：其他好文时间：2016-02-11 00:29:01 阅读次数：474

统计学习

同类数据具有一定的统计规律性。随机变量->数据特征；概率分布->数据规律步骤如下：过拟合——学习时选择的模型所包含的参数过多，以至于出现这一模型对已知数据预测得很好，但对未知数据预测得很差的现象。M次多项式函数拟合问题泛化能力——指学习方法对未知数据的预测能力。选择经验风险与模型复杂度同时较.....

分类：其他好文时间：2015-12-29 12:31:27 阅读次数：212

结合Scikit-learn介绍几种常用的特征选择方法

特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能，更能帮助我们理解数据的特点、底层结构，这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能：减少特征数量、降维，使模型泛化能力更强，减少过拟合增强对特征和特征值之间的理解拿到数据集，一个特征选择方法...

分类：其他好文时间：2015-12-10 13:09:43 阅读次数：187

模式识别(1)

如何选择特征，画出密度曲线来判断，看哪些特征能更好地进行分类泛化: 概括地说，所谓泛化能力（generalization ability）是指机器学习算法对新鲜样本的适应能力。学习的目的是学到隐含在数据对背后的规律，对具有同一规律的学习集以外的数据，经过训练的网络也能给出合适的输出，该能力称为泛化....

分类：其他好文时间：2015-09-15 16:12:15 阅读次数：174

机器学习 libsvm交叉验证与网格搜索（参数选择）

首先说交叉验证。交叉验证（Cross validation）是一种评估统计分析、机器学习算法对独立于训练数据的数据集的泛化能力（generalize），能够避免过拟合问题。交叉验证一般要尽量满足： 1）训练集的比例要足够多，一般大于一半 2）训练集和测试集要均匀抽样交叉验证主要分成以下几类： 1）Double cross-validation Double cross...

分类：其他好文时间：2015-08-27 23:03:09 阅读次数：814

台大机器学习基石课程之机器学习基本原理和概念

机器学习中非常重要的四个基础概念，总结自台大机器学习基石课程，解释机器为什么能够学习.........

分类：其他好文时间：2015-08-16 18:26:00 阅读次数：154

如何进行特征选择？

特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能，更能帮助我们理解数据的特点、底层结构，这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能：减少特征数量、降维，使模型泛化能力更强，减少过拟合增强对特征和特征值之间的理解拿到数据集，一个特征选择方法，往往很难同时完成这两个目的。通常情况下，我们经常不管三七二十一，选择...

分类：其他好文时间：2015-08-04 19:29:04 阅读次数：312

常用特征选取算法

特征选取是机器学习领域非常重要的一个方向。主要有两个功能：（1）减少特征数量、降维，使模型泛化能力更强，减少过拟合（2）增强度特征和特征值之间的理解几种常用的特征选取方法一、去掉取值变化小的特征考察某个特征下，样本的方差值，可以人为给定一个阈值，抛开那些小于这个阈值的特征。二、单变量特征选择单变量特...

分类：编程语言时间：2015-06-11 18:49:59 阅读次数：256

径向基（RBF）神经网络

RBF网络能够逼近任意非线性的函数。可以处理系统内难以解析的规律性，具有很好的泛化能力，并且具有较快的学习速度。当网络的一个或多个可调参数（权值或阈值）对任何一个输出都有影响时，这样的网络称为全局逼近网络。由于对于每次输入，网络上的每一个权值都要调整，从而导致全局逼近网络的学习速度很慢，比如BP网络。如果对于输入空间的某个局部区域只有少数几个连接权值影响输出，则该网络称为局部逼近网络，...

分类：其他好文时间：2015-06-02 17:54:08 阅读次数：191

L2正则化方法

在机器学习中，无论是分类还是回归，都可能存在由于特征过多而导致的过拟合问题。当然解决的办法有（1）减少特征，留取最重要的特征。（2）惩罚不重要的特征的权重。但是通常情况下，我们不知道应该惩罚哪些特征的权重取值。通过正则化方法可以防止过拟合，提高泛化能力。先来看看L2正则化方法。对于之前梯度下降讲到的损失函数来说，在代价函数后面加上一个正则化项，得到...

分类：其他好文时间：2015-05-30 13:35:15 阅读次数：183