在集成学习之Adaboost算法原理小结中,我们对Adaboost的算法原理做了一个总结。这里我们就从实用的角度对scikit-learn中Adaboost类库的使用做一个小结,重点对调参的注意事项做一个总结。# 一、Adaboost类库概述 scikit-learn中Adaboost类库比较直接,... ...
分类:
其他好文 时间:
2019-07-19 19:16:49
阅读次数:
119
在BIRCH聚类算法原理中,我们对BIRCH聚类算法的原理做了总结,本文就对scikit-learn中BIRCH算法的使用做一个总结。# 一、scikit-learn之BIRCH类 在scikit-learn中,BIRCH类实现了原理篇里讲到的基于特征树CF Tree的聚类。因此要使用BIRCH来聚... ...
分类:
其他好文 时间:
2019-07-19 19:15:36
阅读次数:
114
scikit-learn对于线性回归提供了比较多的类库,这些类库都可以用来做线性回归分析,本文就对这些类库的使用做一个总结,重点讲述这些线性回归算法库的不同和各自的使用场景。 线性回归的目的是要得到输出向量\(\mathbf{Y}\)和输入特征\(\mathbf{X}\)之间的线性关系,求出线性回归... ...
分类:
编程语言 时间:
2019-07-19 19:13:49
阅读次数:
96
对于想深入了解线性回归的童鞋,这里给出一个完整的例子,详细学完这个例子,对用scikit-learn来运行线性回归,评估模型不会有什么问题了。# 一、获取数据,定义问题 没有数据,当然没法研究机器学习啦。:) 这里我们用UCI大学公开的机器学习数据来跑线性回归。 数据的介绍在这:http://arc... ...
分类:
其他好文 时间:
2019-07-19 19:12:46
阅读次数:
91
之前对决策树的算法原理做了总结,包括决策树算法原理(上)和决策树算法原理(下)。今天就从实践的角度来介绍决策树算法,主要是讲解使用scikit-learn来跑决策树算法,结果的可视化以及一些参数调参的关键点。# 一、1.scikit-learn决策树算法类库介绍 scikit-learn决策树算法类... ...
分类:
编程语言 时间:
2019-07-19 19:12:06
阅读次数:
111
在梯度提升树(GBDT)原理小结中,我们对GBDT的原理做了总结,本文我们就从scikit-learn里GBDT的类库使用方法作一个总结,主要会关注调参中的一些要点。# 一、1.scikit-learn GBDT类库概述 在sacikit-learn中,GradientBoostingClassif... ...
分类:
其他好文 时间:
2019-07-19 19:07:58
阅读次数:
97
在DBSCAN密度聚类算法中,我们对DBSCAN聚类算法的原理做了总结,本文就对如何用scikit-learn来学习DBSCAN聚类做一个总结,重点讲述参数的意义和需要调参的参数。# 一、scikit-learn中的DBSCAN类 在scikit-learn中,DBSCAN算法类为sklearn.c... ...
分类:
数据库 时间:
2019-07-19 19:06:48
阅读次数:
126
在线性判别分析LDA原理总结中,我们对LDA降维的原理做了总结,这里我们就对scikit-learn中LDA的降维使用做一个总结。# 一、1.对scikit-learn中LDA类概述 在scikit-learn中, LDA类是sklearn.discriminant_analysis.LinearD... ...
分类:
其他好文 时间:
2019-07-19 19:05:26
阅读次数:
98
在学习机器学习算法的过程中,我们经常需要数据来验证算法,调试参数。但是找到一组十分合适某种特定算法类型的数据样本却不那么容易。还好numpy, scikit-learn都提供了随机数据生成的功能,我们可以自己生成适合某一种模型的数据,用随机数据来做清洗,归一化,转换,然后选择模型与算法做拟合和预测。... ...
分类:
编程语言 时间:
2019-07-19 19:04:43
阅读次数:
90
在主成分分析(PCA)原理总结中,我们对主成分分析(以下简称PCA)的原理做了总结,下面我们就总结下如何使用scikit-learn工具来进行PCA降维。# 一、scikit-learn PCA类介绍 在scikit-learn中,与PCA相关的类都在sklearn.decomposition包中。... ...
分类:
其他好文 时间:
2019-07-19 19:03:33
阅读次数:
95