在线性判别分析LDA原理总结中,我们对LDA降维的原理做了总结,这里我们就对scikit-learn中LDA的降维使用做一个总结。# 一、1.对scikit-learn中LDA类概述 在scikit-learn中, LDA类是sklearn.discriminant_analysis.LinearD... ...
分类:
其他好文 时间:
2019-07-19 19:05:26
阅读次数:
98
在学习机器学习算法的过程中,我们经常需要数据来验证算法,调试参数。但是找到一组十分合适某种特定算法类型的数据样本却不那么容易。还好numpy, scikit-learn都提供了随机数据生成的功能,我们可以自己生成适合某一种模型的数据,用随机数据来做清洗,归一化,转换,然后选择模型与算法做拟合和预测。... ...
分类:
编程语言 时间:
2019-07-19 19:04:43
阅读次数:
90
在主成分分析(PCA)原理总结中,我们对主成分分析(以下简称PCA)的原理做了总结,下面我们就总结下如何使用scikit-learn工具来进行PCA降维。# 一、scikit-learn PCA类介绍 在scikit-learn中,与PCA相关的类都在sklearn.decomposition包中。... ...
分类:
其他好文 时间:
2019-07-19 19:03:33
阅读次数:
95
在FP Tree算法原理总结和PrefixSpan算法原理总结中,我们对FP Tree和PrefixSpan这两种关联算法的原理做了总结,这里就从实践的角度介绍如何使用这两个算法。由于scikit-learn中没有关联算法的类库,而Spark MLlib有,本文的使用以Spark MLlib作为使用... ...
分类:
编程语言 时间:
2019-07-19 18:55:36
阅读次数:
123
在局部线性嵌入(LLE)原理总结中,我们对流形学习中的局部线性嵌入(LLE)算法做了原理总结。这里我们就对scikit-learn中流形学习的一些算法做一个介绍,并着重对其中LLE算法的使用方法做一个实践上的总结。# 一、1.scikit-learn流形学习库概述 在scikit-learn中,流形... ...
分类:
其他好文 时间:
2019-07-19 18:44:29
阅读次数:
85
在Bagging与随机森林算法原理小结中,我们对随机森林(Random Forest, 以下简称RF)的原理做了总结。本文就从实践的角度对RF做一个总结。重点讲述scikit-learn中RF的调参注意事项,以及和GBDT调参的异同点。# 一、scikit-learn随机森林类库概述 在scikit... ...
分类:
其他好文 时间:
2019-07-19 18:44:10
阅读次数:
80
在K-Means聚类算法原理中,我们对K-Means的原理做了总结,本文我们就来讨论用scikit-learn来学习K-Means聚类。重点讲述如何选择合适的k值。# 一、K-Means类概述 在scikit-learn中,包括两个K-Means的算法,一个是传统的K-Means算法,对应的类是KM... ...
分类:
其他好文 时间:
2019-07-19 18:40:13
阅读次数:
76
之前在逻辑回归原理小结这篇文章中,对逻辑回归的原理做了小结。这里接着对scikit-learn中逻辑回归类库的我的使用经验做一个总结。重点讲述调参中要注意的事项。# 一、概述 在scikit-learn中,与逻辑回归有关的主要是这3个类。LogisticRegression, LogisticReg... ...
分类:
其他好文 时间:
2019-07-19 18:39:33
阅读次数:
122
很多朋友想学习机器学习,却苦于环境的搭建,这里给出windows上scikit-learn研究开发环境的搭建步骤。# 一、Python的安装 python有2.x和3.x的版本之分,但是很多好的机器学习python库都不支持3.x,因此,推荐安装2.7版本的python。当前最新的python是2.... ...
在K近邻法(KNN)原理小结这篇文章,我们讨论了KNN的原理和优缺点,这里我们就从实践出发,对scikit-learn 中KNN相关的类库使用做一个小结。主要关注于类库调参时的一个经验总结。# 一、scikit-learn 中KNN相关的类库概述 在scikit-learn 中,与近邻法这一大类相关... ...
分类:
其他好文 时间:
2019-07-19 18:34:24
阅读次数:
97