sklearn库 sklearn是scikit-learn的简称,是一个基于Python的第三方模块。sklearn库集成了一些常用的机器学习方法,在进行机器学习任务时,并不需要实现算法,只需要简单的调用sklearn库中提供的模块就能完成大多数的机器学习任务。 sklearn库是在Numpy、Sc ...
分类:
其他好文 时间:
2017-06-04 12:53:17
阅读次数:
484
环境:Ubuntu 16.04 64bit 1. 安装Anaconda Anaconda 是 Python 的一个科学计算发行版,内置了数百个Python经常会使用的库,也包括了许多机器学习和数据挖掘依赖的库,包括 Scikit-learn、NumPy、SciPy 和 Pandas等,其中可能有一些 ...
分类:
其他好文 时间:
2017-06-02 11:31:25
阅读次数:
1746
在机器学习和数据挖掘的应用中,scikit-learn是一个功能强大的python包。在数据量不是过大的情况下,可以解决大部分问题。学习使用scikit-learn的过程中,我自己也在补充着机器学习和数据挖掘的知识。这里根据自己学习sklearn的经验,我做一个总结的笔记。另外,我也想把这篇笔记一直 ...
分类:
其他好文 时间:
2017-06-01 23:46:03
阅读次数:
599
參考:http://scikit-learn.org/stable/modules/learning_curve.html estimator's generalization error can be decomposed in terms ofbias, variance and noise. ...
分类:
其他好文 时间:
2017-05-30 15:41:45
阅读次数:
295
參考:http://scikit-learn.org/stable/model_selection.html 有待翻译,敬请期待: 3.1. Cross-validation: evaluating estimator performance 翻译文章參考:http://blog.csdn.net/ ...
分类:
其他好文 时间:
2017-05-30 13:07:30
阅读次数:
243
http://scikit-learn.org/stable/auto_examples/plot_isotonic_regression.html#example-plot-isotonic-regression-py 代码就不贴了,參考上面链接。 看代码,给人的直观感受类似于CART,具有分段回 ...
分类:
其他好文 时间:
2017-05-29 22:22:51
阅读次数:
249
对于想深入了解线性回归的童鞋,这里给出一个完整的例子,详细学完这个例子,对用scikit-learn来运行线性回归,评估模型不会有什么问题了。 1. 获取数据,定义问题 没有数据,当然没法研究机器学习啦。:) 这里我们用UCI大学公开的机器学习数据来跑线性回归。 数据的介绍在这: http://ar ...
分类:
其他好文 时间:
2017-05-28 23:51:16
阅读次数:
458
很多朋友想学习机器学习,却苦于环境的搭建,这里给出windows上scikit-learn研究开发环境的搭建步骤。 Step 1. Python的安装 python有2.x和3.x的版本之分,但是很多好的机器学习python库都不支持3.x,因此,推荐安装2.7版本的python。当前最新的pyth ...
在LDA模型原理篇我们总结了LDA主题模型的原理,这里我们就从应用的角度来使用scikit-learn来学习LDA主题模型。除了scikit-learn, 还有spark MLlib和gensim库也有LDA主题模型的类库,使用的原理基本类似,本文关注于scikit-learn中LDA主题模型的使用 ...
分类:
其他好文 时间:
2017-05-26 15:55:42
阅读次数:
1445
作者:桂。 时间:2017-05-23 06:37:31 链接:http://www.cnblogs.com/xingshansi/p/6892317.html 前言 仍然是python库函数scikit-learn的学习笔记,内容Regression-1.2Linear and Quadratic ...
分类:
其他好文 时间:
2017-05-23 11:12:43
阅读次数:
3782