processhttp://scikit-learn.org/dev/tutorial/basic/tutorial.htmlcodehttp://scikit-learn.org/dev/auto_examples/classification/plot_digits_classification...
分类:
其他好文 时间:
2015-05-14 13:38:47
阅读次数:
145
鸢尾花数据是一个简易有趣的数据集。这个数据集来源于科学家在一岛上找到一种花的三种不同亚类别,分别叫做setosa,versicolor,virginica。但是这三个种类并不是很好分辩,所以他们又从花萼长度,花萼宽度,花瓣长度,花瓣宽度这四个角度测量不同的种类用于定量分析。基于这四个特征,这些数据成了一个多重变量分析的数据集。下面,我们就利用sklearn试着从不同的角度去分析一下这个数据集。
...
分类:
编程语言 时间:
2015-04-30 22:00:05
阅读次数:
1003
这是一个手写数字的识别实验,是一个sklearn在现实中使用的案例。原例网址里有相应的说明和代码。
首先实验的数据量为1797,保存在sklearn的dataset里。我们可以直接从中获取。每一个数据是有image,target两部分组成。Image是一个尺寸为8*8图像,target是图像的类别,在我们看来类别就是手写的数字0-9.
代码一开始,将数据载入。
# Standard ...
分类:
编程语言 时间:
2015-04-28 14:13:48
阅读次数:
716
Python scikit-learn 学习笔记—环境篇
近来闲来无事,也面临毕业季。这段时间除了做毕业设计,和同学再多吃几顿饭玩玩游戏之外。剩下的时间浪费着实可惜。想着以后研究生还要读三年,不如现在多看看书或者别的资料。正逢最近参加阿里巴巴大数据比赛,趁机学了一阵Python 数据挖掘包scikit learn,估计以后说不定会用到,所以先行记录下来,分享给大家。
先说...
分类:
编程语言 时间:
2015-04-28 11:50:03
阅读次数:
145
注:原文代码链接http://scikit-learn.org/stable/auto_examples/text/mlcomp_sparse_document_classification.html运行结果为:Loading 20 newsgroups training set... 20 new...
分类:
其他好文 时间:
2015-04-25 18:13:29
阅读次数:
205
引言对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。
在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python在各方面都相对胜出一些,这是因为scikit-learn库实现了很多机器学习算法。加载数据(Data Loading)我们假设输入时一个特征矩阵或者csv文件。
首先,数据应该被载入内存中。
scikit-learn的...
分类:
其他好文 时间:
2015-04-19 11:37:16
阅读次数:
241
preface:最近《生物信息学》多次谈到AUC,ROC这两个指标,正在做的project,要求画ROC曲线,sklearn里面有相应的函数,故学习学习。
AUC:
ROC:
具体使用参考sklearn:
http://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_curve.html
http://sciki...
分类:
编程语言 时间:
2015-04-17 18:21:40
阅读次数:
2029
1.import matplotlib.pyplot as pltplt.scatter(x,y)先查scikit-learn安装在哪个python版本里面,查找之后就进入python根目录下如 Python27\Lib\site-packages\matplotlib 目录下 这样就找到了那个py...
分类:
其他好文 时间:
2015-04-12 16:10:43
阅读次数:
222
1.http://scikit-learn.org/stable/ 官网:关于scikit-learn介绍等2.http://stackoverflow.com/questions/tagged/scikit-learn stackoverflow下使用scikit-learn出现错误的解决方...
分类:
其他好文 时间:
2015-04-12 16:03:10
阅读次数:
111