缺失值填充之后,就要对其他格式有问题的属性进行处理了。比如Sex Embarked这些属性的值都是字符串类型的,而scikit learn中的模型都只能处理数值型的数据,需要将这些原始的字符串类型的数据转为数值型数据。所有数据通常可以分成两种类型:定量与定性。定量的属性(数值属性)通常蕴涵着可排序性...
分类:
其他好文 时间:
2015-03-20 23:44:48
阅读次数:
197
概述程序计数器,本地方法栈,虚拟机栈随线程而生,随线程而灭. Java堆和方法区则不一样,这部分内存分配和回收的都是动态的,垃圾收集器所关注的是这部分内存.判断对象是否是垃圾的算法JVM没有选用引用计数算法来管理内存,最主要的是引用计数很难解决对象之间相互循环引用的问题.JVM采用了可达性分析算法来判断对象是否能回收.用GC Roots对象作为起点,向下搜索,搜索走过的路劲称为引用链(referen...
分类:
编程语言 时间:
2015-03-19 10:15:47
阅读次数:
168
最近用来做实验,使用python时发现scikit-learn提供的库非常好用。因此,在电脑上果断下载安装:step1:sudo easy_install pipstep2:sudo pip install -U numpy scipy scikit-learnstep3:测试python -c "...
分类:
系统相关 时间:
2015-03-17 17:34:38
阅读次数:
1904
引入一个机器可以根据照片来辨别鲜花的品种吗?在机器学习角度,这其实是一个分类问题,即机器根据不同品种鲜花的数据进行学习,使其可以对未标记的测试图片数据进行分类。
这一小节,我们还是从scikit-learn出发,理解基本的分类原则,多动手实践。Iris数据集Iris flower数据集是1936年由Sir Ronald Fisher引入的经典多维数据集,可以作为判别分析(discriminant...
分类:
编程语言 时间:
2015-03-12 17:09:08
阅读次数:
197
目前,网上已有成千上万个Python包,但几乎没有人能够全部知道它们。单单PyPi上就有超过47000个包列表。 现在,越来越多的数据科学家开始使用Python,虽然他们从pandas,scikit-learn,numpy中获得了不少好处,但我仍想向他们介绍一些年长且非常实用的Python库。在.....
分类:
编程语言 时间:
2015-03-10 11:37:41
阅读次数:
182
import sklearn报错:Traceback (most recent call last): File "", line 1, in import sklearn File "D:\Python27\lib\site-packages\scikit_learn-0.15.2-py...
分类:
其他好文 时间:
2015-03-08 06:43:24
阅读次数:
1454
目前,网上已有成千上万个Python包,但几乎没有人能够全部知道它们。单单PyPi上就有超过47000个包列表。现在,越来越多的数据科学家开始使用Python,虽然他们从pandas,scikit-learn,numpy中获得了不少好处,但我仍想向他们介绍一些年长且非常实用的Python库。在本文中...
分类:
编程语言 时间:
2015-03-03 20:28:21
阅读次数:
190
Model:表与表之间的关系:hasOne一对一( $fields, $referenceModel, $referencedFields : 当前表中的字段, 对应关系模型, 对应关系模型中表的字字段 )hasMany一对多 ( $fields, $referenceModel, $referen...
分类:
其他好文 时间:
2015-03-02 18:29:19
阅读次数:
817
代码是从:http://www.cplusplus.com/referen ... /?kw=set_unexpected找的// set_unexpected example#include // std::cerr#include // std::set_unexpec...
分类:
编程语言 时间:
2015-02-12 17:44:53
阅读次数:
278
爬虫:scrapy,beautifulsoup自然语言处理:nltk,Pattern(Google,Twitter,andWikipediaAPIs,awebcrawler,aHTMLDOMparser),结巴分词科学计算:NumPy,SciPy,matplotlib机器学习、数据挖掘:scikit-learn,pandas,MDP(neuralnetworks),PyBrain(neuralnetworks),Theano(GPU,deeplearn..
分类:
编程语言 时间:
2015-02-07 19:02:28
阅读次数:
185