一、R2 决定系数(拟合优度) 它是表征回归方程在多大程度上解释了因变量的变化,或者说方程对观测值的拟合程度如何。 因为如果单纯用残差平方和会受到你因变量和自变量绝对值大小的影响,不利于在不同模型之间进行相对比较.而用拟合优度就可以解决这个问题。例如一个模型中的因变量:10000、20000….., ...
分类:
其他好文 时间:
2017-06-26 12:40:53
阅读次数:
152
http://scikit-learn.org/stable/modules/feature_extraction.html 4.2节内容太多,因此将文本特征提取单独作为一块。 1、the bag of words representation 将raw data表示成长度固定的数字特征向量。sci ...
分类:
其他好文 时间:
2017-06-24 21:04:00
阅读次数:
238
?? 内容概要¶ 训练集/測试集切割用于模型验证的缺点K折交叉验证是怎样克服之前的不足交叉验证怎样用于选择调节參数、选择模型、选择特征改善交叉验证 1. 模型验证回想¶ 进行模型验证的一个重要目的是要选出一个最合适的模型,对于监督学习而言,我们希望模型对于未知数据的泛化能力强,所以就须要模型验证这一 ...
分类:
其他好文 时间:
2017-06-23 14:14:54
阅读次数:
1121
前言 Numpy是一个开源的Python科学计算库,它是python科学计算库的基础库,许多其他著名的科学计算库如Pandas,Scikit-learn等都要用到Numpy库的一些功能。 本文主要内容如下: Numpy数组对象 创建ndarray数组 Numpy的数值类型 ndarray数组的属性 ...
分类:
编程语言 时间:
2017-06-18 13:28:39
阅读次数:
4701
一、常用链接: 1.Python官网:https://www.python.org/2.各种库的whl离线安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/#scikit-learn 一、常用链接: 3.数据分析常用库的离线安装包(pip+wheels)(百 ...
分类:
编程语言 时间:
2017-06-13 12:47:12
阅读次数:
240
http://scikit-learn.org/stable/modules/ensemble.html#gradient-tree-boosting https://m.th7.cn/show/10/201702/1106817.html http://blog.csdn.net/sb199312 ...
分类:
其他好文 时间:
2017-06-13 10:08:24
阅读次数:
244
前言: 本系列是在作者学习《机器学习系统设计》([美] WilliRichert)过程中的思考与实践,全书通过Python从数据处理。到特征project,再到模型选择,把机器学习解决这个问题的过程一一呈现。书中设计的源码和数据集已上传到我的资源:http://download.csdn.net/d ...
分类:
其他好文 时间:
2017-06-10 19:32:43
阅读次数:
286
引用自:http://blog.sina.com.cn/s/blog_77dd91730100vofv.html 刚进乔治布朗的College English就有讲到MLA、APA等引用文书规格。教授们向来重视知识版权并再三强调涉嫌抄袭的严重性,所以在引用前人文章论点数据后都要好好地做referen ...
分类:
其他好文 时间:
2017-06-09 22:29:15
阅读次数:
773
linux,numpy,pandas,scipy,matplotlib,scikit-learn ...
分类:
系统相关 时间:
2017-06-07 17:03:25
阅读次数:
295
从网上看到一篇总结的很不错的sklearn使用文档,备份勿忘。 引言 对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。 在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python在各方面都相对胜出一些,这是因为scikit-learn ...
分类:
其他好文 时间:
2017-06-07 10:08:33
阅读次数:
191