1 # -*- coding: utf-8 -*- 2 # __author__ = 'JieYao' 3 from biocluster.agent import Agent 4 from biocluster.tool import Tool 5 import os 6 import types ...
分类:
其他好文 时间:
2016-08-18 18:28:09
阅读次数:
183
最近看sklearn的源码比较多,好记性不如烂笔头啊,还是记一下吧。
整体:
)实现的代码非常好,模块化、多继承等写的很清楚。
)predict功能通常在该模型的直接类中实现,fit通常在继承的类中实现,方便不同的子类共同引用。
随机森林 和 GBDT
)RandomForest的bootstrap是又放回的;GBDT则是无放回的。...
分类:
其他好文 时间:
2016-07-13 16:56:49
阅读次数:
1890
思路梳理: 决策树 |————Bagging[bootstrap抽样、投票分类] |————Boosting[bootstrap抽样、分错元组权重上升、分类器上也加权重进而判断] |————RandomForest[bootstrap抽样、n个特征找少量的建树分类、Cart算法(基尼系数、不剪枝), ...
分类:
其他好文 时间:
2016-06-26 22:31:03
阅读次数:
148
Ranklib部分源码分析(LambdaMART+RandomForest部分)...
分类:
其他好文 时间:
2016-06-16 15:02:17
阅读次数:
724
昨天我使用Spark MLlib的朴素贝叶斯进行手写数字识别,准确率在0.83左右,今天使用了RandomForest来训练模型,并进行了参数调优。首先来说说RandomForest 训练分类器时使用到的一些参数:
numTrees:随机森林中树的数目。增大这个数值可以减小预测的方差,提高预测试验的准确性,训练时间会线性地随之增长。
maxDepth:随机森林中每棵树的深度。增加这个值可以是模型更具...
分类:
其他好文 时间:
2016-05-13 14:58:40
阅读次数:
296
library(randomForest)model.forest<-randomForest(Species~.,data=iris)pre.forest<-predict(model.forest,iris)table(pre.forest,iris$Species)library(rpart)...
分类:
编程语言 时间:
2015-11-01 15:17:44
阅读次数:
1437
Introduction决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快速,模型容易展示(容易将得到的决策树做成图片展示出来)等。但是同时,单决策树又有一些不好的地方,比如说容易over-fitting,虽然有一些方法,如剪枝可以减少这种情况,但是还是不太理想。模型组合(比如说有Boosting,Bagging等)与决策树相关的算法比较多,如randomForest、Ad...
分类:
编程语言 时间:
2015-08-29 12:43:17
阅读次数:
427
组合模型组合模型一般要比单个算法要好,下面简单的介绍下Bootstraping, Bagging, Boosting, AdaBoost, RandomForest 和Gradient boosting这些组合型算法.1.BootstrapingBootstraping: 名字来自成语“pull up by your own bootstraps”,意思就是依靠你自己的资源,称为自助法,它是一种有放...
分类:
编程语言 时间:
2015-07-24 22:39:31
阅读次数:
497
library(randomForest)
data(iris)
set.seed(100)
ind<-sample(2,nrow(iris),replace=TRUE,prob=c(0.7,0.3))#对数据分成两部分,70%训练数据,30%检测数据/
traindata<-iris[ind==1,]
testdata<-iris[ind==2,]
iris.rf=randomForest(Species~.,iris[ind==1,],ntree=5..
分类:
编程语言 时间:
2015-06-02 15:31:50
阅读次数:
689
引言 之前了解到决策树在选择最好的特征进行数据集的划分就说到这种方法可以用来进行特征选择,然后看了breiman主页上相关的介绍,觉得这不愧是权威啊,不愧是随机森林算法的提出者,讲的很清楚,网址如下 http://www.stat.berkeley.edu/~breiman/RandomForest...
分类:
其他好文 时间:
2015-04-28 22:32:08
阅读次数:
143