码迷,mamicode.com
首页 >  
搜索关键字:randomforest    ( 34个结果
RandomForest&ROC
1 # -*- coding: utf-8 -*- 2 # __author__ = 'JieYao' 3 from biocluster.agent import Agent 4 from biocluster.tool import Tool 5 import os 6 import types ...
分类:其他好文   时间:2016-08-18 18:28:09    阅读次数:183
sklearn源码解析:ensemble模型 零碎记录;如何看sklearn代码,以tree的feature_importance为例
最近看sklearn的源码比较多,好记性不如烂笔头啊,还是记一下吧。 整体: )实现的代码非常好,模块化、多继承等写的很清楚。 )predict功能通常在该模型的直接类中实现,fit通常在继承的类中实现,方便不同的子类共同引用。 随机森林 和 GBDT )RandomForest的bootstrap是又放回的;GBDT则是无放回的。...
分类:其他好文   时间:2016-07-13 16:56:49    阅读次数:1890
分类 之_决策树
思路梳理: 决策树 |————Bagging[bootstrap抽样、投票分类] |————Boosting[bootstrap抽样、分错元组权重上升、分类器上也加权重进而判断] |————RandomForest[bootstrap抽样、n个特征找少量的建树分类、Cart算法(基尼系数、不剪枝), ...
分类:其他好文   时间:2016-06-26 22:31:03    阅读次数:148
Ranklib部分源码分析
Ranklib部分源码分析(LambdaMART+RandomForest部分)...
分类:其他好文   时间:2016-06-16 15:02:17    阅读次数:724
在Kaggle手写数字数据集上使用Spark MLlib的RandomForest进行手写数字识别
昨天我使用Spark MLlib的朴素贝叶斯进行手写数字识别,准确率在0.83左右,今天使用了RandomForest来训练模型,并进行了参数调优。首先来说说RandomForest 训练分类器时使用到的一些参数: numTrees:随机森林中树的数目。增大这个数值可以减小预测的方差,提高预测试验的准确性,训练时间会线性地随之增长。 maxDepth:随机森林中每棵树的深度。增加这个值可以是模型更具...
分类:其他好文   时间:2016-05-13 14:58:40    阅读次数:296
R语言randomForest包实现随机森林——iris数据集和kyphosis数据集
library(randomForest)model.forest<-randomForest(Species~.,data=iris)pre.forest<-predict(model.forest,iris)table(pre.forest,iris$Species)library(rpart)...
分类:编程语言   时间:2015-11-01 15:17:44    阅读次数:1437
机器学习算法-梯度树提升GTB(GBRT)
Introduction决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快速,模型容易展示(容易将得到的决策树做成图片展示出来)等。但是同时,单决策树又有一些不好的地方,比如说容易over-fitting,虽然有一些方法,如剪枝可以减少这种情况,但是还是不太理想。模型组合(比如说有Boosting,Bagging等)与决策树相关的算法比较多,如randomForest、Ad...
分类:编程语言   时间:2015-08-29 12:43:17    阅读次数:427
机器学习-组合算法总结
组合模型组合模型一般要比单个算法要好,下面简单的介绍下Bootstraping, Bagging, Boosting, AdaBoost, RandomForest 和Gradient boosting这些组合型算法.1.BootstrapingBootstraping: 名字来自成语“pull up by your own bootstraps”,意思就是依靠你自己的资源,称为自助法,它是一种有放...
分类:编程语言   时间:2015-07-24 22:39:31    阅读次数:497
R语言实现随机森林代码
library(randomForest) data(iris) set.seed(100) ind<-sample(2,nrow(iris),replace=TRUE,prob=c(0.7,0.3))#对数据分成两部分,70%训练数据,30%检测数据/ traindata<-iris[ind==1,] testdata<-iris[ind==2,] iris.rf=randomForest(Species~.,iris[ind==1,],ntree=5..
分类:编程语言   时间:2015-06-02 15:31:50    阅读次数:689
机器学习:用随机森林来选择特征
引言 之前了解到决策树在选择最好的特征进行数据集的划分就说到这种方法可以用来进行特征选择,然后看了breiman主页上相关的介绍,觉得这不愧是权威啊,不愧是随机森林算法的提出者,讲的很清楚,网址如下 http://www.stat.berkeley.edu/~breiman/RandomForest...
分类:其他好文   时间:2015-04-28 22:32:08    阅读次数:143
34条   上一页 1 2 3 4 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!