前言 最近阅读了spark mllib(版本:spark 1.3)中Random Forest的实现,发现在分布式的数据结构上实现迭代算法时,有些地方与单机环境不一样。单机上一些直观的操作(递归),在分布式数据上,必须进行优化,否则I/O(网络,磁盘)会消耗大量时间。本文整理spark随机森林实现中...
                            
                            
                                分类:
其他好文   时间:
2015-05-03 14:37:06   
                                阅读次数:
317
                             
                         
                    
                        
                            
                            
                                阅读应该是伴随我们一生的事情,读什么应该是我们毕生都在思考的命题。其实,读书和吃饭一样,也有个人口味,但是最好不要挑食,人生最大的捷径就是,用时间和生命阅读和拥抱了世上一流的书。史上一流的好书都在这里,找来细细品读吧!
 
第一,文学不可不读。作家通过语言向人的想象力挑战,这是文学的基本功能。比如村上春树,他的题材和写法奇诡诱人,有人把他视为通俗作家中的摇滚乐手,推荐他的《挪威的森林》、《海边...
                            
                            
                                分类:
其他好文   时间:
2015-04-30 18:16:35   
                                阅读次数:
146
                             
                         
                    
                        
                            
                            
                                双亲表示法(顺序存储结构)      用一组连续的存储空间来存储树的结点,同时在每个结点中附加一个指示器(整数域) ,用以指示双亲结点的位置(下标值) 。数组元素及数组的类型定义如下:
#define MAX_SIZE  100
typedef  struct PTNode
{  ElemType  data ;
int  parent ;
}PTNode ;typedef  struct
{  P...
                            
                            
                                分类:
其他好文   时间:
2015-04-30 10:38:50   
                                阅读次数:
111
                             
                         
                    
                        
                            
                            
                                笨笨熊搬家打包篇描述:森林里的笨笨熊今天可开心啦——他买了新房子,乔迁新喜要搬家了。因此,笨笨熊请了许多好朋友来帮忙搬家,并准备了很多小纸盒用来装需要搬的物品,不过,这些纸盒的容积都是相同的,并且最多只能装两个物品。但是,为了不打扰太多的朋友,笨笨熊想了个“聪明”办法:让每个纸盒使用效率最高(注:只...
                            
                            
                                分类:
其他好文   时间:
2015-04-30 10:34:03   
                                阅读次数:
158
                             
                         
                    
                        
                            
                            
                                引言 之前了解到决策树在选择最好的特征进行数据集的划分就说到这种方法可以用来进行特征选择,然后看了breiman主页上相关的介绍,觉得这不愧是权威啊,不愧是随机森林算法的提出者,讲的很清楚,网址如下 http://www.stat.berkeley.edu/~breiman/RandomForest...
                            
                            
                                分类:
其他好文   时间:
2015-04-28 22:32:08   
                                阅读次数:
143
                             
                         
                    
                        
                            
                            
                                引言 随机森林在机器学习实战中没有讲到,我是从伯克利大学的一个叫breiman的主页中看到相关的资料,这个breiman好像是随机森林算法的提出者,网址如下 http://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm 随机森林算法简...
                            
                            
                                分类:
其他好文   时间:
2015-04-28 20:54:09   
                                阅读次数:
260
                             
                         
                    
                        
                            
                            
                                Introduction to Random forest(Simplified)With increase in computational power, we can now choose algorithms which perform very intensive calculations....
                            
                            
                                分类:
其他好文   时间:
2015-04-28 17:39:58   
                                阅读次数:
367
                             
                         
                    
                        
                            
                            
                                分析:找到吉米从办公室穿过森林回到家(也就是从点1到点2)的最短路径有多少条,其中要满足如果要走A到B这条路,那么就有从A到终点的距离都大于B到终点的距离。
解法:spfa算法+记忆化深搜
1、spfa求出从终点2到其他所有点的最短路
2、记忆化DFS从1开始向其他点深搜,最后结果就是dp[1]。
#include  
#include  
using namespace std;  
 ...
                            
                            
                                分类:
编程语言   时间:
2015-04-28 09:55:16   
                                阅读次数:
145
                             
                         
                    
                        
                            
                            
                                我喜欢出发。
    凡是到达了的地方,都属于昨天。哪怕那山再青,那水再秀,那风再温柔。太深的流连便成了一种羁绊,绊住的不仅有双脚,还有未来。
    怎么能不喜欢出发呢?没见过大山的巍峨,真是遗憾;见了大山的巍峨没见过大海的浩瀚仍然遗憾;见了大海的浩瀚没见过大漠的广袤,依旧遗憾;见了大漠的广袤没见过森林的神秘,还是遗憾。世界上有不绝的风景,我有不老的心情。
    我自然知道,大山有坎坷,...
                            
                            
                                分类:
其他好文   时间:
2015-04-28 09:37:55   
                                阅读次数:
112
                             
                         
                    
                        
                            
                            
                                机器学习(Machine Learning)&深入学习(Deep Learning)资料?《Brief History of Machine Learning》 介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机、神经网络、决策树、SVM、Adaboost 到随机森林、Deep Lear.....
                            
                            
                                分类:
系统相关   时间:
2015-04-27 14:56:05   
                                阅读次数:
300