原文地址:http://my.oschina.net/lanzp/blog/309078目录[-]1、开发配置环境:2、Hadoop服务端配置(Master节点)3、基于Eclipse的Hadoop2.x开发环境配置4、运行Hadoop程序及查看运行日志1、开发配置环境:开发环境:Win7(64bi...
分类:
系统相关 时间:
2014-09-04 14:34:59
阅读次数:
491
socket.io 一个与服务器实时通信的工具,它与原生的webSocket相比,具有更可靠、快速的优点,并且能很好的兼容不同系统、浏览器及设备。http://socket.io/nodeJS 服务端js解析引擎http://www.nodejs.org/一、环境搭建在服务器上创建目录socketi...
分类:
其他好文 时间:
2014-09-04 13:19:29
阅读次数:
167
第一步:Spark集群需要的软件; ?在1、2讲的从零起步构建好的Hadoop集群的基础上构建Spark集群,我们这里采用2014年5月30日发布的Spark 1.0.0版本,也就是Spark的最新版本,要想基于Spark 1.0.0构建Spark集群,需...
分类:
其他好文 时间:
2014-09-04 12:01:39
阅读次数:
310
HDFSHDFS设计基础与目标:冗余:硬件错误是常态流式数据访问。即数据比量读取而非随机读写,Hadoop擅长做的是数据分析而不是事务处理。大规模数据集简单一致性模型。为了降低系统复杂程度,对文件采用一次性写多多次读的逻辑设置,即是文件一经写入,关闭,再也不能修改。程序采..
分类:
其他好文 时间:
2014-09-04 02:58:58
阅读次数:
277
HBaseHbase是一个分布式的、面向列的开源数据库,该技术来源于Changetal所写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(FileSystem)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bittable的能力。HBase是Apa..
分类:
其他好文 时间:
2014-09-04 02:58:08
阅读次数:
325
默认是1.0.4,需设置指定Hadoop版本:
在${SPARK_HOME}/pom.xml中的yarn改为
yarn
2
2.2.0
2.2.0
2.5.0
yarn
导入时候选yarn...
分类:
其他好文 时间:
2014-09-03 21:19:57
阅读次数:
330
一、windows下创建新项目打开CMD将路径设置到cocos软件下的tools下的project-creator下,执行命令:create_project.py -project HelloWorld -package com.zsc.HelloWorld -language cpp二、Linux...
分类:
移动开发 时间:
2014-09-03 21:07:17
阅读次数:
315
一、几个可能会用到的属性值 1、mapred.map.tasks.speculative.execution和mapred.reduce.tasks.speculative.execution 这两个属性可以决定Map任务和Reduce任务是否开启推测式执行策略。推测式执行策略在Hadoop中用.....
分类:
其他好文 时间:
2014-09-03 19:48:07
阅读次数:
358
参考:http://hadoop.apache.org/docs/r2.5.0/hadoop-mapreduce-client/hadoop-mapreduce-client-core/MapReduceTutorial.htmlMaven和WordCount代码: ...
分类:
其他好文 时间:
2014-09-03 19:45:17
阅读次数:
270
最近一直在学习hadoop一直没有梳理接触到的东西,常见算法分类:推荐系统(推荐引擎):基于用户的协同过滤算法UserCF近邻算法,容易实现基于物品的协同过滤算法ItemCF速度快,容易实现分布式计算SlopeOne算法@Deprecatedatmahout0.8KNNLinearinterpolationitem–based推荐算?.
分类:
其他好文 时间:
2014-09-03 18:29:07
阅读次数:
221