在hadoop1.2.1的安装说明中有说明要预先安装java,我安装了好多版本的java以及好多版本的hadoop,然后发现oracle-java7与hadoop1.2.1是可以匹配的。
一,安装具体步骤如下:
1. 安装java: sudo apt-get install oracle-java7-installer
2. 安装hadoop1.2.1: http://hadoop....
分类:
其他好文 时间:
2014-07-11 00:31:01
阅读次数:
265
1、Shell$ExitCodeException
现象:运行hadoop job时出现如下异常:
14/07/09 14:42:50 INFO mapreduce.Job: Task Id : attempt_1404886826875_0007_m_000000_1, Status : FAILED
Exception from container-launch: org.apache....
分类:
其他好文 时间:
2014-07-11 00:24:58
阅读次数:
355
ERROR namenode.NameNode: java.io.IOException: Cannot lock storage /tmp/hadoop-root/dfs/name. The directory is already locked....
分类:
其他好文 时间:
2014-07-11 00:23:43
阅读次数:
362
在执行MR将HDFS转换为HFile的时候,出现了如下异常:
14/07/09 18:02:59 INFO mapred.JobClient: map 83% reduce 0%
14/07/09 18:02:59 INFO mapred.JobClient: Task Id : attempt_201401091245_59030413_m_000001_0, Status : FAILE...
分类:
其他好文 时间:
2014-07-10 23:32:44
阅读次数:
323
Spark1.1发布后会支持Spark SQL CLI , Spark SQL的CLI会要求被连接到一个Hive Thrift Server上,来实现类似hive shell的功能。...
分类:
数据库 时间:
2014-07-10 21:14:38
阅读次数:
737
一、前期准备
1、创建伪分布Hadoop环境,请参考官方文档。
2、准备数据文件如下sample.txt:
12345679867623119010123456798676231190101234567986762311901012345679867623119010123456+001212345678903456
123456798676231190101234567986762311...
分类:
其他好文 时间:
2014-07-10 19:41:45
阅读次数:
479
本文介绍了spark对hadoop sequencefile的读写支持,实现方式以及简单的使用方法。sequencefile和textfile类似,在上下文里有直接提供读取方法,但最终走的还是hadoopFile方法。...
分类:
其他好文 时间:
2014-07-10 17:11:52
阅读次数:
951
MapReduce任务执行总流程以下图5 是MapReduce作业详细的执行流程图。 图 5 MapReduce 作业执行流程图1.在客户端(Client)编写MapReduce代码,配置作业,启动作业。这里需要注意的一点是:一个MapReduce作业在提交到Hadoop上之后,会进入完全地自动化执...
分类:
其他好文 时间:
2014-07-10 15:02:50
阅读次数:
307
Strom的简单实现Spout的实现对文件的改变进行分开的监听,并监视目录下有无新日志文件添加。在数据得到了字段的说明后,将其转换成tuple。声明Spout和Bolt之间的分组,并决定tuple发送给Bolt的途径。Spout中open、nextTuple和delcareOutputFields方...
分类:
其他好文 时间:
2014-07-10 15:01:33
阅读次数:
167
现在 Hadoop 已经发展成为包含多个子项目的集合。虽然其核心内容是 MapReduce 和Hadoop 分布式文件系统(HDFS),但 Hadoop 下的Common 、Avro、 Chukwa、Hive 、HBase等子项目也是不可或缺的。它们提供了互补性服务或在核心层上提供了更高层的服务。以...
分类:
其他好文 时间:
2014-07-10 14:57:00
阅读次数:
333