第一步:打开/etc 下面的 profile文件,在其中加入环境变量设置的代码doneJAVA_HOME=/home/hadoop/installer/jdk7u65PATH=$JAVA_HOME/bin:$PATHCLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HO...
分类:
其他好文 时间:
2014-07-22 08:04:37
阅读次数:
220
1.1 Spark交互式分析
运行Spark脚本前,启动Hadoop的HDFS和YARN。Spark的shell提供
了简单方式去识别API,同样也有一个强大的工具去交互式地分析数据。两种语言有这样的交换能力,分别是Scala 和 Python。下面将演示如何使用Python来分析数据文件。
进入Spark安装主目录,输入下面的命令,python命令行模式将会启动。
./bin/pysp...
分类:
其他好文 时间:
2014-07-22 00:29:38
阅读次数:
239
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据...
分类:
其他好文 时间:
2014-07-22 00:20:35
阅读次数:
252
重新格式化hdfs系统的方法:(1)查看hdfs-ste.xmldfs.name.dir/home/hadoop/hdfs/namenamenode上存储hdfs名字空间元数据dfs.data.dir/home/hadoop/hdsf/datadatanode上数据块的物理存储位置将dfs.name...
分类:
其他好文 时间:
2014-07-22 00:10:37
阅读次数:
263
Mahout0.9+Hadoop-2.2.0贝叶斯分类纯java实战代码,希望能给搞大数据数据挖掘的java粉们有所帮助,也希望大家提出建议。也希望Mahout社区大牛,帮忙看看我遇到的问题,先在这里谢过了。。...
分类:
其他好文 时间:
2014-07-21 22:47:27
阅读次数:
365
虽然我们在虚拟机客户端上能很快通过shell命令,进行执行一些已经封装好实例程序,但是在应用中还是是自己写程序,然后部署到服务器中去,下面,我通过程序进行浅谈一个程序的部署过程。
在启动Hadoop之后,然后把程序达成可执行的jar包,并把相应的第三方jar包 包含进去。执行hadoop jar XXX. +驱动名称。package com.mapred;
import java.i...
分类:
其他好文 时间:
2014-07-21 22:33:08
阅读次数:
239
core-site.xml<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://qlserver03:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/grid/hadoop/tmp</..
分类:
其他好文 时间:
2014-07-21 19:34:42
阅读次数:
247
Exception in thread "main" java.lang.NoClassDefFoundError: org/codehaus/jackson/map/JsonMappingException
at org.apache.hadoop.mapreduce.Job$1.run(Job.java:563)
at java.security.AccessC...
分类:
移动开发 时间:
2014-07-21 16:36:54
阅读次数:
251
1、Could not chdir to home directory /home/USER: Permission denied启动datanode时会报这个错误,尝试利用ssh登录datanode,发现需要密码。解决办法: 利用root权限修改/etc/sysconfig/selinux,将S....
分类:
其他好文 时间:
2014-07-21 14:27:28
阅读次数:
281
1. 概述在传统数据库(如:MYSQL)中,JOIN操作是非常常见且非常耗时的。而在HADOOP中进行JOIN操作,同样常见且耗时,由于Hadoop的独特设计思想,当进行JOIN操作时,有一些特殊的技巧。本文首先介绍了Hadoop上通常的JOIN实现方法,然后给出了几种针对不同输入数据集的优化方法。...
分类:
其他好文 时间:
2014-07-21 09:03:08
阅读次数:
329