码迷,mamicode.com
首页 >  
搜索关键字:hadoop2    ( 1326个结果
伪分布式Hadoop2.x集群的搭建
1. 安装JDK a.查出当前已经安装的JDK # rpm -qa | grep java b.卸载原先自带的JDK # rpm -e --nodeps java-1.6.0-openjdk-1.6.0.0-1.50.1.11.5.el6_3.x86_64 tzdata-java-2012j-1.e ...
分类:其他好文   时间:2016-05-24 11:54:36    阅读次数:164
Hadoop2.6.0的FileInputFormat的任务切分原理分析(即如何控制FileInputFormat的map任务数量)
前言 首先确保已经搭建好Hadoop集群环境,可以参考《Linux下Hadoop集群环境的搭建》一文的内容。我在测试mapreduce任务时,发现相比于使用Job.setNumReduceTasks(int)控制reduce任务数量而言,控制map任务数量一直是一个困扰我的问题。好在经过很多摸索与实 ...
分类:其他好文   时间:2016-05-23 14:43:38    阅读次数:300
搭建Hadoop2.6.4伪分布式
准备工作 操作系统 CentOS 7 软件环境 关闭防火墙 设置HostName 安装环境 安装JDK 配置java环境变量 验证java 待输出以上内容时说明java已安装配置成功。 安装Hadoop 下载Hadoop 2.6.4 安装Hadoop 2.6.4 配置Hadoop环境变量 验证Had ...
分类:其他好文   时间:2016-05-21 10:12:05    阅读次数:218
安装hadoop2.4.1
1上传hadoop包 2解压hadoop包 首先在根目录创建一个目录 mkdir /itcast tar -zxvf hadoop-2.4.1.tar.gz -C /itcast/ hadoop的配置文件在:/itcast/hadoop-2.4.1/etc/hadoop下 注意:hadoop2.x的... ...
分类:其他好文   时间:2016-05-21 01:27:50    阅读次数:186
python3.4.4+solr5.5+hadoop2.6.3
1.通过python编写爬虫,数据存储到hdfs当中 2.通过solr在hdfs当中建立索引并实现全文检索功能 好了,正文开始了! 一,环境搭建 1.python3.4.4安装及环境变量配置 2.hadoop2.6.3安装及环境变量配置(单机) 3.solr5.5安装及配置 1. 下载tomcat9 ...
分类:编程语言   时间:2016-05-20 09:53:34    阅读次数:294
Hbase数据库安装
一、环境准备 1、Ubuntu14.04-server 2、ssh 3、jdk1.6 4、hbase-0.98.19-hadoop2-bin.tar.gz(下载地址http://www.apache.org/dyn/closer.cgi/hbase/) 二、安装步骤 1、解压hbase软件包 sud ...
分类:数据库   时间:2016-05-18 10:33:58    阅读次数:172
测试环境机器部署图
一、需求在本地上部署了两套环境,一套用于开发环境,另一套用于测试环境。在这里,我抽其测试这套环境,做了个总结,具体安装步聚,在这里不作详细解释,如果需要,我可以提供一份我总结文档作参考。环境上用到了11台机器,注意了,在这里用到全部是cdm5.5.0版本http://archiv..
分类:其他好文   时间:2016-05-17 19:46:54    阅读次数:283
Yarn resourceManager 无法启动
Yarn resourceManager 无法启动 错误日志: 在日志hadoop2/logs/arn-daiwei-resourcemanager-ubuntu1.log中 problem binding to [ubuntu1:8036] java.net.BindException: Addr ...
分类:其他好文   时间:2016-05-15 07:02:31    阅读次数:358
java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries
在已经搭建好的集群环境Centos6.6+Hadoop2.7+Hbase0.98+Spark1.3.1下,在Win7系统Intellij开发工具中调试Spark读取Hbase。运行直接报错: ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2 ...
分类:编程语言   时间:2016-05-14 15:32:00    阅读次数:233
(二)win7下用Intelij IDEA 远程调试spark standalone 集群
关于这个spark的环境搭建了好久,踩了一堆坑,今天 环境: WIN7笔记本 spark 集群(4个虚拟机搭建的) Intelij IDEA15 scala-2.10.4 java-1.7.0 版本问题: 个人选择的是hadoop2.6.0 spark1.5.0 scala2.10.4 jdk1.7 ...
分类:Windows程序   时间:2016-05-13 18:49:39    阅读次数:4862
1326条   上一页 1 ... 59 60 61 62 63 ... 133 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!