码迷,mamicode.com
首页 >  
搜索关键字:hadoop2    ( 1326个结果
Hadoop2.6.0运行mapreduce之推断(speculative)执行(一)
当一个应用向YARN集群提交作业后,此作业的多个任务由于负载不均衡、资源分布不均等原因都会导致各个任务运行完成的时间不一致,甚至会出现一个任务明显慢于同一作业的其它任务的情况。如果对这种情况不加优化,最慢的任务最终会拖慢整个作业的整体执行进度。好在mapreduce框架提供了任务推断执行机制,当有必要时就启动一个备份任务。最终会采用备份任务和原任务中率先执行完的结果作为最终结果。...
分类:其他好文   时间:2016-05-13 14:57:57    阅读次数:186
关于hadoop学习的思考(一) —— 小的知识点的总结
一、对于CDH的小总结: CDH:是Cloudera公司在Apache开源项目hadoop的基础上发型的,共有五个版本前两个已不再更新,最经的两个分别是CDH4(基于hadoop2.0.0版本演化而来)、CDH5(每隔一段时间就会有更新) CDH与Apache hadoop的区别:1.CDH的版本更 ...
分类:其他好文   时间:2016-05-13 10:11:48    阅读次数:156
Hadoop2.4.1 HDFS的Java客户端开发
我是在linux的环境下的Eclipse中开发这个程序的,如果你是在windows环境下写这个程序,请自行调整。 第一步:首先我们确定自己的hadoop的hdfs的环境是好的,我们在linux中启动hdfs,然后在web页面上通过URL测试:http://uatciti:50070 第二步:在Linux下打开Eclipse, 写我们的客户端代码。 说明:我们在Linux系统的/usr...
分类:编程语言   时间:2016-05-13 02:45:37    阅读次数:167
Hadoop简单入门之伪分布式搭建
前面两章主要讲解了完全分布式的搭建,这章主要讲解服务器单机完成伪分布的搭建,介绍Hadoop配置,启动,以及简单测试。我的机器:阿里云服务器,64位,Java64,Hadoop2.4.1(64)...
分类:其他好文   时间:2016-05-12 22:48:12    阅读次数:221
关于hadoop2.x(2.7.1 2.7.2)集群配置和测试运行中Ubuntu虚拟机VM设置nat方式导致节点传输问题
集群配置都大同小异,在这里我简单说下我的配置: 主节点系统是Ubuntu 14.04 LTS x64其他两个节点在VM中系统为Centos 6.4 x64 JVM为jdk1.7_80 hadoop版本2.7.1和2.7.2都尝试了 出现的问题是: 启动hdfs系统正常,都启动起来了,jps查看如下 主节点 SecondaryNameNode和 NameNode 从节点:DataN...
分类:系统相关   时间:2016-05-12 22:36:20    阅读次数:590
HDFS文件管理系统
1. 软件版本 &部署:maven:3.3.9,jdk:1.7 ,Struts2:2.3.24.1,Hibernate:4.3.6,Spring:4.2.5,MySql:5.1.34,Junit:4,Myeclipse:2014;Hadoop2.6.4源码下载地址: https://github.com/fansy1990/ssh_v3/releases 项目部署:1) 修改src/main/re...
分类:其他好文   时间:2016-05-12 17:47:21    阅读次数:295
hadoop 2.7.2 (hadoop2.x)使用ant制作eclipse插件hadoop-eclipse-plugin-2.7.2.jar
本文提供了关于hadoop2.7.2(其他版本一个道理)从ant制作eclipse的hadoop插件,到配置eclipse的hadoop,运行mr程序测试的一系类内容...
分类:编程语言   时间:2016-05-12 16:10:54    阅读次数:286
apache sqoop1.99.3+hadoop2.5.2+mysql5.0.7环境构筑以及数据导入导出
概要  为了调查hadoop生态圈里的制品,特地的了解了一下RDBMS和hdfs之间数据的导入和导出工具,并且调查了一些其他同类的产品,得出来的结论是:都是基于sqoop做的二次开发或者说是webUI包装,实质还是用的sqoop。比如pentaho的PDI,Oracle的ODI,都是基于此,另外,Hortnetwork公司的sandbox,Hue公司的Hue webUI,coulder的coul...
分类:数据库   时间:2016-05-12 12:04:30    阅读次数:364
windows下 pycharm开发spark
一 部署本地spark环境 1.1  安装好JDK       下载并安装好jdk1.7,配置完环境变量。 1.2 Spark环境变量配置       去http://spark.apache.org/downloads.html网站下载相应hadoop对应的版本,我下载的是spark-1.6.0-bin-hadoop2.6.tgz,spark版本是1.6,对应...
分类:Windows程序   时间:2016-05-12 11:33:38    阅读次数:441
SparkR lib加载
library(SparkR, lib.loc = c("/usr/local/spark/spark-1.5.2-bin-hadoop2.6/R/lib") Sys.setenv(SPARK_HOME="/usr/local/spark/spark-1.5.2-bin-hadoop2.6") sc ...
分类:其他好文   时间:2016-05-09 22:12:06    阅读次数:204
1326条   上一页 1 ... 60 61 62 63 64 ... 133 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!