码迷,mamicode.com
首页 >  
搜索关键字:hdfs architecture    ( 6541个结果
Hadoop2.6集群环境搭建(HDFS HA+YARN)原来4G内存也能任性一次.
准备工作:1、笔记本4G内存 ,操作系统WIN7 (屌丝的配置)2、工具VMware Workstation3、虚拟机:CentOS6.4共四台虚拟机设置:每台机器:内存512M,硬盘40G,网络适配器:NAT模式选择高级,新生成虚机Mac地址(克隆虚拟机,Mac地址不会改变,每次最后手动重新生成)...
分类:其他好文   时间:2015-01-07 18:35:19    阅读次数:214
Sqoop2入门之导入关系型数据库数据到HDFS上
需求:将hive数据库中的TBLS表导出到HDFS之上; $SQOOP2_HOME/bin/sqoop.sh client sqoop:000> set server --host hadoop000 --port 12000 --webapp sqoopServer is set successf...
分类:数据库   时间:2015-01-07 18:26:42    阅读次数:190
HDFS的各个组件的交互方式
接触Hdoop将近一年,昨日偶发阅读其源码之雅兴,宛如少女姨妈突至,势不可遏。读一个开源框架的源码,个人习惯一般是先熟悉其整体结构,不拘泥于个别类。一个设计优秀的框架,往往每个包都有其职责,旨在完成某个特定的功能。因此将每个包或其相关的包 抽出来,单独打包成一个 jar文件,就能被第三方系统...
分类:其他好文   时间:2015-01-07 16:33:09    阅读次数:317
【Hadoop】HDFS的运行原理
简介HDFS(Hadoop Distributed File System )Hadoop分布式文件系统。是根据google发表的论文翻版的。论文为GFS(Google File System)Google 文件系统(中文,英文)。HDFS有很多特点: ①保存多个副本,且提供容错机制,副本丢失或宕机...
分类:其他好文   时间:2015-01-07 00:29:30    阅读次数:196
NameNode & DataNode
NameNode类位于org.apache.hadoop.hdfs.server.namenode包下。NameNode serves as both directory namespace manager and "inode table" for the Hadoop DFS. There is...
分类:其他好文   时间:2015-01-06 22:52:07    阅读次数:365
开源日志收集软件fluentd 转发(forward)架构配置
需求:通过开源软件fluentd收集各个设备的apache访问日志到fluentd的转发服务器中,然后通过webHDFS接口,写入到hdfs文件系统中。软件版本说明:hadoop版本:1.1.2fluentd版本:1.1.21测试环境说明:node29服务器上安装了apache,以及fluentd,作为fluentd的客户端;node1服务..
分类:其他好文   时间:2015-01-06 18:16:52    阅读次数:192
spark-1.2.0 集群环境搭建
spark-1.2.0 集群环境搭建...
分类:其他好文   时间:2015-01-06 15:32:16    阅读次数:247
[hadoop]hadoop学习路线
1、主要学习hadoop中的四大框架:hdfs、mapreduce、hive、hbase。这四大框架是hadoop最最核心的,学习难度最大的,也是应用最广泛的。2、熟悉了解hadoop基本知识及其所需要的知识例如java基础、linux环境、linux常用命令3、hadoop一些基本知识:hadoo...
分类:其他好文   时间:2015-01-06 15:21:31    阅读次数:187
hadoop学习二:hadoop基本架构与shell操作
1.hadoop1.0与hadoop2.0的区别: hadoop1.0生态如下图: hadoop2.0生态: 2.HDFS描述:HDFS是google的GFS的开源克隆,HDFS的架构如下图: 1) NameNode:管理HDFS的名称空间,管理数据块映射信息,配置副本策略,处理...
分类:系统相关   时间:2015-01-06 13:48:52    阅读次数:267
一、wcf概述
WCF (Windows Communication Foundation) 通信基础SOA ( Service-Oriented Architecture) 面向服务架构。 既是一种编程模式,又是一种软件开发的架构方法。目标: 实现不同组件夸平台配合使用(分布式应用)原则: 1、边界是显式定义的....
分类:其他好文   时间:2015-01-05 18:10:09    阅读次数:137
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!