Hadoop中自己提供了一个RPC的框架。集群中各节点的通讯都使用了那个框架 1.服务端 1.1.业务接口:ClientNamenodeProtocol 1.2.业务接口实现类:MyNameNode 1.3.服务端类:将业务实现类发布为一个服务 2.客户端 我们也可以在自己的项目中使用Hadoop的 ...
分类:
其他好文 时间:
2018-06-19 13:53:05
阅读次数:
162
1. 创建数据库,切换数据库 2. 创建管理表 emp.txt文件内容如下: 在hadoop中查看数据,如下: 3. 创建外部表 创建外部表时直接指定表位置 上传数据文件到指定路径 在hive中创建数据表指定location 4. 创建分区表 注:分区字段不能与表中其他字段重复,否则报错 FAILE ...
分类:
其他好文 时间:
2018-06-17 00:46:02
阅读次数:
229
1. MapReduce使用 MapReduce是Hadoop中的分布式运算编程框架,只要按照其编程规范,只需要编写少量的业务逻辑代码即可实现 一个强大的海量数据并发处理程序 2. 运行Hadoop自带的MapReduce程序(word count单词统计功能) 1.在HDFS中创建层级目录,并且上 ...
分类:
其他好文 时间:
2018-06-16 11:56:36
阅读次数:
154
https://www.cnblogs.com/ejiyuan/p/5591613.html HBase简介 HBase是Apache Hadoop中的一个子项目,是一个HBase是一个开源的、分布式的、多版本的、面向列的、非关系(NoSQL)的、可伸缩性分布式数据存储模型,Hbase依托于Hado ...
分类:
数据库 时间:
2018-06-15 13:06:11
阅读次数:
231
1.Mapper 1.1 泛型参数 Mapper有四个泛型参数,Mapper<KEYIN, VALUEIN, KEYOUT, VALUEOUT>: KEYIN:默认读取的一行文本的起始偏移量.Long类型,在Hadoop中包装成LongWriteable VALUEIN:默认读取的一行文本的字符串信 ...
分类:
其他好文 时间:
2018-06-06 18:24:08
阅读次数:
619
经常管理和监控,需要进行shell编程,直接对进程kill或者重启操作。我们需要进行快速定位到每个进程的pid号pid默认存储在/tmp目录pid内容为进程号ps-ef|grephadoop出现PIDA,B,C可能误杀B,C[hadoop@hadoop000sbin]$cathadoop-daemon.sh|greppid#HADOOPPIDDIRThepidfilesarestored./tmp
分类:
系统相关 时间:
2018-05-21 16:58:11
阅读次数:
230
hadoop2.5.0 HA配置 1.修改hadoop中的配置文件 进入/usr/local/src/hadoop 2.5.0 cdh5.3.6/etc/hadoop目录,修改hadoop env.sh,core site.xml,hdfs site.xml,mapred site.xml ,yar ...
分类:
其他好文 时间:
2018-05-06 19:59:57
阅读次数:
169
Hadoop中的日志包含三个部分,Application Master产生的运行日志和Container的日志。 一、ApplicationMaster产生的作业运行日志 Application Master产生的日志信息详细记录了Map Reduce job的启动时间,运行时间,用了多少个Mapp ...
分类:
其他好文 时间:
2018-05-02 02:39:01
阅读次数:
146
一、序列化 1 hadoop自定义了数据类型,在hadoop中,所有的key/value类型必须实现Writable接口。有两个方法,一个是write,一个是readFileds。分别用于读(反序列化操作)和写(序列化操作)。 2 所有的key必须实现Comparable接口,在MapReduce过 ...
分类:
其他好文 时间:
2018-04-28 11:42:18
阅读次数:
231
环境 问题 ,安装完Hadoop之后操作总报这样的警告,但是不影响使用 [WARN ] 2018-04-18 18:07:39,897 method:org.apache.hadoop.util.NativeCodeLoader.<clinit>(NativeCodeLoader.java:62)U ...
分类:
移动开发 时间:
2018-04-18 21:22:21
阅读次数:
439