码迷,mamicode.com
首页 >  
搜索关键字:hadoop nutch hbase    ( 16575个结果
【异常】Could not start ZK at requested port of 2181. ZK was started at port: 2182. Aborting a
HMaster和HRegionServer是Hbase的两个子进程,但是使用jps发现没有启动起来,所以去我们配置的logs查看错误信息。提示:Could not start ZK at requested port of 2181. ZK was started at port: 2182. Ab ...
分类:其他好文   时间:2019-12-28 20:45:17    阅读次数:99
【异常】连接Phoenix异常SYSTEM.CATALOG
连接Phoenix出现异常SYSTEM.CATALOG。 进入/bin/ hbase zkcli ,或者进入zk的客户端:[hadoop@hadoop001 zookeeper-3.4.5-cdh5.7.0]$ cd bin[hadoop@hadoop001 bin]$ ./zkCli.sh 如果有 ...
分类:其他好文   时间:2019-12-28 20:43:09    阅读次数:330
【HBase】HBase的RK设计、避免热点
一、HBase的RK设计 HBase读写数据大多数是通过RK,MemStore/HFile存储也是按照字典顺序排列的RK存储,所以要关注RK。 RowKey设计原则: 1)长度原则: RowKey不应该超过16字节,因为若是过长再以KV形式存储,对于HFile和MemStore来说会极大的占用存储空 ...
分类:其他好文   时间:2019-12-28 20:38:27    阅读次数:91
Hadoop学习之路(8)Yarn资源调度系统详解
文章目录1、Yarn介绍2、Yarn架构2.1 、ResourceManager2.2 、ApplicationMaster2.3 、NodeManager2.4 、Container2.5 、Resource Request 及 Container2.6 、JobHistoryServer2.7、 ...
分类:其他好文   时间:2019-12-28 19:24:00    阅读次数:94
sqoop--数据库和hdfs之间的搬运工
sqoop简介 sqoop是一款开源的工具,主要用于在hadoop和与传统的数据库之间进行的数据的传递,可以将一个关系型数据库中的数据导入到hadoop的hdfs中,也可以将hdfs的数据导入到关系型数据库中。sqoop的命名由来就是 ,它的原理就是将导入或者导出命令翻译成MapReduce来实现, ...
分类:数据库   时间:2019-12-28 16:30:57    阅读次数:131
(写了一点写不下去了,虽然垃圾但又不想扔)hbase--大数据中的NoSql
hbase简介 hbase定义 hbase是一种分布式、可扩展、支持海量数据存储的NoSql数据库,可以对几十亿条数据进行秒级查询。 hbase数据模型 逻辑上,hbase的数据模型和关系型数据库比较类似,数据存在一张表中,有行有列。但是从hbase的底层物理存储逻辑来看,hbase更像是一个 ,因 ...
分类:数据库   时间:2019-12-28 09:21:24    阅读次数:139
hadoop三大发行版本-优势-
Hadoop三大发行版本:Apache、Cloudera、Hortonworks。 Apache版本最原始(最基础)的版本,对于入门学习最好。 Cloudera在大型互联网企业中用的较多。 Hortonworks文档较好。 Apache Hadoop 官网地址:http://hadoop.apach ...
分类:其他好文   时间:2019-12-27 21:49:03    阅读次数:82
大数据技术生态体系
HDFS架构概述 HDFS(Hadoop Distributed File System)的架构 2.5.3 MapReduce架构概述 MapReduce将计算过程分为两个阶段:Map和Reduce,如图2-25所示 1)Map阶段并行处理输入数据 2)Reduce阶段对Map结果进行汇总 图中涉 ...
分类:其他好文   时间:2019-12-27 21:42:53    阅读次数:71
Hadoop学习之路(5)Mapreduce程序完成wordcount
本文在Windows端实现了WordCount功能
分类:其他好文   时间:2019-12-27 19:40:55    阅读次数:100
Hive(1)-基本概念
1. 什么是Hive Hive:由Facebook开源用于解决海量结构化日志的数据统计。 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 本质是:将HQL转化成MapReduce程序 1)Hive处理的数据存储在HDFS 2)Hive分析数 ...
分类:其他好文   时间:2019-12-27 13:08:13    阅读次数:92
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!