码迷,mamicode.com
首页 >  
搜索关键字:hadoop nutch hbase    ( 16575个结果
HDFS的Shell操作
1.基本语法 bin/hadoop fs 具体命令 OR bin/hdfs dfs 具体命令 dfs是fs的实现类。 2.命令大全 [root@hadoop002 hadoop-2.7.2]# hdfs dfs Usage: hadoop fs [generic options] [-appendT ...
分类:系统相关   时间:2020-01-16 01:06:44    阅读次数:92
HBase表的设计(二)之行健的设计
HBase行健的设计 在设计HBase表的时候,行健是唯一重要的事情。应该基于预期的访问模式来为行健进行建模 行健决定了访问HBase表时可以得到的性能。这个结论根植于两个事实: 1、region基于行健为一个区间的行提供服务,并且负责区间内的每一行。 2、HFile在硬盘上存储有序的行。 当reg ...
分类:其他好文   时间:2020-01-16 01:05:01    阅读次数:74
Centos7编译Hadoop源码
jar包安装 注意:所有操作必须在root用户下完成 1 JDK解压、配置环境变量 JAVA_HOME和PATH,验证java-version(如下都需要验证是否配置成功) [root@192 opt]# mkdir /opt/module/ [root@192 opt]# tar -zxf jdk ...
分类:其他好文   时间:2020-01-16 01:04:00    阅读次数:84
HDFS概述
HDFS产出背景及定义 Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDF ...
分类:其他好文   时间:2020-01-15 21:18:15    阅读次数:85
hbase入门
1 Hbase特点 容量大:Hbase单表可以有百亿行、百万列,数据矩阵横向和纵向两个纬度所支持的数据量级都非常具有弹性。 面向列 :Hbase是面向列的存储和权限控制,并支持独立检索。列式存储,其数据在表中是按照某列存储的,这样在查询只需要少数几个字段的时候,能大大减少读取的数据量。 多版本: H ...
分类:其他好文   时间:2020-01-15 19:57:46    阅读次数:78
【设计模式】 (2)关于UML
Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库... ...
分类:其他好文   时间:2020-01-15 19:55:52    阅读次数:64
hive on hbase中列族的列名不固定
问题:列族中列名的数量不固定,随时变化问题分析:这种情况,在hive中提前做好映射是不可能的;解决:可以用hive中的map映射案例:hbase中建表:create 'user_profile','cf'hive建表:CREATE EXTERNAL TABLE user_profile ( user... ...
分类:其他好文   时间:2020-01-15 19:49:40    阅读次数:85
【设计模式】 (1)设计模式的七大原则
Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库... ...
分类:其他好文   时间:2020-01-15 19:44:01    阅读次数:63
【设计模式】 (3)设计模式概述
Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库... ...
分类:其他好文   时间:2020-01-15 19:30:34    阅读次数:76
java.io.IOException: Can't get Master Kerberos principal for use as renewer 错误解决
最近在集群中执行调度任务,或者是 在集群中执行 hadoop distcp 命令都会报这样的问题。 java.io.IOException: Can't get Master Kerberos principal for use as renewer- at org.apache.hadoop.ma ...
分类:编程语言   时间:2020-01-15 12:09:00    阅读次数:112
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!