码迷,mamicode.com
首页 >  
搜索关键字:hbase 数据导入    ( 5511个结果
缓存雪崩解决方案记录
在项目中频繁访问hbase,造成hbase压力过大,而后设立缓存系统,但是会造成缓存雪崩问题,即当缓存过期时,会出现大量的DB连接,对DB产生迅间高负载。由于采用redis缓存,所以用redis锁的功能来防止过多线程同时访问数据库的现象,对于mutex锁的ttl问题,在项目中不用考虑时间过期问题(因 ...
分类:其他好文   时间:2020-06-08 01:00:19    阅读次数:70
在hadoop集群下启动hbase的方法
hbase已经配置好 开始使用hbase时 先启动hadoop集群 start-all.sh(前提是在bashrc中配置export PATH=$PATH:$HADOOP_HOME/sbin export PATH=$PATH:$HAOOP_HOME/bin) 然后start-hbase.sh,启动 ...
分类:其他好文   时间:2020-06-08 00:39:09    阅读次数:68
hive 查询表数据量大小
为什么要查询表数据量 在做数据仓库管理时,数据导入hive或向表生成数据后形成的数据资产,表里的数据量和占用存储空间是总要的元数据属性。为方便数据使用时对数据有基本的了解,需要对表的数据量做统计。 使用 analyze table 主动生成元数据信息 analyze table tableName ...
分类:其他好文   时间:2020-06-05 13:27:53    阅读次数:669
CDH6.3.2 启用Kerberos 集成使用phoenix
CDH6.3.2启用Kerberos集成使用phoenix标签(空格分隔):大数据平台构建一、下载并安装Phoenixparcel二、安装CSD文件三、在ClouderaManager中添加Phoenix服务(前提是已经安装了HBase服务)四、配置HBase以用于Phoenix五、验证Phoenix安装与冒烟测试六、导入数据验证测试七、七:关于phoinex的schema与hbase的names
分类:其他好文   时间:2020-06-05 00:31:53    阅读次数:121
Spark读取Hbase中的数据
大家可能都知道很熟悉Spark的两种常见的数据读取方式(存放到RDD中):(1)、调用parallelize函数直接从集合中获取数据,并存入RDD中;Java版本如下: JavaRDD<Integer> myRDD = sc.parallelize(Arrays.asList(1,2,3)); Sc ...
分类:其他好文   时间:2020-06-04 10:38:09    阅读次数:76
Flume-0.9.4和Hbase-0.96整合
这几天由于项目的需要,需要将Flume收集到的日志插入到Hbase中,有人说,这不很简单么?Flume里面自带了Hbase sink,可以直接调用啊,还用说么?是的,我在本博客的《Flume-1.4.0和Hbase-0.96.0整合》文章中就提到如何用Flume和Hbase整合,从文章中就看出整个过 ...
分类:Web程序   时间:2020-06-04 10:26:08    阅读次数:83
HBase Rowkey的设计原则
唯一原则 ? 由于在HBase中数据存储是Key-Value形式,若HBase中同一表插入相同Rowkey,则原先的数据会被覆盖掉(如果表的version设置为1的话),所以务必保证Rowkey的唯一性 长度原则 ? Rowkey是一个二进制码流,Rowkey的长度建议设计在10~100个字节,不过 ...
分类:其他好文   时间:2020-06-02 18:38:52    阅读次数:55
hbase预分区
hbase在创建表的时候,一开始只有一个Region,当数据量越来越大时,此region不能承受数据量,就会进行split 这种方式有两种缺点:1.数据往一个region上写,会有写热点问题 2.region split会消耗宝贵的集群I/O资源 所以引入了预分区概念。 https://blog.c ...
分类:其他好文   时间:2020-06-02 11:27:42    阅读次数:69
phoenix从入门到精通
第一章、phoenix入门简介 1. Phoenix定义 Phoenix最早是saleforce的一个开源项目,后来成为Apache基金的顶级项目。 Phoenix是构建在HBase上的一个SQL层,能让我们用标准的JDBC APIs而不是HBase客户端APIs来创建表,插入数据和对HBase数据 ...
分类:其他好文   时间:2020-06-01 18:05:21    阅读次数:103
Apache Avro 简介
一、引言 1、 简介 Avro是Hadoop中的一个子项目,也是Apache中一个独立的项目,Avro是一个基于二进制数据传输高性能的中间件。在Hadoop的其他项目中例如HBase(Ref)和Hive(Ref)的Client端与服务端的数据传输也采用了这个工具。Avro是一个数据序列化的系统,可以 ...
分类:Web程序   时间:2020-05-31 22:07:53    阅读次数:125
5511条   上一页 1 ... 18 19 20 21 22 ... 552 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!