承接上一篇HDFS实验,学习入门课后的实验真的是以简单为主,后续估计得每个组件一一击破。 Hbase介绍 Hbase是一个分布式的、面向列的开源数据库,源于Google的一篇论文《BigTable:一个结构化的数据的分布式存储系统》。HBase中确定一个元素,需要提供表名,行,列族名,列。因为是以列 ...
分类:
其他好文 时间:
2020-07-05 10:24:53
阅读次数:
74
hbase2.1.9 centos7 完全分布式 搭建随记 这里是当初在三个ECS节点上搭建hadoop+zookeeper+hbase+solr的主要步骤,文章内容未经过润色,请参考的同学搭配其他博客一同使用,并记得根据实际情况调整相关参数 1. 指定位置解压 2. vi /etc/profile ...
分类:
其他好文 时间:
2020-07-04 19:08:39
阅读次数:
90
Hadoop2.7.7 centos7 完全分布式 配置与问题随记 这里是当初在三个ECS节点上搭建hadoop+zookeeper+hbase+solr的主要步骤,文章内容未经过润色,请参考的同学搭配其他博客一同使用,并记得根据实际情况调整相关参数。 0.prepare jdk,推荐1.8 关闭防 ...
分类:
其他好文 时间:
2020-07-04 18:52:39
阅读次数:
80
zookeeper3.5.5 centos7 完全分布式 搭建随记 这里是当初在三个ECS节点上搭建hadoop+zookeeper+hbase+solr的主要步骤,文章内容未经过润色,请参考的同学搭配其他博客一同使用,并记得根据实际情况调整相关参数 0.prepare 准备奇数台已经配置好jdk的 ...
分类:
其他好文 时间:
2020-07-04 18:40:31
阅读次数:
95
一.Flume定义 ? Flume是Cloudera公司提供的一个高可用、高可靠、分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。 ? Flume最主要的作用就是,实时读取服务器的本地磁盘的数据,将数据写入到HDFS。 二.Flume基础架构 ? Flume基本组成架构如下 ...
分类:
Web程序 时间:
2020-07-03 23:51:14
阅读次数:
112
https://blog.csdn.net/qq_41685616/article/details/106136013?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-5.nonecas ...
分类:
其他好文 时间:
2020-07-01 14:28:22
阅读次数:
808
现阶段需要做数据库同步工作,目前调研了两个工具datax和kettle 这两者各有优缺点,基本的就不总结了。现在说说一些关键点: 基本方面: 1.datax适合做数据同步工作;kettle适合数据清洗,转换工作 目前成型的可视化界面,datax推荐datax web,kettle后期维护用的界面推荐 ...
分类:
其他好文 时间:
2020-07-01 12:14:39
阅读次数:
421
背景 公司想要将业务系统使用的数据库由 SQL SERVER 切换到 ORACLE,因此需要将原 SQL SERVER 库的数据同步到 ORACLE 库中。 因为涉及的数据表有几百张,数据约百G的级别,一张表开发一个Kettle 太过于繁琐了,因此考虑通过配置完成数据同步。 方案: SQLSERVE ...
分类:
其他好文 时间:
2020-06-30 20:13:31
阅读次数:
128
一.集群规划 Master Slave1 Slave2 Slave3 二.Hbase(HA)搭建 # tar -zxvf hbase-1.2.4-bin.tar.gz -C /usr/local/ 解压 # mv /usr/local/hbase-1.2.4 /usr/local/hbase 改名 ...
分类:
其他好文 时间:
2020-06-29 13:13:38
阅读次数:
58
一、准备工具 1、数据库 HBaseServerless版 2、ECS 阿里云 Centos 8.1 二、下载命令工具。 1、点击一键生成配置可以获取配置信息,保存到本地。 2、点击 “HBase Serverless Shell 下载” 可以下载shell命令。 3、将 本地配置信息替换 alih ...
分类:
数据库 时间:
2020-06-29 11:15:42
阅读次数:
107