hyperbase和hbase一样,底层数据结构的存储依托于hdfs;今天我们对星环的大数据平台组件hyperbase在hdfs上的存储做一下简单的介绍; TDH: 4.x系列 TDH4.9.2之后开始使用的版本是对应开源的1.3.1,之前版本对应的开源的0.98.6 5.x系列 TDH5.2.3之 ...
分类:
其他好文 时间:
2020-04-21 11:23:59
阅读次数:
139
Node第三方mongo包 连接mongoDB 插入数据 导入数据 查询文档 删除文档 模板引擎 art template https://aui.github.io/art template/zh cn/docs/ ...
分类:
数据库 时间:
2020-04-20 21:35:58
阅读次数:
86
hyperbase官方简介: Transwarp Hyperbase实时数据库是建立在Apache HBase和Elasticsearch基础之上,融合了多种索引技术、分布式事务处理、全文实时搜索、图形数据库在内的实时NoSQL数据库。 个人总结: hyperbase是基于开源hbase+hive的 ...
分类:
其他好文 时间:
2020-04-20 16:12:19
阅读次数:
280
1. 概述 1.1 hive的特征: 可以通过SQL轻松访问数据的工具,从而实现数据仓库任务,如提取/转换/加载(ETL),报告和数据分析; 它可以使已经存储的数据结构化; 可以直接访问存储在Apache HDFS或其他数据存储系统(如Apache HBase)中的文件; Hive除了支持MapRe ...
分类:
其他好文 时间:
2020-04-19 19:49:32
阅读次数:
86
HBase的前提条件: JDK SSH Hadoop JDK:Hadoop和JDK运行的环境,他们的守护进程运行在JVM下。HBase支持JDK 1.6以上的版本。比如: jdk-8u161-linux-x64.rpm。 SSH:实现简单的服务器与主机的通信。在集群中,只有启动sshd后,才可以通过 ...
分类:
系统相关 时间:
2020-04-19 00:46:23
阅读次数:
101
今天开始着手学习一款功能相当强大的绘图,数据处理的软件,在科研界赫赫有名的Origin。 Origin是图形可视化和数据分析软件,是科研人员和工程师常用的高级数据分析和制图工具。是公认的简单易学、操作灵活、功能强大的软件,既可以满足一般用户的制图需要,也可以满足高级用户数据分析、函数拟合的需要。 话 ...
分类:
其他好文 时间:
2020-04-18 22:34:14
阅读次数:
125
安装前准备: 首先,要有一个HDFS集群,并正常运行; regionserver应该跟hdfs中的datanode在一起 其次,还需要一个zookeeper集群,并正常运行 然后,安装HBASE 开始安装hbase集群 1.解压安装包 tar -zvxf hbase-1.2.1-bin.tar.gz ...
分类:
其他好文 时间:
2020-04-18 18:35:01
阅读次数:
74
前言: 说起HBase这门技术,在认知上对于稍微接触或使用过它的人来讲,可能只是百千数据库中一个很普通的库,大概就像我对Redis的认知一样:缓存嘛!可对于HBase,我确实是带着某些感情在的。今日突然萌生了一个生趣的想法,想抛开技术的视角,从情感的角度,像写小说一样,写写这位老朋友,这可能会有点滑 ...
分类:
数据库 时间:
2020-04-18 09:46:13
阅读次数:
79
先来想一下数据分析的流程,第一步获取数据,因此本节内容就是获取数据以及对数据的基本操作。 1.数据导入 1.1 导入.xlsx文件 要导入一个.xlsx后缀的Excel文件,可以使用pd.read_excel(路径)方法 结果: df_review数据包含了两个字段,listing_id和date ...
分类:
编程语言 时间:
2020-04-17 22:08:50
阅读次数:
317
这里以将Apache的日志写入到ElasticSearch为例,来演示一下如何使用Python将Spark数据导入到ES中。 实际工作中,由于数据与使用框架或技术的复杂性,数据的写入变得比较复杂,在这里我们简单演示一下。 如果使用Scala或Java的话,Spark提供自带了支持写入ES的支持库,但 ...
分类:
编程语言 时间:
2020-04-17 00:06:51
阅读次数:
83