工作需要,大数据相关组件又得重新搭建,整理了一下。序号主机名IP程序CPU内存磁盘操作系统1ambari.dev.smcaiot.com172.16.4.74Ambari4C24GB200GBCentOSLinuxrelease7.4.1708(Core)2master.dev.smcaiot.com172.16.4.74Master4C24GB200GBCentOSLinuxrelease7.4
分类:
其他好文 时间:
2020-03-10 23:28:13
阅读次数:
115
把RDD写入到文本文件中 分布式文件系统HDFS的数据读写 JSON文件数据读写 (注scala 2.11.8运行不了) ...
分类:
其他好文 时间:
2020-03-10 21:53:58
阅读次数:
76
demo 1 package com.bjsxt.hbase; 2 3 import java.io.IOException; 4 5 import org.apache.hadoop.conf.Configuration; 6 import org.apache.hadoop.hbase.Cell ...
分类:
编程语言 时间:
2020-03-10 19:46:43
阅读次数:
55
HDFS的定义? Hadoop分布式文件管理系统。旨在对不同系统上的文件进行统一的管理。它是一个文件系统,用于存储文件,通过目录树来定位文件,其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。 使用场景? 适合一次写入,多次读出的场景,且不支持文件的修改,适合用来做数据 ...
分类:
其他好文 时间:
2020-03-10 11:56:30
阅读次数:
66
背景:1、ApacheSentry是Cloudera公司发布的一个Hadoop开源组件,它提供了细粒度级、基于角色的授权以及多租户的管理模式,2、Sentry当前可以和Hive/Hcatalog、ApacheSolr和ClouderaImpala集成,为这些组件提供权限管理服务。3、基于角色的管理(role-basedacesscontrol)通过创建角色,将每个组件的权限授予给此角色,然后在用户
分类:
其他好文 时间:
2020-03-09 19:38:28
阅读次数:
72
执行hadoop的相关命令时,总提示如下: ]$ hadoop fs -ls / 2020-03-09 16:09:39,384 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... ...
分类:
其他好文 时间:
2020-03-09 16:21:24
阅读次数:
52
官网 http://spark.apache.org/docs/2.3.1/rdd-programming-guide.html#accumulators http://spark.apache.org/docs/2.3.1/api/scala/index.html#org.apache.spark ...
分类:
其他好文 时间:
2020-03-08 17:55:40
阅读次数:
96
from:https://blog.csdn.net/zhanglh046/article/details/78505038 一 Spark SQL运行架构Spark SQL对SQL语句的处理和关系型数据库类似,即词法/语法解析、绑定、优化、执行。Spark SQL会先将SQL语句解析成一棵树,然后 ...
分类:
数据库 时间:
2020-03-08 16:00:50
阅读次数:
107
Spark官方自带了WordCount的样例,我们也可以自己实现,加深对Spark的理解。 import org.apache.spark.{SparkConf, SparkContext}object WordCount { def main(args: Array[String]): Unit ...
分类:
其他好文 时间:
2020-03-08 13:44:44
阅读次数:
65
1、访问地址 http://192.168.0.123:8080/dfshealth.html#tab-overview 2、浏览文件 ...
分类:
Web程序 时间:
2020-03-07 12:39:43
阅读次数:
92