参考文献 WikiNotes/「云计算」 Wikipedia/Cloud computing ...
分类:
其他好文 时间:
2021-01-12 10:42:25
阅读次数:
0
搭建在单一服务器 基于官方文档 http://hadoop.apache.org/docs/r2.7.2/hadoop-project-dist/hadoop-common/SingleCluster.html#Pseudo-Distributed_Operation 1、配置:hadoop-env ...
分类:
其他好文 时间:
2021-01-11 11:23:14
阅读次数:
0
public static IFeatureClass FeatureToFeature(IFeatureClass SourFeature,IFeatureClass TargetFeature, List<ColumnInternationMapping> columnMapp,bool IsO ...
分类:
其他好文 时间:
2021-01-11 11:06:09
阅读次数:
0
概述:Spark 程序开发,调试和运行,intellij idea开发Spark java程序。分两部分,第一部分基于intellij idea开发Spark实例程序并在intellij IDEA中运行Spark程序.第二部分,将开发程序提交到Spark local或者hadoop YARN集群运行 ...
分类:
编程语言 时间:
2021-01-08 10:56:23
阅读次数:
0
什么是druid druid是一个为OLAP查询需求而设计的开源大数据系统,druid提供低延时的数据插入,实时的数据查询 druid使用Java开发,基于Jetty提供http rest服务,也提供了Java/Python等语言的工具包 druid是一个集群系统,使用zookeeper做节点管理和 ...
分类:
其他好文 时间:
2021-01-08 10:28:10
阅读次数:
0
Atlas 作用: 记录并展示Hive表字段含义,以及表和字段之间的数据血缘关系。 局限: 依赖HBase和solr。 Azkaban 作用: 实现任务流执行,满足任务间依赖关系。 局限: 任务能添加依赖的任务,但是不能传参数,任务流中任意一条路线断了,不能这条路线重启执行。 ...
分类:
其他好文 时间:
2021-01-07 12:23:38
阅读次数:
0
ZeroMQ是云计算时代最好的通讯库 为什么一个通讯的库不提供socket的风格,反而看起来像是一个并行的库? 云计算不就是分布式计算嘛! 并行、多核、分布式,让计算能力不断的被扩展扩展,让数据不断地被分区分区,强大的计算能力就是这样堆出来的。 并发是目前云计算这个世界的主题,所以ZMQ提供了一个并 ...
分类:
其他好文 时间:
2021-01-07 12:23:26
阅读次数:
0
1.为什么安装Impala一定要先安装Hive? Impala是基于Hive的大数据实时分析查询引擎,直接使用Hive的元数据库Metadata,意味着impala元数据都存储在Hive的metastore中。 2.Impala与Hive的关系? Impala 与Hive都是构建在Hadoop之上的 ...
分类:
其他好文 时间:
2021-01-06 11:58:32
阅读次数:
0
0.创建用户并付权限 sudo useradd iwbdsudo passwd iwbd 配置iwbd用户具有root权限 修改/etc/sudoers文件,找到下面一行(91行),在root下面添加一行,如下所示:## Allow root to run any commands anywhere ...
分类:
其他好文 时间:
2021-01-04 11:30:50
阅读次数:
0
所学时间(包括上课) 9个小时 代码量(行) 1300 博客量 1篇 了解到的知识点 centos虚拟机的安装以及 大数据相应所用的软件安装 以及环境的配置 ...
分类:
其他好文 时间:
2021-01-02 11:40:57
阅读次数:
0