一、部署可参考文档:http://archive.cloudera.com/cdh5/cdh/5/oozie-4.0.0-cdh5.3.6/DG_QuickStart.html1、解压oozie安装包:oozie-4.0.0-cdh5.3.6-src.tar.gzext-2.2.zip##解压[ro... ...
分类:
其他好文 时间:
2019-05-10 15:10:31
阅读次数:
162
包下载: 步骤: 集成spark CDH版本是5.14.0 spark安装版本是:2.1.0 包下载: parcel包下载 http://archive.cloudera.com/spark2/parcels/ 安装spark2 还要注意的是:在spark historyserver这台机器上,创建 ...
分类:
其他好文 时间:
2019-05-08 13:20:31
阅读次数:
159
配置文件:pom.xml 2.11.8 2.2.0 2.6.0-cdh5.7.0 cloudera cloudera https://repository.cloudera.com/artifactory/cloudera-repos/ org.scala-lang ... ...
分类:
其他好文 时间:
2019-05-07 19:44:14
阅读次数:
158
大数 据 主要 具有 四方 面的 典型 特征—— 规模 性( Volume)、 多样性( Variety)、 高速 性( Velocity) 和 价值 性( Value), 即 所谓 的" 4V"。 大数据时代的关键技术:(1) 大数 据 采集 技术(2) 大 数据 预处理 技术(3) 大数 据 存... ...
分类:
其他好文 时间:
2019-05-03 18:46:39
阅读次数:
288
解决1(常用,不同环境都能用): 打包时所用的所有jar整体打包, 执行时使用: java -cp (详见:) 解决2 将所有的包以及第三包保证都在classpath下,可以参考如下命令 export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:/opt/cloudera/ ...
分类:
编程语言 时间:
2019-05-03 09:38:33
阅读次数:
136
Cloudera Manager中修改配置可能报错: Incorrect string value: '\xE7\xA8\x8B\xE5\xBA\x8F...' for column 'MESSAGE' at row 1 这是一个mysql的字符集问题,极有可能创建scm数据库时使用默认的latin ...
分类:
其他好文 时间:
2019-04-30 01:14:23
阅读次数:
158
Apache Hadoop的服务的部署比較繁琐。须要手工编辑配置文件、下载依赖包等。Cloudera Manager以GUI的方式的管理CDH集群,提供向导式的安装步骤。因为须要对Hive,HBase,Impala,Spark进行功能測试,就採用了Cloudera Manager方式进行安装。 Cl ...
分类:
其他好文 时间:
2019-04-23 09:17:26
阅读次数:
362
cdh版本:5.14主要参照官方文档:https://www.cloudera.com/documentation/enterprise/5-14-x/topics/sentry.html一.部署sentry服务1.配置:官方建议将hivemetastore的heapsize至少设为10GB:SettheHMSheapsizetoatleast10GB.Thisisrequiredbecauseb
分类:
其他好文 时间:
2019-04-15 19:55:11
阅读次数:
826
1.Hue 概述及版本下载 1)概述 Hue是一个开源的Apache Hadoop UI系统,最早是由Cloudera Desktop演化而来,由Cloudera贡献给开源社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行 ...
分类:
其他好文 时间:
2019-04-15 18:02:18
阅读次数:
570
一、发行版本 ? Hadoop发行版本分为开源 社区版 和 商业版 ,社区版是指由Apache软件基金会维护的版本,是官方维护的版本体系。商业版Hadoop是指由第三方商业公司在社区版Hadoop基础上进行了一些修改、整合以及各个服务组件兼容性测试而发行的版本,比较著名的有cloudera的CDH、 ...
分类:
其他好文 时间:
2019-04-14 16:33:00
阅读次数:
168