码迷,mamicode.com
首页 >  
搜索关键字:hadoop集群    ( 910个结果
Cloudera Manger CDH 安装文档
简介: Cloudera Manager 是 Cloudera 公司推出的 Hadoop 集群管理工具,通过该管理工具可以方便的部署、配置、监控集群。 Cloudera 公司自己发布的 Hadoop 版本叫 CDH,全称 Cloudera Distribution Hadoop。 环境介绍: 192 ...
分类:其他好文   时间:2017-03-27 13:34:17    阅读次数:466
基于OGG的Oracle与Hadoop集群准实时同步介绍
Oracle里存储的结构化数据导出到Hadoop体系做离线计算是一种常见数据处置手段。近期有场景需要做Oracle到Hadoop体系的实时导入,这里以此案例做以介绍。Oracle作为商业化的数据库解决方案,自发性的获取数据库事务日志等比较困难,故选择官方提供的同步工具OGG(Oracle Golde ...
分类:数据库   时间:2017-03-18 23:57:47    阅读次数:376
深入理解Hadoop集群和网络【转】
http://os.51cto.com/art/201211/364374.htm 本文将着重于讨论Hadoop集群的体系结构和方法,及它如何与网络和服务器基础设施的关系。最开始我们先学习一下Hadoop集群运作的基础原理。 云计算和Hadoop中网络是讨论得相对比较少的领域。本文原文由Dell企业 ...
分类:其他好文   时间:2017-03-16 18:36:38    阅读次数:212
Hadoop的多节点集群启动,唯独没有namenode进程?(血淋淋教训,一定拍快照)
前言 大家在搭建hadoop集群时,第一次格式化后,一路要做好快照。别随便动不动缺少什么进程,就来个格式化。 问题描述:启动hadoop时报namenode未初始化:java.io.IOException: NameNode is not formatted. 同时,若单独启动namenode,则出 ...
分类:系统相关   时间:2017-03-15 14:43:42    阅读次数:283
Hive_on_Spark安装配置详解
简介 本文主要记录如何安装配置Hive on Spark,在执行以下步骤之前,请先确保已经安装Hadoop集群,Hive,MySQL,JDK,Scala,具体安装步骤不再赘述。 背景 Hive默认使用MapReduce作为执行引擎,即Hive on mr。实际上,Hive还可以使用Tez和Spark ...
分类:其他好文   时间:2017-03-14 13:15:51    阅读次数:247
parquet文件格式——本质上是将多个rows作为一个chunk,同一个chunk里每一个单独的column使用列存储格式,这样获取某一row数据时候不需要跨机器获取
Parquet是Twitter贡献给开源社区的一个列数据存储格式,采用和Dremel相同的文件存储算法,支持树形结构存储和基于列的访问。Cloudera Impala也将使用Parquet作为底层的存储格式。在很多大数据的应用场景下面,比如电信行业,具有一定规则的数据,字段很多,但是每次查询仅仅针对 ...
分类:其他好文   时间:2017-03-14 13:14:35    阅读次数:368
python开发sparkSQL应用
准备条件:部署hadoop集群部署spark集群安装python(本人安装的是anaconda3,python是3.6)配置环境环境变量:vi.bashrc#添加如下内容 exportSPARK_HOME=/opt/spark/current exportPYTHONPATH=$SPARK_HOME/python/:$SPARK_HOME/python/lib/py4j-0.10.4-src.zipps:spark里面会自..
分类:数据库   时间:2017-03-10 19:26:13    阅读次数:1637
windows下eclipse 做hadoop开发
1、先安装好hadoop 集群 参考文档http://www.cnblogs.com/bornteam/p/6517960.html 1、先安装好hadoop 集群 参考文档http://www.cnblogs.com/bornteam/p/6517960.html 2、首先安装好集群,再把去下载h ...
分类:Windows程序   时间:2017-03-08 13:55:32    阅读次数:290
Dubbo—Zookeeper的典型应用
1.Zookeeper 作为 Hadoop 项目中的一个子项目,是 Hadoop 集群管理的一个必不可少的模块,它主要用来控制集群中的数据,如它管理 Hadoop 集群中的 NameNode,还有 Hbase 中 Master Election、Server 之间状态同步等。Zoopkeeper 提 ...
分类:其他好文   时间:2017-03-01 16:13:25    阅读次数:145
Apache Hadoop集群安装(NameNode HA + SPARK + 机架感知)
1、主机规划序号主机名IP地址角色1nn-1192.168.9.21NameNode、mr-jobhistory、zookeeper、JournalNode2nn-2192.168.9.22Secondary NameNode、JournalNode3dn-1192.168.9.23DataNode... ...
分类:Web程序   时间:2017-03-01 15:54:24    阅读次数:576
910条   上一页 1 ... 43 44 45 46 47 ... 91 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!