码迷,mamicode.com
首页 >  
搜索关键字:hadoop zookeeper    ( 18907个结果
基于MySQL元数据的Hive的安装和简单测试
Hive是一种强大的数据仓库查询语言,类似SQL,本文将介绍如何搭建Hive的开发测试环境。...
分类:数据库   时间:2014-08-10 01:50:39    阅读次数:449
Hive基础之Hive是什么以及使用场景
Hive是什么1)Hive 是建立在Hadoop (HDFS/MR)上的用于管理和查询结果化/非结构化的数据仓库;2)一种可以存储、查询和分析存储在Hadoop 中的大规模数据的机制;3)Hive 定义了简单的类SQL 查询语言,称为HQL,它允许熟悉SQL 的用户查询数据;4)允许用Java开发自...
分类:其他好文   时间:2014-08-09 23:10:49    阅读次数:288
从Hadoop框架与MapReduce模式中谈海量数据处理(含淘宝技术架构)
从hadoop框架与MapReduce模式中谈海量数据处理前言 几周前,当我最初听到,以致后来初次接触Hadoop与MapReduce这两个东西,我便稍显兴奋,认为它们非常是神奇,而神奇的东西常能勾起我的兴趣,在看过介绍它们的文章或论文之后,认为Hadoop是一项富有趣味和挑战性的技术,且它还牵扯到...
分类:其他好文   时间:2014-08-09 18:40:08    阅读次数:297
(3)windows下hadoop+eclipse环境搭建
(1)环境说明 hadoop的集群环境我已经在虚拟机上搭建并能正常运行(见前2篇文章),现在我要在windows下搭建hadoop+eclipse的开发环境。 (2)安装hadoop-eclipse-plugin-1.1.2.jar插件 hadoop-eclipse-plugin-1.1.2.jar这个插件大家可以自己编译,或者直接到网上下载。我是直接在网上下载安装。 下载好后,将ha...
分类:Windows程序   时间:2014-08-09 11:35:37    阅读次数:318
Cloudera hadoop-2.3.0-cdh5.1.0 在Centos 6.5 下的安装
安装前准备 1.  虚拟机3个,安装Centos 6.5, 内存设置为4GB  2.  配置yum源为163(不配置,在安装软件时,慢的要死) 3. 关闭防火墙( iptables),disabled SELinux 4. 配置静态IP,并在/etc/hosts中将Hadoop集群中的主机名加进去 安装  1. 在Cloudera官网上下载 cloudera-manager-i...
分类:其他好文   时间:2014-08-09 00:12:07    阅读次数:313
hadoop2.4.1的ftp服务器搭建
把本地文件上传到hadoop的hdfs-over-ftp...
分类:其他好文   时间:2014-08-08 21:22:26    阅读次数:303
Hadoop学习笔记_7_分布式文件系统HDFS --DataNode体系结构
分布式文件系统HDFS--DataNode体系结构 1.概述 DataNode作用:提供真实文件数据的存储服务。 文件块(block):最基本的存储单位[沿用的Linux操作系统地概念]。对于文件内容而言,一个文件的长度大小是size,那么从文件的0偏移开始,按照固定的大小,顺序对文件进行划分并编号,划分好的每一个块称一个Block。 与Linux操作系统不同的是,一旦上传了一个小于Block大小...
分类:其他好文   时间:2014-08-08 21:20:36    阅读次数:364
Hadoop学习笔记_5_分布式文件系统HDFS --shell操作
分布式文件系统HDFS 分布式文件系统[Distributed File System]概述数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,因此迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统 。分布式文件系统特点:是一种允许文件通过网络在多台主机上分享的文件系统,可让多机器上的多用户分享文件和存储空间。通透性。让实际...
分类:其他好文   时间:2014-08-08 18:11:06    阅读次数:245
Hadoop学习笔记_6_分布式文件系统HDFS --NameNode体系结构
分布式文件系统HDFS--NameNode体系结构NameNode是整个文件系统的管理节点。它维护着整个文件系统的文件目录树[为了使得检索速度更快,该目录树放在内存中], 文件/目录的元信息和每个文件对应的数据块列表。接收用户的操作请求。Hadoop确保了NameNode的健壮性,不容易死亡.文件目录树以及文件/目录的元信息等归根到底是存放在硬盘中的,但是在Hadoop运行时,需要将其加载到内存中...
分类:其他好文   时间:2014-08-08 18:10:26    阅读次数:198
hive运行query语句时提示错误:org.apache.hadoop.ipc.RemoteException: java.io.IOException: java.io.IOException:
hive> select product_id, track_time from trackinfo limit 5; Total MapReduce jobs = 1Launching Job 1 out of 1Number of reduce tasks ...
分类:编程语言   时间:2014-08-08 17:52:46    阅读次数:313
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!