码迷,mamicode.com
首页 >  
搜索关键字:hadoop 2.7.2 大数据 hdfs ha    ( 28781个结果
Lucene suggest [转]
TheBig Data Zoneis presented bySplunk, the maker of data analysis solutions such asHunk, an analytics tool for Hadoop, and theSplunk Web Framework.Liv...
分类:其他好文   时间:2014-05-08 19:31:55    阅读次数:596
大数据
大数据是一个体量特别大,数据类别特别大的数据集。也就是说“大数据”本身并不是一种新的技术,也不是一种新的产品, 而是我们这个时代出现的一种现象。而这个“大”达到了一种什么样的程度呢?可以说他即将突破现有常规软件所能提供的能力极限。 综上所述,我们觉得使用麦肯锡的定义可能会更为简洁明了:大数据是指无法...
分类:其他好文   时间:2014-05-08 12:30:00    阅读次数:301
Hadoop-4、Mapred数据去重
import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.Text;import org.ap...
分类:其他好文   时间:2014-05-08 11:27:24    阅读次数:309
Hadoop-5、排序(Combiner泛谈)
一、Combiner作用1、combiner最基本是实现本地key的聚合,对map输出的key排序,value进行迭代。如下所示:map: (K1, V1) → list(K2, V2)combine: (K2, list(V2)) → list(K2, V2)reduce: (K2, list(V...
分类:其他好文   时间:2014-05-08 09:37:49    阅读次数:472
hive-mysql安装配置
默认情况下,hive的元数据信息存储在内置的Derby数据中。Facebook将hive元数据存储在关系数据库1、安装好mysql ,sudo apt-get install mysql-server2、创建mysql用户hadoop $mysql-uroot-p 进入root用户 mysql>.....
分类:数据库   时间:2014-05-07 20:40:00    阅读次数:554
推荐一本大数据的书籍,非技术类
因为关注大数据,也写过若干关于大数据的文章,做过若干关于大数据的演讲,所以对有关这一主题的论文和书籍非常有兴趣。过去几年,在这方面读过十几本书,上百篇论文和文章。相对而言,舍恩伯格的《大数据时代》是迄今为止我读过的最好的一本专著,中英文都算上。此书的一大贡..
分类:其他好文   时间:2014-05-07 15:24:59    阅读次数:226
VMware虚拟化技术之八vSphere App HA部署
概述AppHA是vSphereHA的延伸,从保护虚拟机延伸到到保护虚拟机上运行的应用服务。vSphereAppHA是vSphereWebClient的插件。通过vSphereAppHA,可以为您的环境中的虚拟机上运行的应用程序定义高可用性。功能通过vSphereAppHA,可以使用vSphereWebClient定义您的环境中的虚拟机上..
分类:移动开发   时间:2014-05-07 11:36:19    阅读次数:656
Flume-NG源码阅读之HDFSEventSink
HDFSEventSink是flume中一个很重要的sink,配置文件中type=hdfs。与此sink相关的类都在org.apache.flume.sink.hdfs包中。 HDFSEventSink算是一个比较复杂的sink,包下涉及的源代码文件数多达13个。。。可配置的参数众多。。。希望...
分类:其他好文   时间:2014-05-07 02:06:05    阅读次数:563
Hadoop-3、Mapred并行思想WordCount
import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.ap...
分类:其他好文   时间:2014-05-07 01:06:02    阅读次数:271
Hbase学习笔记(安装和基础知识及操作)
参考书籍: Hadoop in action, 吴超沉思录1.Hbase简介 1.面向列的分布式数据库 2. 以HDFS作为文件系统 3. 利用MapReduce处理Hbase中海量数据 4. ZookKeeper作为协调工具 5. sqoop提供Hbase到关系型数据库中数据导入功能 ...
分类:其他好文   时间:2014-05-07 00:35:59    阅读次数:424
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!