如果你对项目管理、系统架构有兴趣,请加微信订阅号“softjg”,加入这个PM、架构师的大家庭
随着BIG
DATA大数据概念逐渐升温,如何搭建一个能够采集海量数据的架构体系摆在大家眼前。如何能够做到所见即所得的无阻拦式采集、如何快速把不规则页面结构化并存储、如何满足越来越多的数据采集还要在有限时间...
分类:
其他好文 时间:
2014-05-12 17:06:14
阅读次数:
396
环境:OS:Centos 6.5 x64 & Soft:Hadoop
1.2.11、查看当前块大小,默认64M。[huser@master hadoop-1.2.1]$ bin/hadoop fs -stat "%o"
./in/test1.txt671088642、修改hdfs-site.conf...
分类:
其他好文 时间:
2014-05-06 08:59:21
阅读次数:
368
------本文大纲简介DRBD资源属性原理安装DRDBDRDB实现高可用============一、简介DRBD是一种块设备,可以被用于高可用(HA)之中。它类似于一个网络RAID-1功能。当你将数据写入本地文件系统时,数据还将会被发送到网络中另一台主机上。以相同的形式记录在一个文件系统中。本地(主..
分类:
数据库 时间:
2014-05-03 02:13:25
阅读次数:
989
本文将介绍Hadoop中的重点MapReduce的入门知识。(1)MapReduce概述MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题。MR由两个阶段组成:Map和Reduce,在Hadoop中用户只需要实现map()和reduce()两个函数,即可实现分布式计算,非常简单..
分类:
其他好文 时间:
2014-05-03 01:53:48
阅读次数:
519
本文在上一节的基础上通过一个简单的MR示例对MapReduce的运行流程进行分析。假设有两行数据,分别是helloyou,hellome,我们要统计其中出现的单词以及每个单词出现的次数。所得的结果为hello2you1me1(1)大致运行流畅1.解析成2个<k,v>,分别是<0,helloyou><10,hel..
分类:
其他好文 时间:
2014-05-03 01:51:40
阅读次数:
382
DRBD(DistributedReplicatedBlockDevice)分布式复制块设备,它是Linux平台上的分散式储存系统,通常用于高可用性(highavailability,HA)集群中。DRBD类似磁盘阵列的RAID1(镜像),只不过RAID1是在同一台电脑内,而DRBD是透过网络。DRBDResource:DRBD所具有的几种属性:resou..
分类:
其他好文 时间:
2014-05-03 01:12:42
阅读次数:
747
在Ubuntu14.04下使用Hadoop2.4进行大数据开发之基础环境准备篇...
分类:
其他好文 时间:
2014-05-02 19:56:21
阅读次数:
367
模拟namenode崩溃,将name目录的内容全部删除,然后通过secondary
namenode恢复namenode。环境:OS:Centos 6.5 x64 & Soft:Hadoop
1.2.11、进入name目录下,删除name目录内容。[huser@master name]$ pwd/h...
分类:
其他好文 时间:
2014-05-02 14:44:28
阅读次数:
517
关系型数据库与非关系型数据库自1970年,埃德加·科德提出关系模型之后,关系数据库便开始出现,经过了40多年的演化,如今的关系型数据库具备了强大的存储、维护、查询数据的能力。但在关系数据库日益强大的时候,人们发现,在这个信息爆炸的“大数据”时代,关系型数据库遇到了性能方面的瓶颈,面对一个表中上亿条的...
分类:
数据库 时间:
2014-05-02 09:02:06
阅读次数:
365