Hadoop实例视频教程-深入浅出Hadoop实战开发Hadoop是什么,为什么要学习Hadoop?Hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hado...
分类:
其他好文 时间:
2014-07-31 16:35:06
阅读次数:
177
1.环境工具版本介绍centos6.4(Final)jdk-7u60-linux-i586.gzhadoop-1.1.2.tar.gzsqoop-1.4.3.bin__hadoop-1.0.0.tar.gzmysql-5.6.11.tar.gz2.安装centos参照网上Ultra的使用制作了U盘启动,直接格式化安装系统,具体做法网上资料很多,但注意最好不要在安装时改主机名称,也最..
分类:
其他好文 时间:
2014-07-31 13:40:27
阅读次数:
264
HBase复制是一种在不同HBase部署中复制数据的方法。它可以作为一种故障恢复的方法,并提供HBase层次的高可用性。在实际应用中,例如,可以将数据从一个面向页面的集群复制到一个MapReduce集群,后者可以同时处理新数据和历史数据。然后再自动将数据传回面向页面请求的集群。
HBase复制中最基本的架构模式是“主推送”(master-push),因为每个region server都有自己的W...
分类:
其他好文 时间:
2014-07-31 13:28:06
阅读次数:
285
这篇文章是看了HBase权威指南之后,依据上面的解说搬下来的样例,可是略微有些不一样。HBase与mapreduce的集成无非就是mapreduce作业以HBase表作为输入,或者作为输出,也或者作为mapreduce作业之间共享数据的介质。这篇文章将解说两个样例:1、读取存储在hdfs上的txt文...
分类:
其他好文 时间:
2014-07-31 12:09:16
阅读次数:
261
敏捷数据科学:用Hadoop创建数据分析应用(数据分析最佳实践入门敏捷大数据首作分步骤|全流程演示思路、工具与方法)【美】RussellJurney(拉塞尔·朱尔尼)著冯文中朱洪波译ISBN978-7-121-23619-82014年7月出版定价:49.00元184页16开编辑推荐对大数据的挖掘需要投入大量的人力..
分类:
其他好文 时间:
2014-07-31 03:19:17
阅读次数:
410
SequenceFile是一个由二进制序列化过的key/value的字节流组成的文本存储文件。基于压缩类型CompressType,共有三种SequenceFileWriter:publicstaticenumCompressionType{
/**不压缩*/
NONE,
/**只压缩value*/
RECORD,
/**压缩很多记录的key/value成一块*/
BLOCK
}Therearethre..
分类:
其他好文 时间:
2014-07-31 03:19:07
阅读次数:
486
为了方便自己回顾记忆,将今天实验的hadoop命令总结一下,方便后续查看。注意,下述命令是在hadoop/bin 下操作的。1.hadoop fs -ls \ ->查看当前下面的所有目录。2.hadoop fs -mkdir xxx ->创建xxx文件夹在hadoop文件系统上。3.hadoop ....
分类:
其他好文 时间:
2014-07-31 02:18:05
阅读次数:
283
1、做好下文中的所有配置:Hadoop1.2.1分布式安装-1-准备篇。 2、Hadoop2.x的发行版中有个小问题:libhadoop.so.1.0.0在64位OS中存在问题,因为它是32位的,在64位OS中hadoop启动时会报一个WARN的日志。这个包的作...
分类:
其他好文 时间:
2014-07-31 00:13:05
阅读次数:
286
最近项目需要用到hadoop,自己动手一步一步安装hadoop...
分类:
其他好文 时间:
2014-07-31 00:07:25
阅读次数:
410