现在大家可以跟我一起来实现Ubuntu 12.04下Hadoop 2.2.0
集群搭建,在这里我使用了两台服务器,一台作为master即namenode主机,另一台作为slave即datanode主机,增加更多的slave只需重复slave部分的内容即可。系统版本:master:Ubuntu
12....
分类:
其他好文 时间:
2014-06-10 22:01:07
阅读次数:
423
hadoop上进行kmeans聚类,一次迭代只使用一个mapreduce...
分类:
其他好文 时间:
2014-06-10 14:01:32
阅读次数:
236
1HDFS概述HDFS是Hadoop应用用到的一个最主要的分布式存储系统。一个HDFS集群主要由一个NameNode和很多个Datanode组成:Namenode管理文件系统的元数据,而Datanode存储
了实际的数据。本文档主要关注用户以及管理员怎样和HDFS进行交互。基本上,客户端联系Name...
分类:
其他好文 时间:
2014-06-10 12:40:13
阅读次数:
275
本文旨在介绍通过两台物理节点,实现完全分布式hadoop程序的安装部署。
分类:
其他好文 时间:
2014-06-10 10:13:49
阅读次数:
313
结论:RAC存在故障,当前RAC运行为RAC1节点上,负载均衡没有起到作用。集成商提供的ASM的帐号密码不正确,RAC运行存在大量SGA/PGA的死锁,而且session存在严重等待。部分SQL语句需要进行优化。 配置问题1、 RAC 的ASM权限不足2、 RAC1支撑运行,RAC2状态正常,但RAC2无法进行负载。3、 死锁严重,这是造成性能慢低下的表现原因。4、 操作系统的IO和内存利...
分类:
其他好文 时间:
2014-06-10 07:16:52
阅读次数:
282
第一章针对系统调用过多的优化我这次的优化针对syscall调用过多的问题,所以使用strace跟踪apache进行分析。1.apache2ctl -X
&使用-X(debug)参数启动httpd进程,这个时候只启动1个httpd进程2. ps -ef | grep
httpd找到需要strace的p...
分类:
Web程序 时间:
2014-06-09 19:59:24
阅读次数:
377
Map-reduce是一种优雅的数据处理方式,本文通过三个例子介绍如何用python在linux的管道进行map-reduce编程,本文写的所有map-reduce程序都可以原封不动的放在Hadoop下运行,很容易在大数据集上扩展。
分类:
其他好文 时间:
2014-06-09 19:11:44
阅读次数:
253
From:http://www.frostsky.com/2013/03/linux-performance-analysis-tool?wpmp_switcher=desktop前段时间看到brendangregg的
Linux Performance Analysis and Tools PPT...
分类:
系统相关 时间:
2014-06-09 17:10:01
阅读次数:
315
https://github.com/ihrwein/webhdfshttps://tiborbenke.blogs.balabit.com/2013/11/the-syslog-ng-in-the-hadoop-era/https://github.com/prezi/logboxhttp://d...
分类:
Web程序 时间:
2014-06-09 14:54:45
阅读次数:
198
百亿数量级的大数据项目,软硬件总体预算只有30万左右,需求是进行复杂分析查询,性能要求多数分析请求达到秒级响应。
遇到这样的项目需求,预算不多的情况,似乎只能考虑基于Hadoop来实施。
理论上Hadoop撑住百亿数量级没问题,但想要秒级响应各种查询分析就不行了。我们先大概分析一下Hadoop的优缺...
分类:
其他好文 时间:
2014-06-09 14:32:39
阅读次数:
509