“大数据”已成为近三年来使用频率最高的技术热词,越来越多的企业开始拥抱大数据技术,并将大数据应用引入到日常生产经营环境中。相应的市场也在 这一年中出现了迅速增长,和大数据相关的Hadoop及其生态系统技术变成了数据科学家们的常用工具。市场研究机构IDC预测:至2016 年,Hadoop将实现8.12...
分类:
其他好文 时间:
2014-08-13 18:10:16
阅读次数:
219
关系行数据库与非关系型数据库之间的数据同步 sqoop...
分类:
其他好文 时间:
2014-08-13 15:02:06
阅读次数:
226
hadoop2 hive0.13.0 hbase 0.98.2版本集成错误总结...
分类:
其他好文 时间:
2014-08-13 15:01:16
阅读次数:
246
【课程内容】1、Hadoop分布式文件系统(HDFS)2、YARN/MapReduce的工作原理3、如何优化Hadoop机群所需要的硬件配置4、搭建Hadoop机群所需要考虑的网络因素5、Hadoop机群维护和控制6、如何利用Hadoop配置选项进行系统性能调优7、如何利用FairScheduler...
分类:
其他好文 时间:
2014-08-13 14:51:36
阅读次数:
288
1.flume 2.storm 3.hadoop 4.crawler 5.nutch 6.opentsd 7.tigase 8.flume +shell 收集日志,方便在线以及离线分析 9.redis 做用户行为分析的利器 10.maven 11.git 12.ruby 13.python 14.p...
分类:
其他好文 时间:
2014-08-13 14:29:36
阅读次数:
302
hadoop编译 hadoop2.2.0 64 位编译 CentOS6.5、Hadoop-2.2.0、64 位的编译...
分类:
其他好文 时间:
2014-08-13 13:04:26
阅读次数:
227
Hadoop是Java写的,他无法使用Linux预安装的OpenJDK,因此安装hadoop前需要先安装JDK(1.6以上) 原材料:在Oracle官网下载的32位JDK: 说明: 1、CentOS 7.0系统现在只有64位的,但是,Hadoop一般支持32位的,在64位环境下有事会有Warning...
分类:
其他好文 时间:
2014-08-13 12:58:56
阅读次数:
296
安装环境:系统:Ubuntu 12.10hadoop:0.23.6jdk:sun 1.7.0_21安装步骤:一.安装JDK安装 orcale jdk,并且配置环境以及设置成默认(略)检查jdk是否正确安装和配置在主目录下执行java -version如果出现下面类似结果则okhadoop@ubunt...
分类:
其他好文 时间:
2014-08-12 21:59:24
阅读次数:
404
Pig Latin UDF语句
REGISTER 在Pig运行时环境中注册一个JAR文件
DEFINE 为UDF、流式脚本或命令规范新建别名
Pig Latin命令类型
kill 中止某个MapReduce任务
exec 在一个新的Grunt shell程序中以批处理模式运行一个脚本
run 在当前Grunt外壳程序中运行程序
quit 退出解释器
...
分类:
其他好文 时间:
2014-08-12 19:06:04
阅读次数:
362
Hive 运行架构
由Facebook开源,最初用于解决海量结构化的日志数据统计问题:ETL工具;
构建于Hadoop的HDFS和MapReduce智商,用于管理和查询结构化/非结构化数据的数据仓库;
设计目的是让SQL技能良好,但Java技能较弱的分析师可以查询海量数据:
使用HQL作为查询接口;
使用HDFS作为存储底层;...
分类:
其他好文 时间:
2014-08-12 19:05:44
阅读次数:
314