Hive是一种构建在Hadoop上的数据仓库,Hive把SQL查询转换为一系列在Hadoop集群中运行的MapReduce作业,是MapReduce更高层次的抽象,不用编写具体的MapReduce方法。Hive将数据组织为表,这就使得HDFS上的数据有了结构,元数据即表的模式,都存储在名为meta....
分类:
其他好文 时间:
2014-05-23 05:54:55
阅读次数:
1771
hadoop
中对java的基本类型进行了writeable的封装,并且所有这些writeable都是继承自WritableComparable的,都是可比较的;并且,它们都有对应的get()
和 set()方法,其中对整型(int 和 long)进行编码的时候,有固定长度格式(intWritabl...
分类:
其他好文 时间:
2014-05-23 03:10:15
阅读次数:
207
Hadoop Eclipse 开发工具 主要分为1、根据Hadoop版本生成插件2、安装Hadoop
Eclipse插件3、配置Hadoop目录4、配置Hadoop连接5、新一个MapReduce工程WordCount.javaMapReduce——WordCount问题总结参考:http://bl...
分类:
系统相关 时间:
2014-05-23 02:44:30
阅读次数:
354
Hadoop 运行环境准备运行环境部署结构介绍Linux
CentOS6.5安装(Hadoop环境配置)Linux
常用远程管理工具介绍SSH免密码登录配置Hadoop安装及配置Hadoop验证-WordCount执行Hadoop开发工具准备Hadoop Eclipse
Plugin配置安装及验证H...
分类:
其他好文 时间:
2014-05-23 02:41:15
阅读次数:
211
通过MapReduce程序分析气象数据集,更好的了解计算过程。环境:Hadoop 1.2.1
& Centos 6.5
x641、气象数据集准备下载链接:ftp://ftp3.ncdc.noaa.gov/pub/data完整数据集非常大,可以下载部分数据集作为日常实验数据。2、气象数据上传到HDFS...
分类:
其他好文 时间:
2014-05-22 15:39:14
阅读次数:
361
Servlet
运行在Servlet容器中,比如Jetty、Tomcat等都是Servlet容器。Servlet容器已成为一种独立发展的标准化产品,种类已不少,不好说哪个好哪个坏,视不同的应用场景来选择合适的容器,在定制化和移动领域有不错的发展的有日渐流行的Jetty,但是大多数企业级应用用的还.....
分类:
其他好文 时间:
2014-05-21 17:59:34
阅读次数:
203
代志远早年就职网易研究院从事MapReduce与DFS系统的自主研发,后加入支付宝数据平台负责Hadoop与HBase体系的架构设计与二次研发,支付宝流计算与分布式搜索系统的设计和研发,后成为支付宝海量计算体系架构师兼支付宝三代架构成员。现就转战于阿里巴巴集团-CDO-海量数据部门,负责创新性项目的研究和跟进,目前专注于Google第二代数据库产品MegaStore的研究和在阿里的落地。
在...
分类:
数据库 时间:
2014-05-21 17:04:40
阅读次数:
393
基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析
课程讲师:迪伦
课程分类:Java
适合人群:高级
课时数量:96课时
用到技术:MapReduce、HDFS、Map-Reduce、Hive、Sqoop
涉及项目:Greenplum Hadoop大数据分析平台
更新程度:完毕
对这个课程有兴趣的朋友可以加我的QQ2059055336和...
分类:
其他好文 时间:
2014-05-21 13:23:22
阅读次数:
363
目的
此文档描述了如何为Hadoop配置和管理 Service Level Authorization 。
预备条件
确保已经安装Hadoop,配置和设置都正确了。更多细节,请看:* 首次使用者的单节点设置 * 大的、分布式集群的集群设置。
概览
Service Level Authorization 是一个必要的初始认证机制,其确保客户端连接到一个有必要的、预配置的、权...
分类:
其他好文 时间:
2014-05-21 08:13:32
阅读次数:
227