# Hadoop-2.2.0+Hbase-0.96.2+Hive-0.13.1分布式环境整合,超详细哦
# 学习前言
一些基本的东西就不说了,前面已经说过,比如ssh免密码登录,时间同步等,如果不清楚的话请上面看Hadoop-1.x,或者Hadoop-2.X的搭建,那里面很详细。
本来这个早该整理完了,但是这段时间有点小忙,都没有时间去弄,不过今天终于把这个整理完了,以此来帮助那些想学这些新技术的朋友们,虽然整理的时候有点累,但是还是值得的。对云计算有兴趣的朋友可以加上面说的214293307这个群哦,一...
分类:
其他好文 时间:
2014-07-08 19:25:04
阅读次数:
702
前沿: Hive也采用类SQL的语法, 但其作为数据仓库, 与面向OLTP的传统关系型数据库(Mysql/Oracle)有着天然的差别. 它用于离线的数据计算分析, 而不追求高并发/低延时的应用场景. 最显著的特别是, Hive的数据是Schema On Read, 对数据的写入非常的自由和松散,....
分类:
其他好文 时间:
2014-07-07 09:53:53
阅读次数:
262
客户要求将现在的单个下载改成打包下载,正常思路就是将文件临时保存起来再打个压缩包下载,搞了很多天,没搞出来,有2个难题:1、原来保存的文件为tmp格式,怎样转成xls或xlsx正常的格式。2、将文件压成zip包之后打不开,总报错。我只能暂时放弃,找了一个折中的方法。就是将单个文件for循环下载,但由...
分类:
Web程序 时间:
2014-07-07 09:39:55
阅读次数:
304
sqoop是一个把关系型数据库数据抽向hadoop的工具。同时,也支持将hive、pig等查询的结果导入关系型数据库中存储。由于,笔者部署的hadoop版本是2.2.0,所以sqoop的版本是:sqoop-1.99.3-bin-hadoop2001、下载sqoop wget http://mirro...
分类:
其他好文 时间:
2014-07-06 15:37:41
阅读次数:
138
1、下载hive:wget http://mirrors.cnnic.cn/apache/hive/hive-0.12.0/hive-0.12.0.tar.gz2、解压hive安装文件 tar -zvxf hive-0.12.0.tar.gz3、配置hive环境变量,初始化hive在hdfs上的工作...
分类:
其他好文 时间:
2014-07-06 15:35:09
阅读次数:
146
关于导入excel报错的处理(xls,xlsx)最近在做一个将excel导入到dataGriview中的小功能在做的过程中遇到以下问题:链接excel的链接串是这样写的string strConnection = "Provider=Microsoft....
分类:
其他好文 时间:
2014-07-05 18:24:02
阅读次数:
143
之前一直用phpHiveAdmin,也一直在关注hue,最近打算调研一下hue,hue在最近两年发展很快,页面效果和功能上都有很大程度的提升,所支持的服务也越来越多,除了hive,hbase,目前还支持sqoop,impala,pig等。hue的一个大致架构如下图所示核心服务是HueServer,在本地使用SQLLite作..
分类:
其他好文 时间:
2014-07-04 06:16:59
阅读次数:
469
早在Spark Submit 2013里就有介绍到Spark SQL,不过更多的是介绍Catalyst查询优化框架。经过一年的开发,在今年Spark Submit 2014上,Databricks宣布放弃Shark 的开发,而转投Spark SQL,理由是Shark继承了Hive太多,优化出现了瓶颈,如图:
今天把Spark最新的代码签了下来,测试了一下:
1、编译Spar...
分类:
数据库 时间:
2014-07-03 16:06:04
阅读次数:
534
之前介绍了github上的hive2solr项目和solr的multivalue功能。线上我们是采用hive计算完数据后推送到solr的方法,如果需要实现multivalue的话,默认的hive2solr是有些问题的。即使在hive中对于的field是多个字,导入solr之后也只是一个整体的字符串,比如下面表的数据如下:idte..
分类:
其他好文 时间:
2014-07-03 14:10:57
阅读次数:
199