码迷,mamicode.com
首页 >  
搜索关键字:hive    ( 5904个结果
haproxy代理hive
globaldaemonnbproc1pidfile/var/run/haproxy.pidulimit-n65535defaultsmodetcp#mode{tcp|http|health},tcp表示4层,http表示7层,health仅作为健康检查使用retries2#尝试2次失败则从集群摘除optionredispatch#如果失效则强制转换其他服务器optionabortonclose#连接数过大自动..
分类:其他好文   时间:2016-09-27 11:55:38    阅读次数:130
centos配置环境变量
配置环境变量进入环境变量配置目录,这里需要切换到root用户:cd/etc/profile.d创建配置文件:touchhive-1.1.0.sh打开配置文件:vihive-1.1.0.sh配置环境变量:#sethiveenvironmentHIVE_HOME=/home/hadoop/hive-1.1.0PATH=$HIVE_HOME/bin:$PATHCLASSPATH=$CLASSPATH:$HIVE_HOME/..
分类:其他好文   时间:2016-09-26 21:53:52    阅读次数:181
HIVE简明教程
完整PDF下载:《HIVE简明教程》 前言 Hive是对于数据仓库进行管理和分析的工具。但是不要被“数据仓库”这个词所吓倒,数据仓库是很复杂的东西,但是如果你会SQL,就会发现Hive是那么的简单,简单到甚至不用学就可以使用Hive做出业务需求所需要的东西。 但是Hive和SQL毕竟不同,执行原理、 ...
分类:其他好文   时间:2016-09-24 19:02:23    阅读次数:159
Gradle实战:执行sql操作hive数据库
查看原文:http://blog.csdn.net/u010818425/article/details/52490628 Gradle实战系列文章: 《Gradle基本知识点与常用配置》 《Gradle实战:Android多渠道打包方案汇总》 《Gradle实战:不同编译类型的包同设备共存》 《G ...
分类:数据库   时间:2016-09-24 17:42:15    阅读次数:248
4 weekend110的hive入门
Hive和HBase都很重要,当然啦,各自也有自己的替代品。 在公司里,SQL有局限,大部分时候,不需写mr程序的,用hive这个工具。 公司里的懂java开发员工不一定每个公司都有,但懂SQL开发员工很多。 Hive的替代品:impala、spark shark、spark sql… Hive、i ...
分类:其他好文   时间:2016-09-24 12:10:45    阅读次数:259
【Hadoop】HIVE 小结概览
一、HIVE概览小结 二、HIVE安装 三、HIVE基础 四、HIVE SQL 五、HIVE 自定义函数 ...
分类:其他好文   时间:2016-09-22 15:49:20    阅读次数:171
基于Zookeeper的分步式队列系统集成案例
基于Zookeeper的分步式队列系统集成案例 Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hca ...
分类:其他好文   时间:2016-09-21 10:13:51    阅读次数:253
hive 中 Order by, Sort by ,Dristribute by,Cluster By 的作用和用法
order by order by 会对输入做全局排序,因此只有一个reducer(多个reducer无法保证全局有序)只有一个reducer,会导致当输入规模较大时,需要较长的计算时间。 set hive.mapred.mode=nonstrict; (default value / 默认值) s ...
分类:其他好文   时间:2016-09-19 17:59:22    阅读次数:132
hive metastore异常 org.apache.thrift.protocol.TProtocolException: Missing version in readMessageBegin, old client
hiveserver2的端口是10000hive.metastoe.uris 的端口9083改为10000之后 beelien 连接hiveserver2报错 Error: Could not open client transport with JDBC Uri: jdbc:hive2://172 ...
分类:Web程序   时间:2016-09-19 17:48:08    阅读次数:838
Spark运行原理及RDD解密
Spark是分布式内存计算框架,而不是分布式内容存储框架,搭配tachyon分布式内存文件系统,会更加有效果。在文件模式下,spark比hadoop快10倍,在内存计算模式下,快100倍!下面是一些1spark是分布式基于内存特别适合于迭代计算的计算框架2mapReduce就两个阶段map和reduce,而sp..
分类:其他好文   时间:2016-09-19 14:34:45    阅读次数:154
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!