直接代码吧:记得要开启hive jdbc服务hive --service hiveserverpackage hive;import java.sql.Connection;import java.sql.DriverManager;import java.sql.ResultSet;import ...
分类:
数据库 时间:
2014-07-28 15:08:33
阅读次数:
283
-- 向数据表中加载文件,不会对数据进行任何转换,load操作只是复制(本地到hdfs)、移动(hdfs上的文件)-- 如果表包含分区,则必须指定每个分区的分区名,filepath可以引用一个文件或一个目录-- 如果数据在hdfs上,且filepath不是绝对的,则hive会相对于/user/进行解...
分类:
其他好文 时间:
2014-07-28 15:06:33
阅读次数:
210
1、列裁剪select a,b from t where e < 10;设置参数:hive.optimize.cp = true2、分区裁剪select * from (select c1,count(1) from t group by c1) subqwhere subq.prtn = 100;...
分类:
其他好文 时间:
2014-07-28 15:04:23
阅读次数:
199
Apache Spark MLlib是Apache Spark体系中重要的一块拼图:提供了机器学习的模块。不过,目前对此网上介绍的文章不是很多。拿KMeans来说,网上有些文章提供了一些示例程序,而这些程序基本和Apache Spark 官网上的程序片断类似:在得到训练模型后,几乎都没有展示如何使用该模型、程序执行流程、结果展示以及举例测试数据等部分。笔者根据Apache Spark官网上的程序片断,写了一个完整的调用MLlib KMeans库的测试程序,并成功在Spark 1.0 + Yarn 2.2 的...
分类:
其他好文 时间:
2014-07-28 00:01:39
阅读次数:
343
Spark SQL 中Catalyst的核心优化器Optimizer源码剖析...
分类:
数据库 时间:
2014-07-26 02:17:36
阅读次数:
390
Tigase是一种XMPP服务器,可以作为采用XMPP协议的各种IM(Instant Messeging)工具(如Pandion、Spark等)的服务器。在Linux环境下安装Tigase的步骤如下:(1)下载安装文件到https://projects.tigase.org/projects/tig...
分类:
系统相关 时间:
2014-07-25 18:58:52
阅读次数:
733
见明知意的文件名,还用我来介绍??可以说我闲的蛋疼,反正我已经做了记录了,哈哈 ? sbin目录下的脚本文件 slaves.sh???????????????在所有定义在${SPARK_CONF_DIR}/slaves的机器上执行一个...
分类:
其他好文 时间:
2014-07-25 00:07:34
阅读次数:
241
Spark SQL Catalyst的核心类库TreeNode详解,配有实例,图文并茂。...
分类:
数据库 时间:
2014-07-24 23:37:23
阅读次数:
895
Hive 命令行
Hive 命令行示例
?从命令行执行指定的sql语句
?$HIVE_HOME/bin/hive -e 'select a.col from tab1 a'
?以指定的hive环境变量执行指定的sql语句
?$HIVE_HOME/bin/hive -e 'select a.col from tab1 a' -hiveconf hive.exec.scr...
分类:
其他好文 时间:
2014-07-24 23:11:14
阅读次数:
256
* Flex开发中可用两种语言1.MXML2.ActionScript* Flex中使用两个组件集1.MX (mx.*) 早期的Flex版本用到的组件集2.Spark (spark.*) Flex4及以后的版本用到的组件集。Spark比MX组件有更多皮肤外观及其它方面的优点。它们有相同的组件(如按钮...
分类:
其他好文 时间:
2014-07-24 22:02:42
阅读次数:
292