码迷,mamicode.com
首页 >  
搜索关键字:sparksql hivecontext    ( 324个结果
获取表头信息
sparksql中获取表头信息方法一:可以使用 describetable; 方法二:先SEThive.cli.print.header=true; 然后 select * from table limit 0;代码中的使用直接通过list> tableHead =jdbcBaseDao.getBa...
分类:其他好文   时间:2016-01-25 14:46:06    阅读次数:192
Spark1.6 DataSets简介
Apache Spark提供了强大的API,以便使开发者为使用复杂的分析成为了可能。通过引入SparkSQL,让开发者可以使用这些高级API接口来从事结构化数据的工作(例如数据库表,JSON文件),并提供面向对象使用RDD的API,开发只需要调用相关 的方法便可使用spark来进行数据的存储与计.....
分类:其他好文   时间:2016-01-11 23:29:39    阅读次数:250
spark1.6配置sparksql 的元数据存储到postgresql中
1:首先配置hive-site.xml javax.jdo.option.ConnectionURL jdbc:postgresql://192.168.56.103:5432/sparksql javax.jdo.option.Connecti...
分类:数据库   时间:2016-01-08 20:23:19    阅读次数:679
scala移除一个数组中第一个负数后的所有负数
2016 年1月1日 王老师课堂笔记和作业笔记:王老师主要讲解了spark的发展前景,spark在未来的几十年里必将一统大数据江湖。graphx,mllib,sparkSQL(1)scala语法的基础知识,重点为函数式编程思想。(2)spark源代码查看。作业描述:移除一个数组中第一个负数后的所有负...
分类:编程语言   时间:2016-01-02 14:03:27    阅读次数:205
Spark修炼之道(进阶篇)——Spark入门到精通:第九节 Spark SQL运行流程解析
1.整体运行流程使用下列代码对SparkSQL流程进行分析,让大家明白LogicalPlan的几种状态,理解SparkSQL整体执行流程// sc is an existing SparkContext. val sqlContext = new org.apache.spark.sql.SQLContext(sc) // this is used to implicitly convert an...
分类:数据库   时间:2015-12-31 12:53:47    阅读次数:970
SparkSql官方文档中文翻译(java版本)
1 概述(Overview)2 DataFrames2.1 入口:SQLContext(Starting Point: SQLContext)2.2 创建DataFrames(Creating DataFrames)2.3 DataFrame操作(DataFrame Operations)2.4 运...
分类:数据库   时间:2015-12-29 22:43:57    阅读次数:2343
个推 Spark实践教你绕过开发那些“坑”
Spark作为一个开源数据处理框架,它在数据计算过程中把中间数据直接缓存到内存里,能大大提高处理速度,特别是复杂的迭代计算。Spark主要包括SparkSQL,SparkStreaming,Spark MLLib以及图计算。Spark核心概念简介1、RDD即弹性分布式数据集,通过RDD可以执行各.....
分类:其他好文   时间:2015-12-28 15:47:25    阅读次数:245
SparkSQL相关语句总结
1.in 不支持子查询 eg. select * from src where key in(select key from test); 支持查询个数 eg. select * from src where key in(1,2,3,4,5); in 40000个 耗时25.766秒 ...
分类:数据库   时间:2015-10-10 17:09:11    阅读次数:1677
sparksql与hive整合
hive配置 编辑 $HIVE_HOME/conf/hive-site.xml,增加如下内容: <property> ??<name>hive.metastore.uris</name> ??<value>thrift://master:9083</value> ??<description>Thrift?uri?for?the?remote?met...
分类:数据库   时间:2015-09-22 16:51:01    阅读次数:231
Spark入门实战系列--6.SparkSQL(下)--Spark实战应用
SparkSQL引入了一种新的RDD——SchemaRDD,SchemaRDD由行对象(Row)以及描述行对象中每列数据类型的Schema组成;SchemaRDD很象传统数据库中的表。SchemaRDD可以通过RDD、Parquet文件、JSON文件、或者通过使用hiveql查询hive数据来建立。SchemaRDD除了可以和RDD一样操作外,还可以通过registerTempTable注册成临时表,然后通过SQL语...
分类:数据库   时间:2015-08-31 10:08:08    阅读次数:377
324条   上一页 1 ... 25 26 27 28 29 ... 33 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!