码迷,mamicode.com
首页 >  
搜索关键字:spark-sql    ( 532个结果
Spark SQL原理和实现--王家林老师
...
分类:数据库   时间:2016-04-13 20:35:34    阅读次数:154
(升级版)Spark从入门到精通(Scala编程、案例实战、高级特性、Spark内核源码剖析、Hadoop高端)
本课程主要讲解目前大数据领域最热门、最火爆、最有前景的技术——Spark。在本课程中,会从浅入深,基于大量案例实战,深度剖析和讲解Spark,并且会包含完全从企业真实复杂业务需求中抽取出的案例实战。课程会涵盖Scala编程详解、Spark核心编程、Spark SQL和Spark Streaming、 ...
分类:其他好文   时间:2016-04-12 07:05:51    阅读次数:480
spark python java.lang.IllegalStateException: Did not find registered driver with class org.apache.spark.sql.execution.datasources.jdbc.DriverWrapper
最近在学习spark分布式计算框架,其中遇到这样的问题 提交的命令是 bin/spark-submit --jars lib/mysql-connector-java-5.1.38-bin.jar --master spark://Wechat-6:7077 examples/hsbhadoop/d... ...
分类:移动开发   时间:2016-04-09 19:04:42    阅读次数:502
load、save方法、spark sql的几种数据源
load、save方法的用法 .save("hdfs://spark1:9000/peopleName_java"); parquet数据源: -》加载parquet数据 DataFrame usersDF = sqlContext.read().parquet("hdfs://spark1:900 ...
分类:数据库   时间:2016-04-04 18:09:54    阅读次数:287
spark sql 基本用法
一、通过结构化数据创建DataFrame: publicstaticvoid main(String[] args) { SparkConf conf = new SparkConf() .setAppName("DataFrameCreate").setMaster("local"); JavaS ...
分类:数据库   时间:2016-04-04 17:49:50    阅读次数:272
第56课:Spark SQL和DataFrame的本质
一、SparkSQL与DataframeSparkSQL之所以是除Sparkcore以外最大和最受关注的组件的原因:a)能处理一切存储介质和各种格式的数据(你同时可以方便的扩展SparkSQL的功能来支持更多的数据类型,例如KUDO)b)SparkSQL把数据仓库的计算能力推向了一个新的高度。不仅是无敌的计算速..
分类:数据库   时间:2016-03-15 00:43:35    阅读次数:261
第57课:Spark SQL on Hive配置及实战
1,首先需要安装hive,参考http://lqding.blog.51cto.com/9123978/17509672,在spark的配置目录下添加配置文件,让Spark可以访问hive的metastore。root@spark-master:/usr/local/spark/spark-1.6.0-bin-hadoop2.6/conf#vihive-site.xml <configuration> <property>..
分类:数据库   时间:2016-03-15 00:39:51    阅读次数:633
大数据技能图谱
下面是 StuQ 发布的大数据技能图谱,比较实用,供参考   大数据处理框架 Spark - RDD - Spark SQL - Spark Streaming - MLLibHadoop - HDFS (分布式文件系统) - Mapreduce(计算框架) - Yarn(资源管理平台) - Pig
分类:其他好文   时间:2016-03-14 09:28:47    阅读次数:173
Spark Shuffle 堆外内存溢出问题与解决(Shuffle通信原理)
spark sql
分类:其他好文   时间:2016-03-07 20:55:18    阅读次数:1425
2016.3.3(Spark框架预览,Scala部分应用函数、闭包、高阶函数,关于语义分析的一些心得)
一、Spark框架预览 主要有Core、GraphX、MLlib、Spark Streaming、Spark SQL等几部分。 GraphX是进行图计算与图挖掘,其中主流的图计算框架现在有:Pregal、HAMA、Giraph(这几部分采用超步即同步的方式),而GraphLab与Spark Grap
分类:其他好文   时间:2016-03-04 09:17:57    阅读次数:391
532条   上一页 1 ... 39 40 41 42 43 ... 54 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!