码迷,mamicode.com
首页 >  
搜索关键字:spark rdd    ( 7287个结果
Spark WARN Utils: Service 'sparkDriver' could not bind on port 0. Attempting port 1.
问题 执行 spark-submit --master local模式时产生warn并达重试数限制失败,导致spark local不能启动: ... WARN Utils: Service 'sparkDriver' could not bind on port 0. Attempting port ...
分类:其他好文   时间:2020-04-29 12:46:42    阅读次数:126
数据源Data Source--通用的数据加载/保存功能
Spark SQL支持通过DataFrame接口在各种数据源上进行操作。DataFrame可以使用关系变换进行操作,也可以用来创建临时视图。将DataFrame注册为临时视图允许您对其数据运行SQL查询。本节介绍使用Spark Data Sources加载和保存数据的一般方法,然后介绍可用于内置数据 ...
分类:其他好文   时间:2020-04-29 10:49:26    阅读次数:64
四、Hadoop搭建Spark
一、Scala安装 1.1下载并解压Scala 1.2 将Scala添加到环境变量 1.3激活配置 二、安装Spark 2.1下载并解压Spark 2.2 修改文件夹名字 2.3配置环境变量 三、配置Spark 需要修改的配置文件有两个 Spark env.sh, spark defaults.co ...
分类:其他好文   时间:2020-04-28 20:13:43    阅读次数:57
spark写入mysql
第一种方式: private def singleDataSaveMysql(sql: String) = { val dataFrame2: DataFrame = ss.sql(sql) val resultRDD = df2rdd(dataFrame2) val value: RDD[Map[ ...
分类:数据库   时间:2020-04-28 17:18:05    阅读次数:50
如何在IntelliJ IDEA中运行Java/Scala/Spark程序
本文将分两部分来介绍如何在IntelliJ IDEA中运行Java/Scala/Spark程序: 基本概念介绍 在IntelliJ IDEA中创建和运行java/scala/spark程序 基本概念介绍 IntelliJ IDEA 本文使用版本为: ideaIC 2020.1 IDEA 全称 Int ...
分类:编程语言   时间:2020-04-28 14:59:06    阅读次数:59
Spark小实例——求文件中的最大值和最小值(IDEA实现)
Spark小实例——求文件中的最大值和最小值(IDEA实现)
分类:其他好文   时间:2020-04-27 22:38:23    阅读次数:162
Hive的基本理论知识
Hive是什么? 个人理解是把存储在hdfs上的数据映射位一张数据库表,提供类sql(HQL)语句的查询,方便数据的分析,查询。另外一点就是自动的把HQL转化为MapRudecu、Tez、Spark执行。 Hive的架构 用户接口:可以是hive shell,jdbc(java 访问hive),we ...
分类:其他好文   时间:2020-04-27 15:21:33    阅读次数:59
spark 数据分析 之数据清理
//清理格式不匹配的数据 //此代码可以实现自动滤除掉无法转化为double类型的数据 import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaRDD; import org.apache.spark.api.j ...
分类:其他好文   时间:2020-04-26 21:00:10    阅读次数:120
spark中的pair rdd,看这一篇就够了
本文始发于个人公众号: TechFlow ,原创不易,求个关注 今天是spark专题的第四篇文章,我们一起来看下Pair RDD。 定义 在之前的文章当中,我们已经熟悉了RDD的相关概念,也了解了RDD基本的转化操作和行动操作。今天我们来看一下RDD当中非常常见的PairRDD,也叫做键值对RDD, ...
分类:其他好文   时间:2020-04-26 20:51:45    阅读次数:83
spark_sql
1 package com.spark_sql 2 3 import java.util.Properties 4 import org.apache.spark.sql.{DataFrame, SparkSession} 5 6 object DataFromMysql { 7 def main( ...
分类:数据库   时间:2020-04-26 18:43:28    阅读次数:81
7287条   上一页 1 ... 41 42 43 44 45 ... 729 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!