搜索关键字：scala bigdata 大數據 spark，搜索到10680个结果！码迷,mamicode.com！

spark参数介绍 https://endymecy.gitbooks.io/spark-config-and-tuning/content/config.html ...

分类：其他好文时间：2019-12-26 14:53:55 阅读次数：65

hivesql 迁移spark3.0 sparksql报错如Cannot safely cast '字段':StringType to IntegerType的问题

一问题 hivesql可以正常运行，spark3.0运行报错如图 spark3.0配置查看源码新增一个 val STORE_ASSIGNMENT_POLICY = buildConf("spark.sql.storeAssignmentPolicy") .doc("When inserting ...

分类：数据库时间：2019-12-25 20:34:49 阅读次数：162

spark窗口操作

流数据的窗口操作：窗口操作，即把几个批次的数据整合到一个窗口里计算，并且窗口根据步长不断滑动。本质：把小批次，小颗粒的数据任意进行大批次和大颗粒的数据统计，意味着批次采集周期不用设置太大，可以通过滑动窗口来调整数据出现的粒度。 code: package com.home.spark.stream ...

分类：其他好文时间：2019-12-25 17:36:28 阅读次数：93

【异常】Exception in thread "main" java.lang.IllegalArgumentException: Illegal pattern c

在windows上执行的时候，option(“timestampFormat”, “yyyy/MM/dd HH:mm:ss ZZ”)必须带上，不然报错： Exception in thread "main" java.lang.IllegalArgumentException: Illegal pa ...

分类：编程语言时间：2019-12-24 23:47:57 阅读次数：147

【SparkSQL】介绍、与Hive整合、Spark的th/beeline/jdbc/thriftserve2、shell方式使用SQL

目录一、Spark SQL介绍二、Spark和Hive的整合三、Spark的thriftserve2/beeline/jdbc 四、shell方式使用SQL 一、Spark SQL介绍官网：http://spark.apache.org/sql/ 学习文档：http://spark.apac ...

分类：数据库时间：2019-12-24 23:44:13 阅读次数：353

sparksql 自定义用户函数（UDF）

自定义用户函数有两种方式，区别：是否使用强类型，参考demo：https://github.com/asker124143222/spark-demo 1、不使用强类型，继承UserDefinedAggregateFunction package com.home.spark import org. ...

分类：数据库时间：2019-12-24 19:01:05 阅读次数：134

分布式深度学习（Spark MLlib，Parameter Server、Ring-allreduce和Tensorflow ）

Spark MLlib Spark分布式计算原理 Spark（分布式的计算平台），分布式：指计算节点之间不共享内存，需要通过网络通信的方式交换数据。Spark最典型的应用方式是建立在大量廉价计算节点（廉价主机、虚拟的docker container）上；但这种方式区别于CPU+GPU的架构和共享内存 ...

分类：其他好文时间：2019-12-24 18:26:47 阅读次数：182

RocketMQ集群部署安装

RcoketMQ：【 1.低延时：在高压下，1毫秒内超过99.6%的反应延迟。 2.面向金融：具有跟踪和审计功能的高可用性。 3.行业可持续发展：保证了万亿级的消息容量。 4.厂商中立：一个新的开放的分布式消息和流媒体标准自最新的4.1版本。 5.BigData友好：批量转移与多功能集成的洪水吞吐量 ...

分类：其他好文时间：2019-12-24 12:04:42 阅读次数：104

【BigData】Java基础_接口

接口概念 Java接口是一系列方法的声明，是一些方法特征的集合，一个接口只有方法的特征没有方法的实现，因此这些方法可以在不同的地方被不同的类实现，而这些实现可以具有不同的行为（功能）。以下是个人理解：在软件开发过程中，当我们开发一个大型项目的时候，可能很多人一起共同开发一个项目，但是整个项目分为 ...

分类：编程语言时间：2019-12-23 22:33:08 阅读次数：107

spark 怎么去连接 ElasticSearch

https://stackoverflow.com/questions/52659109/cannot read from elasticsearch using pyspark https://stackoverflow.com/questions/35982550/how to read dat ...

分类：其他好文时间：2019-12-23 18:29:41 阅读次数：104

共10680条上一页 1 ... 112 113 114 115 116 ... 1068 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)