搜索关键字：spark streaming state更新，搜索到7566个结果！码迷,mamicode.com！

倾情大奉送--Spark入门实战系列

这一两年Spark技术很火，自己也凑热闹，反复的试验、研究，有痛苦万分也有欣喜若狂，抽空把这些整理成文章共享给大家。这个系列基本上围绕了Spark生态圈进行介绍，从Spark的简介、编译、部署，再到编程模型、运行架构，最后介绍其组件SparkSQL、Spark Streaming、Spark MLi ...

分类：其他好文时间：2019-12-11 09:16:33 阅读次数：82

RDD的转换操作，分三种：单value，双value交互，（k,v）对

import org.apache.spark.rdd.RDDimport org.apache.spark.{Partitioner, SparkConf, SparkContext} object Transformation { def main(args: Array[String]): U ...

分类：其他好文时间：2019-12-10 22:41:03 阅读次数：147

RocketMq在SparkStreaming中的应用总结

其实Rocketmq的给第三方的插件已经全了，如果大家有兴趣的话请移步https://github.com/apache/rocketmq-externals。本文主要是结合笔者已有的rmq在spark中的应用经验对rocketmq做简单介绍以及经验总结，当然免不了会将rocketmq和如今特别火爆 ...

分类：其他好文时间：2019-12-10 22:13:08 阅读次数：157

spark 整合 hive

spark-shell 整合 hive 1、将 hive/conf/hive-site.xml 拷贝到 spark/conf 下将 hive/lib/mysql-connector-java-8.0.14.jar 拷贝到 spark-244/jars/mysql-connector-java-8. ...

分类：其他好文时间：2019-12-10 15:21:07 阅读次数：119

Linux安装Spark

1、下载 http://archive.apache.org/dist/spark/spark 2.4.1/spark 2.4.1 bin hadoop2.7.tgz 2、解压 3、配置环境变量SPARK_HOME vim /etc/profile 或者 vim ~/.bashrc source / ...

分类：系统相关时间：2019-12-10 00:55:19 阅读次数：79

spark的四种部署模式对比

本地模式Spark单机运行，一般用于开发测试。Standalone模式构建一个由Master+Slave构成的Spark集群，Spark运行在集群中。Spark on Yarn模式Spark客户端直接连接Yarn。不需要额外构建Spark集群。Spark on Mesos模式Spark客户端直接连接 ...

分类：其他好文时间：2019-12-09 21:11:23 阅读次数：237

腾讯资深架构师给你讲解 kafka的基本原理，带你实战实践

前言Kafka是最初由Linkedin公司开发，是一个分布式、支持分区的（partition）、多副本的（replica），基于zookeeper协调的分布式消息系统，它的最大的特性就是可以实时的处理大量数据以满足各种需求场景：比如基于hadoop的批处理系统、低延迟的实时系统、storm/Spark流式处理引擎，web/nginx日志、访问日志，消息服务等等，用scala语言编写，Linkedi

分类：其他好文时间：2019-12-09 18:50:02 阅读次数：101

kubectl exec 在kubelet中的处理流程

基于kuebrnetes v1.17 简单来说，一个完整的streaming请求如下：客户端 kubectl exec i t ... kube apiserver 向 Kubelet 发送流式请求 /exec/ Kubelet 通过 CRI 接口向 CRI Shim 请求 Exec 的 URL ...

分类：其他好文时间：2019-12-08 12:58:08 阅读次数：124

大数据(hadoop,hive,hbase,spark,flume等)各技术间的关系

大数据由一系列技术组成，那他们之间的关系是怎么组成的ne，请看下图： hadoop主要做了文件存储系统和提供了一个相对比较弱的mr处理数据的方案 hive是在mr和文件存储系统上面做的升级。 sprak+hbase+hadoop主要解决的是hadoop实时处理数据比较弱的问题 ...

分类：Web程序时间：2019-12-08 10:27:19 阅读次数：116

Spark 基础 —— 创建 DataFrame 的三种方式

1.自定义 schema（Rdd[Row] => DataSet[Row]) 2.借助 case class 隐式转换（Rdd[Person] => DataSet[Row]) 3.直接从数据源创建此外 233 ...

分类：其他好文时间：2019-12-07 16:18:20 阅读次数：620

共7566条上一页 1 ... 87 88 89 90 91 ... 757 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)