搜索关键字：flume spark sparkflumeprotocol，搜索到7976个结果！码迷,mamicode.com！

Spark 创建一个简单的DataFrame示例

scala> val df = sc.parallelize(Seq( | (0,"cat26",30.9), | (1,"cat67",28.5), | (2,"cat56",39.6), | (3,"cat8",35.6))).toDF("Hour", "Category", "Value") ...

分类：其他好文时间：2021-01-02 11:32:37 阅读次数：0

使用yarn安装spark集群

由于之前已经搭建好了，今天是看视频回顾下，然后做下记录。之前已经搭建好了Yarn集群，现在在Yarn集群上搭建spark。 1、安装spark 下载源码包：wget http://mirror.bit.edu.cn/apache/spark/spark-1.3.0/spark-1.3.0.tgz ...

分类：其他好文时间：2021-01-01 12:18:40 阅读次数：0

记Hive SQL中TEMPORARY VIEW的一个数据对不上的坑

问题背景: (无关操作已省略) Spark ETL执行以下SQL： CREATE TEMPORARY VIEW A select user_id, ...; CREATE TEMPORARY VIEW B select user_id, ... from A ...; INSERT OVERWRIT ...

分类：数据库时间：2020-12-29 11:28:30 阅读次数：0

Flume的安装配置

flume的概述 Apache Flume是一个分布式，可靠且可用的系统，用于有效地从许多不同的source收集，聚合和移动大量日志数据到集中式数据存储。 Apache Flume的使用不仅限于日志数据聚合。由于数据source是可定制的，因此Flume可用于传输大量event 数据，包括但不限于网 ...

分类：Web程序时间：2020-12-29 11:10:09 阅读次数：0

学好Spark/Kafka必须要掌握的Scala技术点（三）高阶函数、方法、柯里化、隐式转换

建议在用Scala编写相关功能实现时，边学习、边应用、边摸索以加深对Scala的理解和应用 ...

分类：其他好文时间：2020-12-21 11:32:22 阅读次数：0

学好Spark/Kafka必须要掌握的Scala技术点（二）类、单例/伴生对象、继承和trait，模式匹配、样例类（case class）

Scala是以JVM为运行环境的面向对象的函数式编程语言，它可以直接访问Java类库并且与Java框架进行交互操作 ...

分类：其他好文时间：2020-12-19 13:14:39 阅读次数：1

如何在 Serverless K8s 集群中低成本运行 Spark 数据计算？

本节课主要介绍如何在 Serverless Kubernetes 集群中低成本运行 Spark 数据计算。首先简单介绍下阿里云 Serverless Kubernetes 和弹性容器实例 ECI 这两款产品；然后介绍 Spark on Kubernetes；最后进行实际演示。

分类：其他好文时间：2020-12-17 12:22:18 阅读次数：2

spark浅析

1、基本架构 (1)、应用程序Spark 应用程序由一个驱动器进程和一组执行器进程组成。驱动进程运行 main()函数，位于集群中的一个节点上，它负责三件事：维护 Spark 应用程序的相关信息；回应用户的程序或输入；分析任务并分发给若干执行器进行处理。驱动器是必须的，它是 Spark 应用程序的核 ...

分类：其他好文时间：2020-12-17 12:09:25 阅读次数：2

spark-streaming与kafka的整合

1. 概述在2.x中，spark有两个用来与kafka整合的代码，版本代号为0.8和0.10，由于在0.8，kafka有两套消费者api，根据高级api得到了Receiver-based Approach，根据低级api得到了Direct Approach，而在0.10由于kafka只有一套消费者 ...

分类：其他好文时间：2020-12-16 11:50:30 阅读次数：4

logstash_output_kafka:Mysql同步Kafka深入详解

0、题记实际业务场景中，会遇到基础数据存在Mysql中，实时写入数据量比较大的情景。迁移至kafka是一种比较好的业务选型方案。而mysql写入kafka的选型方案有：方案一：logstash_output_kafka插件。方案二：kafka_connector。方案三：debezium插件。方案四：flume。方案五：其他类似方案。其中：debezium和flume是基于mysqlbinlog实

分类：数据库时间：2020-12-15 12:34:47 阅读次数：9

共7976条上一页 1 ... 13 14 15 16 17 ... 798 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)