搜索关键字：spark streaming数据源flume实战，搜索到7001个结果！码迷,mamicode.com！

spark-on-yarn 学习

1. hdfs存文件的时候会把文件切割成block，block分布在不同节点上，目前设置replicate=3，每个block会出现在3个节点上。 2. Spark以RDD概念为中心运行，RDD代表抽象数据集。以代码为例： sc.textFile(“abc.log”) textFile()函数会创建 ...

分类：其他好文时间：2019-11-22 13:26:33 阅读次数：63

【Flume】Flume基础之安装与使用

1、Flume简介 ? (1) Flume提供一个分布式的，可靠的，对大数据量的日志进行高效收集、聚集、移动的服务，Flume只能在Unix环境下运行。 ? (2) Flume基于流式架构，容错性强，也很灵活简单。 ? (3) Flume、Kafka用来实时进行数据收集，Spark、Flink用来实 ...

分类：Web程序时间：2019-11-22 12:11:59 阅读次数：201

spark union 特别注意

分类：其他好文时间：2019-11-21 15:33:24 阅读次数：308

Spark学习(4) Spark Streaming

什么是Spark Streaming Spark Streaming类似于Apache Storm，用于流式数据的处理 Spark Streaming有高吞吐量和容错能力强等特点。Spark Streaming支持的数据输入源很多，例如：Kafka、Flume、Twitter、ZeroMQ和简单的T ...

分类：其他好文时间：2019-11-21 13:56:11 阅读次数：103

sparksql 复杂查询OOM

平台上执行复杂查询，OOM，根据日志提示的结局方法： -- SET spark.driver.memory=6/8G;【还是OOM】set spark.sql.autoBroadcastJoinThreshold=-1;【解决问题】 Exception in thread "broadcast-ex ...

分类：数据库时间：2019-11-21 09:30:17 阅读次数：98

Spark学习(2) Spark SQL

什么事sparkSQL Spark SQL是Spark用来处理结构化数据的一个模块，它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用, 它是将Spark SQL转换成RDD，然后提交到集群执行，执行效率非常快 1）易整合 2）统一的数据访问方式 3）兼容Hive 4）标准 ...

分类：数据库时间：2019-11-20 21:54:37 阅读次数：91

理解Spark运行模式（二）(Yarn Cluster)

上一篇说到Spark的yarn client运行模式，它与yarn cluster模式的主要区别就是前者Driver是运行在客户端，后者Driver是运行在yarn集群中。yarn client模式一般用在交互式场景中，比如spark shell, spark sql等程序，但是该模式下运行在客户端 ...

分类：其他好文时间：2019-11-18 22:14:29 阅读次数：101

虚拟机中Spark运行在Yarn上

初始化Centos7vi /etc/sysconfig/network-scripts/ifcfg-ens33DEVICE=ens33TYPE=EthernetONBOOT=yesNM_CONTROLLED=yesBOOTPROTO=staticIPADDR=192.168.3.131GATEWAY ...

分类：其他好文时间：2019-11-18 12:52:33 阅读次数：64

spark-submit之使用pyspark

在linux下，执行pyspark代码 —— 实测有效 1. 安装pycharm或者spyder，然后在其中编写代码和执行语句 2. 通过job来提交，即spark-submit提交，下面主要讲这种方法首先假设，自己写的 *.py 文件包含了这些包，即通过import导入 import os fr ...

分类：其他好文时间：2019-11-17 20:39:47 阅读次数：185

数据结构和算法内容介绍

1 经典的算法题目 1.1 字符串匹配问题有一个字符串str1="哈哈哈你好啊好啊你好啊啊你好啊好啊啊你好你好好"，和一个子串str2="你好啊好啊啊". ①判断str1中是否是否包含str2，如果存在，就返回第一次出现的问题。如果没有，则返回-1. ②要求用最快的速度完成匹配。思路1：暴 ...

分类：编程语言时间：2019-11-17 17:31:53 阅读次数：108

共7001条上一页 1 ... 84 85 86 87 88 ... 701 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)