搜索关键字：spark 大数据 hadoop yarn，搜索到30860个结果！码迷,mamicode.com！

请你谈谈为什么分布式系统需要限流器

什么是限流器？限流器是一种限制某种操作在一定时间内的执行次数（例如每秒钟5次）或者执行量（例如每秒钟1G大小的数据）的机制。限流器是一种防御性的编程实现方式，在大数据量高并发访问时，经常会出现服务或接口面对暴涨的请求而不可用的情况，甚至引发连锁反映导致整个系统崩溃。此时你需要使用的技术手段之一就 ...

分类：其他好文时间：2021-01-30 12:19:16 阅读次数：0

kafka

#kafka ##1.kafka基础架构 Kafka是一个分布式的基于发布/订阅模式的消息队列，主要应用于大数据实时处理领域。消息生产者（发布）将消息发布到topic中，同时有多个消息消费者（订阅）消费该消息。和点对点方式不同，发布到topic的消息会被所有订阅者消费。（1）Producer ： ...

分类：其他好文时间：2021-01-30 12:13:24 阅读次数：0

大数据学习（20）—— Zookeeper介绍

ZooKeeper是什么就像冯巩每次出场都说：“亲爱的观众朋友们，我想死你们啦”一样，我再哔哔一次，学习大数据官网很重要。Zookeeper官网看这里ZooKeeper ZooKeeper 是一个开源的分布式协调服务，它本身也是分布式设计。它提供了一组简单的原语，基于这些指令，分布式应用能够实现同 ...

分类：其他好文时间：2021-01-30 12:04:59 阅读次数：0

解决spark-submit的There is insufficient memory for the Java Runtime Environment to continue.（老顽固问题） failed; error='Cannot allocate memory' (errno=12)

Q：第一次提交wordcount案例，OK，一切正常。再次提交，出现下述错误。完整错误粘贴如下： 21/01/27 14:55:48 INFO spark.SecurityManager: Changing modify acls groups to: 21/01/27 14:55:48 INFO ...

分类：编程语言时间：2021-01-28 11:56:52 阅读次数：0

yarn包启动react项目

yarn安装：在指定包下 npm intsall -g yarn yarn config set registry https://registry.npm.taobao.org -gyarn config set sass_binary_site http://cdn.npm.taobao.or ...

分类：其他好文时间：2021-01-28 11:42:31 阅读次数：0

spark 从数据库中读取数据

spark 从数据库中读取数据的几种方式，以Mysql 为例创建spark val spark = SparkSession.builer().appName("用户标签").master("local[*]").getOrCreate() val url = "jdbc:mysql://数据库地 ...

分类：数据库时间：2021-01-27 13:56:39 阅读次数：0

【记录】springboot连接hive出错User: xxx is not allowed to impersonate anonymous

环境是hive和Hadoop 报错如：User: liwei is not allowed to impersonate anonymous 修改hadoop 配置文件 $HADOOP_HOME/etc/hadoop/core-site.xml <property> <name>hadoop.pro ...

分类：编程语言时间：2021-01-27 13:53:02 阅读次数：0

spark-------------RDD 转换算子-----value类型(一)

引言 RDD 根据数据处理方式的不同将算子整体上分为 Value 类型、双 Value 类型和 Key-Value类型，本文主要讲一些Value 类型正文资源路径和资源内容 map ###函数签名:def map[U: ClassTag](f: T ? U): RDD[U] ###函数说明:将处 ...

分类：其他好文时间：2021-01-27 12:50:51 阅读次数：0

just a demo

<！-- demodemo.xml --><dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-mapreduce-client-core</artifactId> <version>2.7.0</version> ...

分类：其他好文时间：2021-01-26 12:23:58 阅读次数：0

Spark实战(三)本地连接远程Spark(Python环境)

一、Python环境准备远程服务器上Python版本要与本地想匹配，这里本地使用Anaconda来进行安装，远程服务器之间安装。 wget --no-check-certificate https://www.python.org/ftp/python/3.6.7/Python-3.6.7.tgz ...

分类：编程语言时间：2021-01-25 11:30:39 阅读次数：0

共30860条上一页 1 ... 28 29 30 31 32 ... 3086 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)