搜索关键字：大数据开发 Hadoop Spark，搜索到19831个结果！码迷,mamicode.com！

Flink核心概念

分布式缓存分布式缓存的思想在hadoop和spark中都有体现，Flink 提供的分布式缓存类似 Hadoop，目的是为了在分布式环境中让每一个 TaskManager 节点保存一份相同的数据或者文件，当前计算节点的 task 就像读取本地文件一样拉取这些配置。比如在进行表与表 Join 操作时 ...

分类：其他好文时间：2020-05-25 19:29:56 阅读次数：60

kafka unclean 配置代表啥，会对 spark streaming 消费有什么影响？

unclean.leader.election.enable 为true的话，意味着非ISR集合的broker 也可以参与选举，这样有可能就会丢数据，spark streaming在消费过程中拿到的 end offset 会突然变小，导致 spark streaming job挂掉。如果unclea ...

分类：其他好文时间：2020-05-25 14:01:02 阅读次数：89

not find any valid local directory for nmPrivate

跑spark job的时候碰到了错误：这是因为nmPrivate目录没有权限访问引起的。参考： "https://www.oschina.net/question/2288283_2134188" ...

分类：其他好文时间：2020-05-25 09:22:14 阅读次数：74

Spark内存管理模型

一般来说，一个spark程序包含两种 JVM 程序，Dirver 和 Executor。Dirver 是主要的控制程序，负责创建 context，提交任务，那 job 转换为 task 并且协调 task 在 executor 中的执行。Executor 主要是负责执行计算任务并且将结果返回给 Dr ...

分类：其他好文时间：2020-05-24 23:52:11 阅读次数：70

Hadoop最简单入门实战

[toc] 一、部署Hadoop本地模式 1. 搭建linux环境我用的centos7 2. 在/opt目录下创建目录 3. 安装jdk 4. 下载hadoop https://hadoop.apache.org/releases.html 并解压到/opt/module目录 5. 配置hadoo ...

分类：其他好文时间：2020-05-24 23:42:50 阅读次数：64

kafka群启脚本

```shell #!/bin/bash case $1 in "start"){ for i in hadoop120 hadoop121 hadoop 122 do echo "************$i*************" ssh $i "/.../kafka/bin/kafka-s... ...

分类：其他好文时间：2020-05-24 21:00:57 阅读次数：111

YARN调度架构中的AppMaster

YARN调度架构 esourceScheduler是YARN的调度器，负责Container的分配。 AsyncDispatcher是单线程的事件分发器，负责向调度器发送调度事件。 ResourceTrackerService是资源跟踪服务，主要负责接收处理NodeManager的心跳信息。 App... ...

分类：移动开发时间：2020-05-24 20:59:39 阅读次数：118

花6个月写的付费专栏，免费送|仿开源框架从零到一完整实现高性能、可扩展的RPC框架

作者渡码，阿里巴巴码农，公众号：渡码作者，专注大数据开发、数据分析和Python技术。关注公众号渡码回复关键字 manis，可获取电子书、各章节和完整源代码，并且可加入读者群一起交流问题。简介 19年上半年，我阅读了Hadoop RPC模块的源代码，读完后发现这个模块设计的非常好，与其他 ...

分类：其他好文时间：2020-05-24 19:17:26 阅读次数：73

Spark之Yarn Cluster运行机制

简介 Spark有3种集群管理器: Standalone Hadoop YARN 又分为yarn client与yarn cluser Apache Mesos 生产环境中一般使用yarn cluser模式个人理解 yarn主要有两个作用. 一个是创建container以此来分配计算资源另外一个 ...

分类：其他好文时间：2020-05-24 11:33:26 阅读次数：64

Spark Streaming的核心DStream之转换操作实例

DStream的转化操作DStreamAPI提供的与转化操作相关的方法如下：如下举例详解transform(func)方法和updateStateByKey(fhnc)方法：（1）、transform(func)方法transform方法及类似的transformWith(func)方法允许在DStream上应用任意RDD-to-RDD函数，它们可以被应用于未在DStreamAPI中暴露的任何RD

分类：其他好文时间：2020-05-24 10:00:38 阅读次数：88

共19831条上一页 1 ... 72 73 74 75 76 ... 1984 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)