搜索关键字：大数据开发 Hadoop Spark，搜索到19831个结果！码迷,mamicode.com！

生产环境zookeeper集群部署

zookeeper简介： ZooKeeper是一个分布式的，开放源码的分布式应用程序协调服务，是Google的Chubby一个开源的实现，是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件，提供的功能包括：配置维护、域名服务、分布式同步、组服务等。 ZooKeeper的目 ...

分类：其他好文时间：2020-06-17 09:16:36 阅读次数：76

hadoop的参数调优

1，在hdfs-site.xml 中配置多目录，提前配置好，以免以后要配置时，需要重启集群。 2，namenode 有一个工作线程池，用来处理不同的datanode的并发心跳和客户端访问并发请求。配置dfs.namenode.handler.count=20 * log2(Cluster Size) ...

分类：其他好文时间：2020-06-16 13:33:15 阅读次数：64

hadoop解决数据倾斜的方法

1，如果预聚合不影响最终结果，可以使用conbine，提前对数据聚合，减少数据量。 2，使用2次mr的方式。第一次mr，在map输出是给key加上一个前缀，则可以把相同的key分配到不同的reduce聚合，可以实现同一个key数据量大的问题；第二次mr对把第一次mr输出的数据的key去掉前缀，在聚合 ...

分类：其他好文时间：2020-06-16 13:24:44 阅读次数：54

将Java项目打包成为可执行的jar包然后再Linux上运行

把Java打包成jar的步骤：右击项目，找到export确定然后在export弹窗中找到Java文件 Java->Runnable JAR file,后点击next 最后选择要打包的项目，存放打包项目的位置，然后finish就可以进行打包了。在Linux上运行Hadoop jar hadoop ...

分类：编程语言时间：2020-06-16 13:05:18 阅读次数：103

各位大神博客地址

张耀的博客徐大神博客品茶大神博客 hadoop大神博客 opesn Elastic 中国社区官方博客 IT技术电子书 ...

分类：其他好文时间：2020-06-16 13:05:02 阅读次数：47

yarn的调度器以及它们的区别

yarn 一共有3个类型的调度器：FIFO调度器、容量调度器、公平调度器。 1，FIFO调度器。先进先出，队列中同一时间只有一个任务在运行。该任务独占整个集群的资源。 2，容量调度器。多队列，每个队列内部先进先出，同一个队列同时间只有一个任务在运行，任务的并行度为队列的个数。 3，公平调度器。同个队 ...

分类：其他好文时间：2020-06-16 11:35:39 阅读次数：107

scala 如何显示大数

1.在使用Spark的 sum() 算子经常遇到结果被自动转化为科学技术如何正常显示呢假如 n结果会是一个科学计数法 val n=data.map(x=>x.toInt).sum() 然后我们 val a = BigDecimal(n) println(a) 这样打印出来的结果就是正常的大数 ...

分类：其他好文时间：2020-06-16 10:24:45 阅读次数：95

Hadoop面试题2020

元数据更新过程？ MapReduce的Shuffle过程？ HDFS的读的流程？ HDFS写的流程？如何将hadoop配置文件从一台机器同步到另一台机器上？ scp -r hadoop-2.7.3 hpsk@192.168.134.222:/opt/modules/ 如何终止yarn上正在运行的程 ...

分类：其他好文时间：2020-06-15 23:20:15 阅读次数：144

Spark Streaming读取Kafka数据两种方式

1.基于Receiver的方式这种方式使用Receiver来接收kafka中的数据，Receiver是基于kafka的高层Consumer API来实现的。Receiver从Kafka中获取的数据都是存储在Spark Executor的内存中的，然后Spark Streaming启动的job会去处 ...

分类：其他好文时间：2020-06-15 22:58:10 阅读次数：60

Spark 双流join代码示例

基本思想与flink流的join原理不同的是，Spark双流join是对俩个流做满外连接，因为网络延迟等关系，不能保证每个窗口中的数据key都能匹配上，这样势必会出现三种情况：（some，some），（None，some），（Some,None）,根据这三种情况，下面做一下详细解析：（some ...

分类：其他好文时间：2020-06-15 21:21:14 阅读次数：156

共19831条上一页 1 ... 61 62 63 64 65 ... 1984 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)