1,在hdfs-site.xml 中配置多目录,提前配置好,以免以后要配置时,需要重启集群。 2,namenode 有一个工作线程池,用来处理不同的datanode的并发心跳和客户端访问并发请求。配置dfs.namenode.handler.count=20 * log2(Cluster Size) ...
分类:
其他好文 时间:
2020-06-16 13:33:15
阅读次数:
64
1,如果预聚合不影响最终结果,可以使用conbine,提前对数据聚合,减少数据量。 2,使用2次mr的方式。第一次mr,在map输出是给key加上一个前缀,则可以把相同的key分配到不同的reduce聚合,可以实现同一个key数据量大的问题;第二次mr对把第一次mr输出的数据的key去掉前缀,在聚合 ...
分类:
其他好文 时间:
2020-06-16 13:24:44
阅读次数:
54
把Java打包成jar的步骤: 右击项目,找到export确定 然后在export弹窗中找到Java文件 Java->Runnable JAR file,后点击next 最后选择要打包的项目,存放打包项目的位置,然后finish就可以进行打包了。 在Linux上运行Hadoop jar hadoop ...
分类:
编程语言 时间:
2020-06-16 13:05:18
阅读次数:
103
张耀的博客 徐大神博客 品茶大神博客 hadoop大神博客 opesn Elastic 中国社区官方博客 IT技术电子书 ...
分类:
其他好文 时间:
2020-06-16 13:05:02
阅读次数:
47
yarn 一共有3个类型的调度器:FIFO调度器、容量调度器、公平调度器。 1,FIFO调度器。先进先出,队列中同一时间只有一个任务在运行。该任务独占整个集群的资源。 2,容量调度器。多队列,每个队列内部先进先出,同一个队列同时间只有一个任务在运行,任务的并行度为队列的个数。 3,公平调度器。同个队 ...
分类:
其他好文 时间:
2020-06-16 11:35:39
阅读次数:
107
元数据更新过程? MapReduce的Shuffle过程? HDFS的读的流程? HDFS写的流程? 如何将hadoop配置文件从一台机器同步到另一台机器上? scp -r hadoop-2.7.3 hpsk@192.168.134.222:/opt/modules/ 如何终止yarn上正在运行的程 ...
分类:
其他好文 时间:
2020-06-15 23:20:15
阅读次数:
144
https://www.cse.unsw.edu.au/~cs9313/20T2/slides/L2.pdf https://drive.google.com/drive/folders/13_vsxSIEU9TDg1TCjYEwOidh0x3dU6es 第二节课花了40分钟讲,如果dataNode ...
分类:
其他好文 时间:
2020-06-15 18:02:14
阅读次数:
50
hadoop文件目录结构 http://192.168.21.110:50070/explorer.html#/ 登录后会看到hadoop的数据目录 报错解决 Permission denied: user=dr.who, access=WRITE, inode="/":root:supergrou ...
分类:
其他好文 时间:
2020-06-15 17:48:08
阅读次数:
55
往大数据方向发展需要学哪些技术?网上一搜真是指不胜屈。对于小白来说,实在是一头雾水,到底哪些是当下流行的?哪些是必须要先学会的?流行?主次搞不清。为了解决这些疑惑,羚羊专门花了些时间, 挨个技术去研究对比归类,大概总结出以下的技术点: 文件存储: Hadoop HDFS、GFS、KFS、Tachyo ...
分类:
其他好文 时间:
2020-06-15 12:10:17
阅读次数:
249
HDFS【shell操作hdfs命令】 上传 -help:输出这个命令参数 hadoop fs -help rm -moveFromLocal:从本地剪切粘贴到HDFS hadoop fs -moveFromLocal ./kongming.txt /sanguo/shuguo -copyFromL ...
分类:
系统相关 时间:
2020-06-14 18:55:11
阅读次数:
64