目录管理:lscdpwdmkdirrmdirtree文件管理:touchstatfilermcpmvnano日期时间:dateclockhwclockcal文本处理:morelessheadtailcutsortuniqgrep查看文本:cattacmorelessheadtail文本处理:cutjoinsedankuniq文本排序:sort文本统计:wc(wordcount)
分类:
系统相关 时间:
2018-12-11 18:16:51
阅读次数:
185
在 Linux搭建集群 JDK配置 Linux搭建集群 SSH免密登陆 Linux搭建集群 集群搭建成功 的基础上实现workcount案例 注意 虚拟机三台启动集群(自己亲自搭建) 1. wordcount程序 1.1Hadoop集群测试WordCount程序 1.1.1 在hadoop目录下创建 ...
分类:
系统相关 时间:
2018-12-08 17:04:30
阅读次数:
305
大数据初始化环境搭建: 一):大数据(hadoop)初始化环境搭建 二):大数据(hadoop)环境搭建 三):运行wordcount案例 四):揭秘HDFS 五):揭秘MapReduce 六):揭秘HBase 七):HBase编程 1):需要准备三个虚拟机环境(创建方式:可以单独创建三个虚拟机:点 ...
分类:
其他好文 时间:
2018-12-08 14:46:52
阅读次数:
185
运行 wordcount 案例: 一):大数据(hadoop)初始化环境搭建 二):大数据(hadoop)环境搭建 三):运行wordcount案例 四):揭秘HDFS 五):揭秘MapReduce 六):揭秘HBase 七):HBase编程 Hadoop集群测试wordcount程序: 1):在b ...
分类:
其他好文 时间:
2018-12-08 14:46:14
阅读次数:
253
大数据 hadoop 环境搭建: 一):大数据(hadoop)初始化环境搭建 二):大数据(hadoop)环境搭建 三):运行wordcount案例 四):揭秘HDFS 五):揭秘MapReduce 六):揭秘HBase 七):HBase编程 1):下载安装 hadoop(这里使用2.8版本:点我下 ...
分类:
其他好文 时间:
2018-12-08 14:42:15
阅读次数:
214
本篇博客将给大家介绍怎么在PyCharm上编写运行WordCount程序。 第一步 下载安装PyCharm 下载Pycharm PyCharm的下载地址(Linux版本)。下载完成后你将得到一个名叫:pycharm-professional-2018.2.4.tar.gz文件。我们选择的是正版软件, ...
分类:
其他好文 时间:
2018-11-18 15:04:36
阅读次数:
308
操作背景 jdk的版本为1.8以上 ubuntu12 hadoop2.5伪分布 安装 Hadoop-Eclipse-Plugin 要在 Eclipse 上编译和运行 MapReduce 程序,需要安装 hadoop-eclipse-plugin,可下载 Github 上的 hadoop2x-ecli ...
分类:
其他好文 时间:
2018-11-16 22:26:32
阅读次数:
287
1.准备文件 [root@master ~]# cat input.txt hello java hello python hello c hello java hello js hello html hello java [root@master ~]# hadoop fs -mkdir /inp ...
分类:
其他好文 时间:
2018-11-15 00:22:38
阅读次数:
199
1.源码解释 package org.apache.hadoop.examples;import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;impo ...
分类:
其他好文 时间:
2018-11-11 14:59:04
阅读次数:
169
spark-shell --master yarnsc:val lineRDD=sc.textFile("/test/input/test")lineRDD.collect().foreach(println)val wordRDD = lineRDDwordRDD.collect().foreac ...
分类:
其他好文 时间:
2018-11-10 16:47:32
阅读次数:
190