WordCount package cn.cpl.recom; import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org. ...
分类:
其他好文 时间:
2017-12-15 23:43:49
阅读次数:
301
准备工作 拷贝原来的模板 配置文件修改 workflow.xml : job.properties : 把自己写的MapReduce的jar 放上去 把改好的文件放入到hdfs 准备测试数据 在hdfs创建输入目录 并把刚创建的文件上传 运行oozie 查看输出结果 原文件 统计后的文件 http: ...
分类:
其他好文 时间:
2017-12-15 16:53:20
阅读次数:
244
集采单词 处理单词(按空格拆分) 对单词计数 联合运行 ...
分类:
其他好文 时间:
2017-12-13 23:33:32
阅读次数:
192
在eclipse中配置自己的maven仓库 1.安装maven(用于管理仓库,jar包的管理) 1.解压maven安装包 2.把maven添加到环境变量/etc/profile 3.添加maven目录下的conf/setting.xml文件到~/.m2文件夹下 2.安装eclipse 1.解压ecl ...
分类:
系统相关 时间:
2017-12-06 23:54:55
阅读次数:
576
package com.neworigin.HBaseMR; import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.Cell; import or... ...
分类:
其他好文 时间:
2017-12-04 19:01:26
阅读次数:
170
将项目导出为jar包分为 runnable jar 与 普通jar包 一、导出为普通jar包 该jar包中只有项目源代码, java -cp wordcount.jar 用来运行普通jar包 1、打开 File > Project Structure > Artifacts 2、添加一个 Artif ...
分类:
编程语言 时间:
2017-11-28 21:54:16
阅读次数:
393
import java.util.Arrays; import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD; import org.apache.spark.api.java.JavaRDD; im... ...
分类:
编程语言 时间:
2017-11-28 15:42:44
阅读次数:
350
来自博客: http://blog.csdn.net/dwb1015/article/details/52013362 ...
分类:
其他好文 时间:
2017-11-25 19:22:57
阅读次数:
193
编写map程序 编写reduce程序 编写main函数 把wordcount.txt放在hdfs的/dyh/data/input/目录下 执行:hadoop jar hdfs.jar com.cvicse.ump.hadoop.mapreduce.WordCount /dyh/data/input/ ...
分类:
其他好文 时间:
2017-11-22 13:05:27
阅读次数:
185
1.使用ECLIPSE工具打包运行WORDCOUNT实例,统计莎士比亚文集各单词计数(文件SHAKESPEARE.TXT)。 ①WorldCount.java 中的main函数修改如下: ②导出WordCount的jar包: export->jar file->next->next->Main cl ...
分类:
其他好文 时间:
2017-11-18 11:22:07
阅读次数:
301