不多说,直接上代码。 一共12列,我们只需提取有用的列:第二列(犯罪类型)、第四列(一周的哪一天)、第五列(具体时间)和第七列(犯罪场所)。 思路分析 基于项目的需求,我们通过以下几步完成: 1、首先根据数据集,分别统计出不同犯罪类别在周时段内发生犯罪次数和不同区域在周时段内发生犯罪的次数。 2、然 ...
不多说,直接上代码。 2016-12-12 21:54:04,509 INFO [org.apache.hadoop.metrics.jvm.JvmMetrics] - Initializing JVM Metrics with processName=JobTracker, sessionId=2 ...
不多说,直接上代码。 与家庭成员之间的通话记录一份,存储在Excel文件中,如下面的数据集所示。我们需要基于这份数据,统计每个月每个家庭成员给自己打电话的次数,并按月份输出到不同文件夹。 2016-12-12 20:04:10,203 INFO [zhouls.bigdata.myMapReduce ...
不多说,直接上代码。 代码 package zhouls.bigdata.myMapReduce.friend; import org.apache.hadoop.io.Text; public class Fof extends Text{//自定义Fof,表示f1和f2关系 public Fof ...
不多说,直接上代码。 对流量原始日志进行流量统计,将不同省份的用户统计结果输出到不同文件。 代码 package zhouls.bigdata.myMapReduce.flowsum; import java.io.DataInput;import java.io.DataOutput;import ...
不多说,直接上代码。 统计出每个年龄段的 男、女 学生的最高分 这里,为了空格符的差错,直接,我们有时候,像如下这样的来排数据。 代码 package zhouls.bigdata.myMapReduce.Gender; import java.io.IOException;import org.a ...
不多说,直接上代码。 代码 package zhouls.bigdata.myMapReduce.ScoreCount; import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache. ...
不多说,直接上代码。 对流量原始日志进行流量统计,将不同省份的用户统计结果输出到不同文件。 代码 package zhouls.bigdata.myMapReduce.areapartition; import java.io.DataInput;import java.io.DataOutput; ...
不多说,直接上代码。 假如这里有一份邮箱数据文件,我们期望统计邮箱出现次数并按照邮箱的类别,将这些邮箱分别输出到不同文件路径下。 代码 package zhouls.bigdata.myMapReduce.Email; import java.io.IOException;import org.ap ...
不多说,直接上代码。 2016-12-12 17:04:32,012 INFO [org.apache.hadoop.metrics.jvm.JvmMetrics] - Initializing JVM Metrics with processName=JobTracker, sessionId=2 ...
分类:
编程语言 时间:
2016-12-12 19:21:22
阅读次数:
277