搜索关键字：hadoop nutch hbase，搜索到16575个结果！码迷,mamicode.com！

在hadoop上进行编写mapreduce程序，统计关键词在text出现次数

mapreduce的处理过程分为2个阶段，map阶段，和reduce阶段。在要求统计指定文件中的所有单词的出现次数时， map阶段把每个关键词写到一行上以逗号进行分隔，并初始化数量为1（相同的单词hadoop中的map会自动放到一行中） reduce阶段是把每个单词出现的频率统计出来重新写回去。如代码： package com.clq.hadoop2; import org.apa...

分类：其他好文时间：2014-07-23 17:16:02 阅读次数：199

Hive与Hbase区别

hive是什么？白话一点再加不严格一点，hive可以认为是map-reduce的一个包装。hive的意义就是把好写的hive的sql转换为复杂难写的map-reduce程序。于是，hbase是什么？同样白话一点加不严格一点，hbase可以认为是...

分类：其他好文时间：2014-07-23 13:57:36 阅读次数：268

hadoop编程小技巧（6）---处理大量小数据文件CombineFileInputFormat应用

代码测试环境：Hadoop2.4应用场景：当需要处理很多小数据文件的时候，可以应用此技巧来达到高效处理数据的目的。原理：应用CombineFileInputFormat，可以把多个小数据文件在进行分片的时候合并。由于每个分片会产生一个Mapper，当一个Mapper处理的数据比较小的时候，其效率较低。而一般使用Hadoop处理数据时，即默认方式，会把一个输入数据文件当做一个分片，这样当输入文件较小...

分类：其他好文时间：2014-07-23 13:09:36 阅读次数：281

linux centos 装g++安装不了

今天需要编译一个项目的时候在装g++都装不上，[root@master hadoop]# yum install g++Loaded plugins: fastestmirror, refresh-packagekit, securityLoading mirror speeds from cach...

分类：系统相关时间：2014-07-23 12:35:56 阅读次数：303

CDH4.5.0源代码编译

Unable to load native-hadoop library for your platform解决安装maven1 cmake-2.8.12.1.tar.gzcd cmake-2.8.12.1 ./bootstrap make sudo make install2 安装ant expo...

分类：其他好文时间：2014-07-23 12:22:36 阅读次数：327

[Linux][Hadoop] 运行WordCount例子

完成Hadoop的安装并跑起来之后，是该运行相关例子的时候了，而最简单最直接的例子就是HelloWorld式的WordCount例子

分类：系统相关时间：2014-07-23 11:34:06 阅读次数：488

[Linux][Hadoop] 将hadoop跑起来

启动hadoop，查看hadoop相关配置

分类：系统相关时间：2014-07-23 11:32:06 阅读次数：353

【甘道夫】HBase连接池 -- HTablePool被Deprecated之后

说明：最近两天在调研HBase的连接池，有了一些收获，特此记录下来。本文先将官方文档（http://hbase.apache.org/book.html）9.3.1.1节翻译，方便大家阅读，然后查阅了关键类HConnectionManager的Developer API（http://hbase.apache.org/devapidocs/index.html）做了一些总结。...

分类：其他好文时间：2014-07-23 00:12:08 阅读次数：466

“大数据讲师”、“Hadoop讲师”、“Spark讲师”、“云计算讲师”、“Android讲师”

王家林简介Spark亚太研究院院长和首席专家，中国目前唯一的移动互联网和云计算大数据集大成者。在Spark、Hadoop、Android等方面有丰富的源码、实务和性能优化经验。彻底研究了Spark从0.5.0到0.9.1共13个版本的Spark源码，并已完成2014年5月31日发布的Spark1.0...

分类：移动开发时间：2014-07-22 23:29:47 阅读次数：241

Hadoop学习笔记(2) ——解读Hello World

Hadoop学习笔记(2) ——解读Hello World 上一章中，我们把hadoop下载、安装、运行起来，最后还执行了一个Hello world程序，看到了结果。现在我们就来解读一下这个Hello Word。 OK，我们先来看一下当时在命令行里输入的内容： $mkdir input $cd i....

分类：其他好文时间：2014-07-22 23:27:57 阅读次数：401

共16575条上一页 1 ... 1579 1580 1581 1582 1583 ... 1658 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)