搜索关键字：hadoop中，搜索到495个结果！码迷,mamicode.com！

本文通过具体的实例，介绍如何使用hadoop中mapreduce程序解决平均数以及top N的相关问题。...

分类：其他好文时间：2014-11-14 14:16:48 阅读次数：199

建立HBase的集群和HDInsight在Hadoop中使用Hive来查询它们在本教程中，您将学习如何创建和查询HDInsight使用HiveHadoop的HBase的表。下列步骤描述： ?如何使用提供在Azure门户的HBase的集群。 ?如何启用和使用RDP访问HBase的外壳，并使用HBase的外壳创建HBase的示例表，添加行，然后列出表中的行。 ?如何创建一个Hive表映射到一个现有的HBase的表，使用HiveQL查询数据在HBase的表。 ?如何使用Microsoft HBase的REST客...

分类：其他好文时间：2014-11-13 16:43:25 阅读次数：377

hadoop中的hive查询cdn访问日志指定时间段内url访问次数最多的前10位（结合python语言）

hadoop环境描述：master节点：node1slave节点：node2，node3，node4远端服务器（python连接hive）：node29需求：通过hive查询到cdn日志中指定时间段内url访问次数最多的前10个urlps：用pig查询可以查询文章：http://shineforever.blog.51cto.com/1429204/1571124说明：python操..

分类：编程语言时间：2014-11-06 17:50:01 阅读次数：424

日志收集系统简介

基于Hadoop、Zookeeper、HBase、Flume框架上搭建一起来的一个日志分析系统。使用Hadoop中的HDFS作为原始数据的存储，Flume作为数据的实时采集、转换等功能。 HBase作为数据的存储数据库，查询页面的数据都从这个分布式数据库中的一个表中获取，根据应用程序的业务不同，查询不同的HBase表。实现了下面几大功能： 1 数据采集、转换和存储。正如上面介绍...

分类：其他好文时间：2014-11-05 10:55:34 阅读次数：182

（转）MapReduce中的两表join几种方案简介

转自：http://blog.csdn.net/leoleocmm/article/details/86020811. 概述在传统数据库（如：MYSQL）中，JOIN操作是非常常见且非常耗时的。而在HADOOP中进行JOIN操作，同样常见且耗时，由于Hadoop的独特设计思想，当进行JOIN操作时，...

分类：其他好文时间：2014-11-04 17:05:01 阅读次数：221

用Shell脚本过滤Hadoop中不能访问的节点

最近使用的一个集群hp1，因为维护集群的人不给力，节点总是过一段时间就掉一两个。今天发现重启hadoop时，HDFS已经进入保护模式了。决定把slaves节点中的无法访问的节点全部过滤掉，所以写了一个小脚本，在这里记录一下，以后方便直接拿来使用。...

分类：系统相关时间：2014-11-04 11:01:55 阅读次数：163

Hadoop中常用的InputFormat、OutputFormat（转）

Hadoop中的Map Reduce框架依赖InputFormat提供数据，依赖OutputFormat输出数据，每一个Map Reduce程序都离不开它们。Hadoop提供了一系列InputFormat和OutputFormat方便开发，本文介绍几种常用的：TextInputFormat作为默认的...

分类：其他好文时间：2014-11-01 11:25:17 阅读次数：254

Hadoop-2.4.1学习之edits和fsimage查看器

在hadoop中edits和fsimage是两个至关重要的文件，其中edits负责保存自最新检查点后命名空间的变化，起着日志的作用，而fsimage则保存了最新的检查点信息。这个两个文件中的内容使用普通文本编辑器是无法直接查看的，幸运的是hadoop为此准备了专门的工具用于查看文件的内容，这些工具分别为oev和oiv，可以使用hdfs调用执行。...

分类：其他好文时间：2014-10-31 12:04:14 阅读次数：339

MapReduce 计算模型

前言本文讲解Hadoop中的编程及计算模型MapReduce，并将给出在MapReduce模型下编程的基本套路。模型架构在Hadoop中，用于执行计算任务(MapReduce任务)的机器有两个角色：一个是JobTracker，一个是TaskTracker，前者用于管理和调度工作，后者用于执行.....

分类：其他好文时间：2014-10-29 18:42:56 阅读次数：256

Hadoop-1.2.1学习之Job创建和提交源代码分析

在Hadoop中，MapReduce的Java作业通常由编写Mapper和Reducer开始，接着创建Job对象，然后使用该对象的set方法设置Mapper和Reducer以及诸如输入输出等参数，最后调用Job对象的waitForCompletion(true)方法提交作业并等待作业的完成。尽管使用了寥寥数语就描述了作业的创建和提交，但实际情况要复杂的多，本篇文章将通过分析源代码来深入学习该过程。...

分类：其他好文时间：2014-10-27 17:48:18 阅读次数：152

共495条上一页 1 ... 40 41 42 43 44 ... 50 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)