码迷,mamicode.com
首页 >  
搜索关键字:hadoop中    ( 495个结果
使用hadoop实现平均数~并输出top N
本文通过具体的实例,介绍如何使用hadoop中mapreduce程序解决平均数以及top N的相关问题。...
分类:其他好文   时间:2014-11-14 14:16:48    阅读次数:199
建立HBase的集群和HDInsight在Hadoop中使用Hive来查询它们
建立HBase的集群和HDInsight在Hadoop中使用Hive来查询它们 在本教程中,您将学习如何创建和查询HDInsight使用HiveHadoop的HBase的表。下列步骤描述: ?如何使用提供在Azure门户的HBase的集群。 ?如何启用和使用RDP访问HBase的外壳,并使用HBase的外壳创建HBase的示例表,添加行,然后列出表中的行。 ?如何创建一个Hive表映射到一个现有的HBase的表,使用HiveQL查询数据在HBase的表。 ?如何使用Microsoft HBase的REST客...
分类:其他好文   时间:2014-11-13 16:43:25    阅读次数:377
hadoop中的hive查询cdn访问日志指定时间段内url访问次数最多的前10位(结合python语言)
hadoop环境描述:master节点:node1slave节点:node2,node3,node4远端服务器(python连接hive):node29需求:通过hive查询到cdn日志中指定时间段内url访问次数最多的前10个urlps:用pig查询可以查询文章:http://shineforever.blog.51cto.com/1429204/1571124说明:python操..
分类:编程语言   时间:2014-11-06 17:50:01    阅读次数:424
日志收集系统简介
基于Hadoop、Zookeeper、HBase、Flume框架上搭建一起来的一个日志分析系统。 使用Hadoop中的HDFS作为原始数据的存储,Flume作为数据的实时采集、转换等功能。 HBase作为数据的存储数据库,查询页面的数据都从这个分布式数据库中的一个表中获 取,根据应用程序的业务不同,查询不同的HBase表。实现了下面几大功能:     1 数据采集、转换和存储。正如上面介绍...
分类:其他好文   时间:2014-11-05 10:55:34    阅读次数:182
(转)MapReduce中的两表join几种方案简介
转自:http://blog.csdn.net/leoleocmm/article/details/86020811. 概述在传统数据库(如:MYSQL)中,JOIN操作是非常常见且非常耗时的。而在HADOOP中进行JOIN操作,同样常见且耗时,由于Hadoop的独特设计思想,当进行JOIN操作时,...
分类:其他好文   时间:2014-11-04 17:05:01    阅读次数:221
用Shell脚本过滤Hadoop中不能访问的节点
最近使用的一个集群hp1,因为维护集群的人不给力,节点总是过一段时间就掉一两个。今天发现重启hadoop时,HDFS已经进入保护模式了。 决定把slaves节点中的无法访问的节点全部过滤掉,所以写了一个小脚本,在这里记录一下,以后方便直接拿来使用。...
分类:系统相关   时间:2014-11-04 11:01:55    阅读次数:163
Hadoop中常用的InputFormat、OutputFormat(转)
Hadoop中的Map Reduce框架依赖InputFormat提供数据,依赖OutputFormat输出数据,每一个Map Reduce程序都离不开它们。Hadoop提供了一系列InputFormat和OutputFormat方便开发,本文介绍几种常用的:TextInputFormat作为默认的...
分类:其他好文   时间:2014-11-01 11:25:17    阅读次数:254
Hadoop-2.4.1学习之edits和fsimage查看器
在hadoop中edits和fsimage是两个至关重要的文件,其中edits负责保存自最新检查点后命名空间的变化,起着日志的作用,而fsimage则保存了最新的检查点信息。这个两个文件中的内容使用普通文本编辑器是无法直接查看的,幸运的是hadoop为此准备了专门的工具用于查看文件的内容,这些工具分别为oev和oiv,可以使用hdfs调用执行。...
分类:其他好文   时间:2014-10-31 12:04:14    阅读次数:339
MapReduce 计算模型
前言 本文讲解Hadoop中的编程及计算模型MapReduce,并将给出在MapReduce模型下编程的基本套路。模型架构 在Hadoop中,用于执行计算任务(MapReduce任务)的机器有两个角色:一个是JobTracker,一个是TaskTracker,前者用于管理和调度工作,后者用于执行.....
分类:其他好文   时间:2014-10-29 18:42:56    阅读次数:256
Hadoop-1.2.1学习之Job创建和提交源代码分析
在Hadoop中,MapReduce的Java作业通常由编写Mapper和Reducer开始,接着创建Job对象,然后使用该对象的set方法设置Mapper和Reducer以及诸如输入输出等参数,最后调用Job对象的waitForCompletion(true)方法提交作业并等待作业的完成。尽管使用了寥寥数语就描述了作业的创建和提交,但实际情况要复杂的多,本篇文章将通过分析源代码来深入学习该过程。...
分类:其他好文   时间:2014-10-27 17:48:18    阅读次数:152
495条   上一页 1 ... 40 41 42 43 44 ... 50 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!