码迷,mamicode.com
首页 >  
搜索关键字:hadoop nutch hbase    ( 16575个结果
浅谈mapreduce程序部署
尽管我们在虚拟机client上能非常快通过shell命令,进行运行一些已经封装好实例程序,可是在应用中还是是自己敲代码,然后部署到server中去,以下,我通过程序进行浅谈一个程序的部署过程。在启动Hadoop之后,然后把程序达成可运行的jar包,并把对应的第三方jar包 包括进去。运行hadoop...
分类:其他好文   时间:2014-08-12 00:19:43    阅读次数:224
hadoop常用api编写
package hsfs常用api;import java.io.ByteArrayInputStream;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.IOException;i...
分类:Windows程序   时间:2014-08-11 23:51:53    阅读次数:337
MapReduce介绍
13年初整理的一个关于MapReduce的简单介绍和总结,希望对大家有所帮助,同学欢迎交流JVM、Spark、Hadoop等技术。...
分类:其他好文   时间:2014-08-11 21:29:42    阅读次数:251
Phoenix(sql on hbase)简介
Phoenix(sql on hbase)简介 介绍: Phoenix is a SQL skin over HBase delivered as a client-embedded JDBC driver targeting low latency queries over HBase data. Phoenix takes your SQL query, compile...
分类:数据库   时间:2014-08-11 21:28:33    阅读次数:589
hive与hbase整合
配置环境.hadoop2.4hbase0.98.3hive0.13.1(源用的mysql)配置。分2种情况(1.hbase与hive在一台机器上,2.hbase与hive不在同一台机器上)(1)hbase与hive在一台机器上比较简单,只需要在环境变量里把hbase,hive的home配置好即可。当然也可以按照不在一台进行配置。#confighad..
分类:其他好文   时间:2014-08-11 18:14:03    阅读次数:177
HBase备份之导入导出
我们在上一篇文章《HBase复制》中讲述了如何建立主/从集群,实现数据的实时备份。但是,HBase复制只对设置好复制以后的数据生效,也即,配置好复制之后插入HBase主集群的数据才能同步复制到HBase从集群中,而对之前的历史数据,采用HBase复制这种办法是无能为力的。本文介绍如何使用HBase的导入导出功能来实现历史数据的备份。 1)将HBase表数据导出到hdfs的一个指定目录中,具体命令...
分类:其他好文   时间:2014-08-11 17:47:22    阅读次数:322
MapReduce中的排序
hadoop的计算模型就是map/reduce,每一个计算任务会被分割成很多互不依赖的map/reduce计算单元,将所有的计算单元执行完毕后整个计算任务就完成了。因为计算单元之间互不依赖所以计算单元可以分配到不同的计算机上执行,这样就可以将计算压力平摊到多个机器上面。当然性能线性提高是有条件的,....
分类:其他好文   时间:2014-08-11 14:38:52    阅读次数:189
《Hadoop高级编程》之为Hadoop实现构建企业级安全解决方案
本章内容提要●理解企业级应用的安全顾虑●理解Hadoop尚未为企业级应用提供的安全机制●考察用于构建企业级安全解决方案的方法 第10章讨论了Hadoop安全性以及Hadoop中用于提供安全控制的机制。当构建企业级安全解决方案(它可能会围绕着与Hadoop数据集交互的许多应用程序和企业级服务)时,.....
分类:其他好文   时间:2014-08-11 11:26:22    阅读次数:368
Hadoop的辉煌还能延续多久?
Hadoop的辉煌还能延续多久?摘要:Hadoop已经成为大数据的代名词。短短几年间,Hadoop从一种边缘技术成为事实上的标准。而另一方面,MapReduce在谷歌已不再显赫。当企业瞩目MapReduce的时候,谷歌好像早已进入到了下一个时代。Hadoop技术已经无处不在。不管是好是坏,Hadoo...
分类:其他好文   时间:2014-08-10 23:56:51    阅读次数:396
Hadoop与Lucene和Nutch的关系
Hadoop+Lucene+NutchHadoop中实现了 Google的GFS和MapReduce算法,使Hadoop成为了一个分布式的计算平台。Hadoop不仅是一个用于存储的分布式文件系统,而且是设计用来在由通用计算设备组成的大型集群上执行分布式应用的框架。Lucene是一个Java高性能全文...
分类:其他好文   时间:2014-08-10 23:51:50    阅读次数:316
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!