码迷,mamicode.com
首页 >  
搜索关键字:hadoop nutch hbase    ( 16575个结果
hbase jave编程
1、搭建环境 复制linux下已配置搭建好的hbase目录进入windows里面,当然使用linux开发的可以不用。 新建java工程,将hbase目录下的jar和lib下的jar包添加到类路径下。 同时增加外部Class Folder将hbase的conf目录增加进来 多数连接操作就是因为没...
分类:其他好文   时间:2014-07-25 16:48:41    阅读次数:266
Hadoop发行版本介绍
前言从2011年开始,中国进入大数据风起云涌的时代,以Hadoop为代表的家族软件,占据了大数据处理的广阔地盘。开源界及厂商,所有数据软件,无一不向Hadoop靠拢。Hadoop也从小众的高富帅领域,变成了大数据开发的标准。在Hadoop原有技术基础之上,出现了Hadoop家族产品,通过“大数据”概...
分类:其他好文   时间:2014-07-25 14:13:02    阅读次数:446
集成Nutch/Hbase/Solr构建搜索引擎之三:内容修改
1、从content域中搜索 从solr的example中得到的solrConfig.xml中,qf的定义如下: [html] view plaincopy str name="qf">      text^0.5 features^1.0 name^1.2 sku^1.5 id^10.0 manu^1.1 cat^1.4...
分类:其他好文   时间:2014-07-24 23:31:23    阅读次数:211
适合国内网速的CDH5安装
使用Cloudera Manager 安装CDH,虽然方便快捷,但是在中国国情的网速下还是需要进行一些特别的处理,才能顺利安装。本文汇总了多个参考文档,详细的记录了安装过程和期间出现的问题与解决方法。...
分类:其他好文   时间:2014-07-24 23:02:34    阅读次数:455
Hbase学习笔记之一 | Hbase Shell命令篇
最近在XX项目的测试过程中,接触到一些HBase的东西,希望能站在测试的角度,把过程记录下来,期望对快速了解它有点帮助。作为一个初次接触它的人来说,需要迫切掌握其中基本的概念,这里就不赘述了。HBase Shell是HBase提供的便捷的访问方式,首先你需要搭建HBase的环境,可以参考http:/...
分类:其他好文   时间:2014-07-24 22:37:03    阅读次数:214
HQueue:基于HBase的消息队列
HQueue:基于HBase的消息队列凌柏?1. HQueue简介HQueue是一淘搜索网页抓取离线系统团队基于HBase开发的一套分布式、持久化消息队列。它利用HTable存储消息数据,借助HBase Coprocessor将原始的KeyValue数据封装成消息数据格式进行存储,并基于HBase ...
分类:其他好文   时间:2014-07-24 22:31:52    阅读次数:290
Cassandra与HBase都是被设计用于管理非常大的数据集
在jsp商城开发中两者都被设计用于管理非常大的数据集。HBase文件声称一个HBase数据库可以拥有数亿个,甚至是数十亿个行。此外,用户还被建议继续使用关系型数据库。
分类:其他好文   时间:2014-07-24 21:48:52    阅读次数:210
hadoop编程小技巧(7)---自定义输出文件格式以及输出到不同目录
代码测试环境:Hadoop2.4应用场景:当需要定制输出数据格式时可以采用此技巧,包括定制输出数据的展现形式,输出路径,输出文件名称等。Hadoop内置的输出文件格式有:1)FileOutputFormat  常用的父类;2)TextOutputFormat 默认输出字符串输出格式;3)SequenceFileOutputFormat 序列化文件输出;4)MultipleOutputs 可以把输出...
分类:其他好文   时间:2014-07-24 17:47:36    阅读次数:298
大数据技术
Hadoop MapReduce思维模式转变的催化剂是大量新技术的诞生,它们能够处理大数据分析所带来的3个V的挑战。扎根于开源社区,Hadoop已经是目前大数据平台中应用率最高的技术,特别是针对诸如文本、社交媒体订阅以及视频等非结构化数据。除分布式文件系统之外,伴随Hadoop一同出现的还有进行大数...
分类:其他好文   时间:2014-07-24 17:00:47    阅读次数:263
hadoop应用开发技术详解
《大 数据技术丛书:Hadoop应用开发技术详解》共12章。第1~2章详细地介绍了Hadoop的生态系统、关键技术以及安装和配置;第3章是 MapReduce的使用入门,让读者了解整个开发过程;第4~5章详细讲解了分布式文件系统HDFS和Hadoop的文件I/O;第6章分析了 MapReduce的工...
分类:其他好文   时间:2014-07-24 11:25:42    阅读次数:337
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!