码迷,mamicode.com
首页 >  
搜索关键字:hadoop nutch hbase    ( 16575个结果
Java面试题(多线程篇)
35.并行和并发有什么区别? 1.并行是指两个或者多个事件在同一时刻发生;而并发是指两个或多个事件在同一时间间隔发生。 2.并行是在不同实体上的多个事件,并发是在同一实体上的多个事件。 3.在一台处理器上“同时”处理多个任务,在多台处理器上同时处理多个任务。如hadoop分布式集群。 所以并发编程的 ...
分类:编程语言   时间:2020-04-24 14:32:30    阅读次数:67
Hadoop学习之运行官方案例
Hadoop的官方案例都在mapreduce.jar文件夹中,提供了mapreduce的基本功能,可用于计算,eg:pi值,计算文档中的字数等 官方案例都在 hadoop-mapreduce-examples-2.7.3.jar 这个jar包中。 命令:hadoop jar ./hadoop-2.7 ...
分类:其他好文   时间:2020-04-24 01:40:56    阅读次数:107
HBase Filter 过滤器概述
abc 过滤器介绍 HBase过滤器是一套为完成一些较高级的需求所提供的API接口。 过滤器也被称为下推判断器(push down predicates),支持把数据过滤标准从客户端下推到服务器,带有 Filter 条件的 RPC 查询请求会把 Filter 分发到各个 RegionServer,所 ...
分类:其他好文   时间:2020-04-23 22:46:48    阅读次数:76
Windows 上运行 Hadoop WordCount 用例
1. 下载wordcount jar 文件 下载文件夹放置你的目录: https://github.com/yjy24/bigdata_learning/blob/master/hadoopMapRedSimple.zip 2. 启动 hadoop 管理员身份运行window cmd: 启动 Had ...
分类:Windows程序   时间:2020-04-23 20:54:03    阅读次数:262
Hadoop运行环境搭建
大概的流程具体如下: 1、修改主机名 2、关闭防火墙 3、安装JDK并配置环境变量 4、安装Hadoop并配置环境变量 上面每个流程的具体操作如下: 一、修改主机名 1、修改主机名 根目录下输入如下代码: vim etc/hostname 然后把当前的主机名改掉,我改成了hadoop 2、修改lin ...
分类:其他好文   时间:2020-04-23 19:08:09    阅读次数:57
数据完全备份、差异备份、增量备份介绍
为避免因自然灾害等意外情况而导致的本地数据丢失情况,异地数据容灾也是企业数据保护的一大常见命题。Ucahe备份呢支持通过远程复制技术,将本地数据同步到异地,实现异地数据保护。一站式的web管理,支持增量,差异,永久,定时,多副本等30多项功能列表,8项灾备技术,3款产品,满足企业不同场景的数据备份需求,帮助企业实现小时级、分钟级、秒级RTO/RPO目标,高效率,低成本,操作简单,Ucahe采用首次
分类:其他好文   时间:2020-04-23 16:20:09    阅读次数:85
linux运维、架构之路-Kafka集群部署
一、Kafka介绍 Kafka是一个开源的分布式消息引擎/消息中间件,同时Kafka也是一个流处理平台。Kakfa支持以发布/订阅的方式在应用间传递消息,同时并基于消息功能添加了Kafka Connect、Kafka Streams以支持连接其他系统的数据(Elasticsearch、Hadoop等 ...
分类:系统相关   时间:2020-04-23 12:02:24    阅读次数:86
ZooKeeper 的常用操作方法
ZooKeeper 简介 ZooKeeper 是一个分布式的、开放源码的分布式应用程序协调服务,是 Google 的 Chubby 一个开源的实现,是 Hadoop 和 Hbase 的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。Zoo ...
分类:其他好文   时间:2020-04-22 16:49:02    阅读次数:66
shell脚本删除hbase里面的数据(按照rowkey批量删除hbase的数据)
最近在做将kafka里面的业务日志写入到hbase 当中,然后要对hbase 里面的数据进行解析然后插入到数据库当中。 为了能节约磁盘空间想对hbase里面的数据进行删除,但是我们设置的rowkey是按照每小时 加日期 然后加hash码的方式组成的。例子如下: 这个地方我们没有办法通过框定一个时间范 ...
分类:系统相关   时间:2020-04-22 16:12:15    阅读次数:337
Spark2.x写Hbase1-2.x
import org.apache.hadoop.hbase.io.ImmutableBytesWritable import org.apache.hadoop.hbase.mapreduce.TableOutputFormat import org.apache.hadoop.hbase.cli ...
分类:其他好文   时间:2020-04-22 09:54:55    阅读次数:108
16575条   上一页 1 ... 64 65 66 67 68 ... 1658 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!