码迷,mamicode.com
首页 >  
搜索关键字:hadoop nutch hbase    ( 16575个结果
完全分布式Hadoop集群搭建
学习了这么久hadoop,都没有搭过集群,是不合格的。这次搭建完,细扣具体的Job运行情况,日志信息,对Hadoop了解更深了。后面也要陆续搭建分布式flume,kafka,hbase,mysql来完成最终的离线批处理分析项目。 搭建步骤 1. 虚拟机环境准备(IP地址、主机名、新用户、防火墙、SS ...
分类:其他好文   时间:2020-04-04 15:00:32    阅读次数:81
hadoop的eclipse插件
我使用的hadoop是2.9.2版本的,对应的eclipse插件也要使用2.9.2的,我自己编译了一份,上传到了百度网盘,下载地址如下: 链接:https://pan.baidu.com/s/11uM1tSeu-1zdTQrydfX5QA 提取码:p6y9 把插件放到eclipse的plugins目 ...
分类:系统相关   时间:2020-04-04 11:55:57    阅读次数:69
在Centos7.6上搭建Hadoop环境时安装jdk1.8,java:未找到命令
首先卸载Centos本身自带的openjdk,我参考的这位博主的安装教程 https://www.cnblogs.com/happyflyingpig/p/8068020.html 安装Hadoop环境,我参考的是这位博主的安装教程 https://blog.csdn.net/frank409167 ...
分类:编程语言   时间:2020-04-03 21:48:00    阅读次数:238
Linux添加环境变量到PATH的方法
Centos Linux添加环境变量到PATH的方法在 Linux CentOS 系统上安装完 Hadoop 后,为了使用方便,需要将 Hadoop 命令加到系统命令中,如果在没有添加到环境变量之前,执行“hadoop fs”命令时,则会提示命令不存在的错误,如下所示: 方法一1. export P ...
分类:系统相关   时间:2020-04-03 19:56:56    阅读次数:89
Hadoop简介
1.Hadoop的发展历史起源介绍 a.Hadoop最早起源于Nutch、Nutch的设计目标是构建一个大型的全网搜索引擎,包括网页抓取、索引、查询的功能,但随着抓取网页数量的增加,遇到了严重的可扩展的问题——如何解决数10亿网页的存储和索引问题。 b.2003、2004年谷歌发表的两篇论文为该问题 ...
分类:其他好文   时间:2020-04-03 12:26:15    阅读次数:105
Hadoop搭建高可用的HA集群
一、工具准备 1、7台虚拟机(至少需要3台),本次搭建以7台为例,配好ip,关闭防火墙,修改主机名和IP的映射关系(/etc/hosts),关闭防火墙 2、安装JDK,配置环境变量 二、集群规划: 集群规划(7台): 主机名 IP 安装的软件 运行的进程 hadoop01 192.168.*.121 ...
分类:其他好文   时间:2020-04-03 00:25:12    阅读次数:82
Presto 安装部署
1.版本选型 hadoop 3.1.3 hive 3.1.2 presto 0.233.1 2.Prsto 简介 详细参考:https://prestodb.github.io/docs/current/connector.html 2.1 Presto 优势 多数据源,支持SQL,自定义扩展Con ...
分类:其他好文   时间:2020-04-03 00:15:16    阅读次数:177
在idea上运行spark的wordcount
1.环境hadoop-2.6.0 spak2.1.1 scala-sdk-2.11.12 2.maven项目创建 3.pom 4.阿里云settings配置 <?xml version="1.0"?> <settings xsi:schemaLocation="http://maven.apache ...
分类:其他好文   时间:2020-04-02 19:37:02    阅读次数:213
hadoop-MapReduce框架原理之Shuffle机制
1.Shuffle机制 1.1 什么是shuffle机制 1.1.1 在hadoop中数据从map阶段传递给reduce阶段的过程就叫shuffle,shuffle机制是整个MapReduce框架中最核心的部分; 1.1.2 shuffle翻译成中文的意思为:洗牌,发牌(核心机制:数据分区,排序,缓 ...
分类:其他好文   时间:2020-04-02 18:08:23    阅读次数:115
hbase报错 ERROR: org.apache.hadoop.hbase.PleaseHoldException: Master is initializing
hbase报错 ERROR: org.apache.hadoop.hbase.PleaseHoldException: Master is initializing ...
分类:Web程序   时间:2020-04-02 17:59:54    阅读次数:82
16575条   上一页 1 ... 72 73 74 75 76 ... 1658 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!