码迷,mamicode.com
首页 >  
搜索关键字:hadoop jetty    ( 14966个结果
在centos7上安装hadoop
1.使用hadoop是需要jdk环境的,因为hadoop里面有java程序,而运行java程序需要jdk。 2.从宿主机上传文件到虚拟机有很多方法,我选择的是在虚拟机安装lrzsz,安装lrzsz命令行:yum install y lrzsz 3.确定好软件安装路径 /opt 工作目录 /opt/i ...
分类:其他好文   时间:2020-02-20 15:34:25    阅读次数:143
#IT明星不是梦#Hadoop整合Hbase案例详解
Hadoop集合Hbase案例详解
分类:其他好文   时间:2020-02-20 13:25:32    阅读次数:65
大数据开发:Hadoop配置
一、相关知识回顾 分布式文件存储 信息源: 购买信息元(对海量数据清洗) 自营提供(限于大公司) 爬虫、抓包 信息格式:文件、文本、sql、json 分布式计算 离线批处理 MapReduce spark 实时数据流 storm spark Sqoop数据迁移:hdfs mysql flume数据上 ...
分类:其他好文   时间:2020-02-19 10:28:03    阅读次数:94
java.lang.NullPointerException Ignoring exception during close for org.apache.hadoop.mapred.MapTask$NewOutputCollector@1398c56
1.问题描述:在调试mapreduce辅助排序(二次排序)的过程中,运行程序总是报错 Ignoring exception during close for org.apache.hadoop.mapred.MapTask$NewOutputCollector@1398c56java.lang.Nu ...
分类:编程语言   时间:2020-02-19 01:00:54    阅读次数:103
nginx与tomcat的区别
nginx与tomcat的区别 nginx常用做静态内容服务和代理服务器,直面外来请求转发给后面的应用服务(tomcat,django等),tomcat更多用来做做一个应用容器,让javaweb app跑在里面的东西,对应同级别的有jboss,jetty等。严格的来说,Apache/Nginx 应该 ...
分类:其他好文   时间:2020-02-18 18:25:15    阅读次数:68
大数据 hadoop ---- Sqoop、flume、chukwa
Sqoop 简介 Sqoop(发音:skup)是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可 ...
分类:Web程序   时间:2020-02-18 12:47:15    阅读次数:149
Hadoop整体概述
目录 前言 core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml 一、HDFS HDFS的设计理念 HDFS的缺点 1、NameNode 1.1、namenode的作用 1.2、元数据目录说明 1.3、NameNode启动 2、Secon ...
分类:其他好文   时间:2020-02-18 09:58:41    阅读次数:100
大数据篇:YARN
YARN YARN是什么? YARN是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。 如果没有YARN! 1. 无法管理集群资源分配问题。 2. 无法合理的给程序分配合理的资源。 ...
分类:其他好文   时间:2020-02-17 22:35:33    阅读次数:311
大数据 hadoop ------ pig 、hive、Mahout、hbase
pig Pig最早是雅虎公司的一个基于Hadoop的并行处理架构,后来Yahoo将Pig捐献给Apache的一个项目,由Apache来负责维护,Pig是一个基于 Hadoop的大规模数据分析平台。 Pig为复杂的海量数据并行计算提供了一个简 易的操作和编程接口,这一点和FaceBook开源的Hive ...
分类:其他好文   时间:2020-02-17 19:32:25    阅读次数:122
(2)spark运行模式
spark运行模式 下面我们来看一下spark的运行模式,根据上一篇博客我们知道spark的运行模式分为以下几种:local、standalone、hadoop yarn。我们说本地开发最好用local模式,直接搭建一个spark环境就可以跑了,因为测试的话本地是最方便的。standalone,用的 ...
分类:其他好文   时间:2020-02-17 18:05:26    阅读次数:86
14966条   上一页 1 ... 79 80 81 82 83 ... 1497 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!