码迷,mamicode.com
首页 >  
搜索关键字:hadoop outputformat    ( 13980个结果
hadoop 数据处理 总结
最近工作中用了了Hadoop,比如用Hadoop来处理广告的一些pv量数据、点击数据等,最后统计后给运营展示每个广告的数据报表 首先自己了解了一些关于Hadoop的概念知识 hadoop平台提供了分布式存储(hdfs),分布式计算(mapredduce),任务调度(YARN)、对象存储(Ozone) ...
分类:其他好文   时间:2020-05-30 20:22:33    阅读次数:94
Sqoop从入门到实战
第1章 Sqoop 简介 Sqoop 是一款开源的工具,主要用于在 Hadoop(Hive) 与传统的数据库 (mysql,postgresql,...) 间进行数据的高校传递,可以将一个关系型数据库(例如:MySQL,Oracle,Postgres等)中的数据导入到 Hadoop 的 HDFS 中 ...
分类:其他好文   时间:2020-05-30 20:21:57    阅读次数:82
Flume从入门到实战
第1章 Flume概述 1.1 Flume定义 Flume(水槽) 是 Cloudera 提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。 在2009年Flume被捐赠了apache软件基金会,为hadoop相关组件之一。尤其近几年随着flum ...
分类:Web程序   时间:2020-05-30 19:56:36    阅读次数:89
hive从入门到实战四
第8章 压缩和存储(Hive高级) 8.1 Hadoop源码编译支持Snappy压缩 8.1.1 资源准备 1、CentOS联网 配置CentOS能连接外网。Linux虚拟机 ping www.baidu.com 是畅通的。 注意:采用root角色编译,减少文件夹权限出现问题。2、jar包准备(ha ...
分类:其他好文   时间:2020-05-30 19:42:06    阅读次数:53
hive从入门到实战一
第1章 Hive入门 1.1 什么是Hive Hive:由Facebook开源用于解决海量结构化日志的数据统计(分析数据的框架)。 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 本质是:将HQL转化成MapReduce程序。 1)Hive ...
分类:其他好文   时间:2020-05-30 19:36:05    阅读次数:56
HBase的安装部署
1、HBase安装说明 JDK1.7以上 Hadoop-2.5.0以上 Zookeeper-3.4.5 2、Hadoop2.6安装 1) 解压 tar -zxvf hadoop-2.6.0.tar.gz 2) 配置hardoop的jdk cd /root/tools/hadoop-2.6.0/etc ...
分类:其他好文   时间:2020-05-30 15:46:42    阅读次数:67
String概述
String的基本特性 String是字符串,使用一对引号("")包装。 String声明是final的,不可被继承。 String实现了Serializable接口,表示字符串是支持序列化的;实现了Comparable接口,表示String可以比较大小。 String在jdk8及以前内部定义了fi ...
分类:其他好文   时间:2020-05-30 12:25:11    阅读次数:64
CDH6.3.2 开启Kerberos 认证
CDH6.3.2开启Kerberos认证标签(空格分隔):大数据平台构建一:如何安装及配置KDC服务二:如何通过CDH启用Kerberos三:如何登录Kerberos并访问Hadoop相关服务一:如何安装及配置KDC服务1.1系统环境1.操作系统:CentOS7.5x642.CDH6.3.23.采用root用户进行操作1.2KDC服务安装及配置1.在ClouderaManager服务器上安装KDC
分类:其他好文   时间:2020-05-30 11:10:46    阅读次数:263
Hadoop 伪分布模式安装
( 温馨提示:图片中有id有姓名,不要盗用哦,可参考流程,有问题评论区留言哦 ) 一、任务目标 1、了解Hadoop的3种运行模式 2、熟练掌握Hadoop伪分布模式安装流程 3、培养独立完成Hadoop伪分布安装的能力 二、系统环境 Linux Ubuntu 16.04 三、任务内容 在只安装Li ...
分类:其他好文   时间:2020-05-30 01:06:25    阅读次数:168
Hadoop简介
Hadoop 简介: 两大核心:HDFS+MapReduce Hadoop1.0,Hadoop2.0 Linux:基础 shell,sudo Hadoop集群的部署与使用 先访问nameNode 存储DataNode JobTracker TaskTracker 分布式文件系统 伪分布式:就是吧名称 ...
分类:其他好文   时间:2020-05-29 17:44:12    阅读次数:71
13980条   上一页 1 ... 42 43 44 45 46 ... 1398 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!