码迷,mamicode.com
首页 >  
搜索关键字:hadoop nutch hbase    ( 16575个结果
大数据Linux常用命令4
1.系统常用检查命令 1 磁盘 df -h 2 内存 free -m 3 负载 top 4 5 [hadoop@bigdata ~]$ free -m 6 total used free shared buff/cache available 7 Mem: 7823 222 6229 257 137 ...
分类:系统相关   时间:2020-06-23 15:37:42    阅读次数:82
Hadoop MapReduce
一、概述 1.是Hadoop中的一套分布式的计算框架 2.将整个计算过程拆分为2个阶段:Map阶段、Reduce阶段 3.Map阶段一般负责数据的整理,Reduce阶段负责数据的汇总 4.如果输入路径是一个文件,则MapReduce只处理这个文件;如果输入的是一个目录,则处理这个目录下的所有文件 - ...
分类:其他好文   时间:2020-06-23 15:36:59    阅读次数:38
Hive llap服务安装说明及测试
Hive llap服务安装说明及测试 参考:https://www.cnblogs.com/hdpdriver/p/7642729.html 1.简介说明 从Hive 2.0引入了LLAP(Live Long And Process),2.1进行了比较大的优化,可以说hive已经走向了内存计算, 目 ...
分类:其他好文   时间:2020-06-23 15:26:38    阅读次数:174
大数据应用技术课程实践--选题与实践方案
一、选题与意义 1.Hadoop平台应用 2.Kaggle分析数据项目 简要说明理由与意义。 二、实践方案 简要说明理由。 三、实践任务分解 根据所选的题目,明确实验步骤,分解任务到每天。 四、实践计划 按任务分解撰写计划表,每天按计划表开展工作。 第天根据实际情况更新计划表,有必要时调整。 *说明 ...
分类:其他好文   时间:2020-06-23 15:03:21    阅读次数:42
入门大数据---Hbase容灾与备份
Hbase容灾与备份 一、前言 本文主要介绍 Hbase 常用的三种简单的容灾备份方案,即CopyTable、Export/Import、Snapshot。分别介绍如下: 二、CopyTable 2.1 简介 CopyTable可以将现有表的数据复制到新表中,具有以下特点: 支持时间区间 、row ...
分类:其他好文   时间:2020-06-23 00:44:02    阅读次数:60
centos搭建LAMP环境
只是为了记录一下,出处看最后 一,安装 apache 1,安装 apache [hadoop@YunMaster ~]$ sudo yum -y install httpd httpd-manual mod_ssl mod_perl mod_auth_mysql 2,启动 apache [hadoo ...
分类:其他好文   时间:2020-06-22 22:39:34    阅读次数:66
Hadoop dfs目录
dfs目录位置由core-site.xml文件中 hadoop.tmp.dir 属性决定 :hadoop.tmp.dir属性对应值/dfs 1.dfs目录是在NameNode被格式化的时候产生的 格式化:首先在停止hadoop之后,删除 hadoop.tmp.dir 属性对应值目录下的所有文件后,执 ...
分类:其他好文   时间:2020-06-22 12:36:38    阅读次数:145
配置文件说明
默认配置文件 要获取的默认配置文件 文件存放在Hadoop的jar包中的位置 自定义配置文件[etc/hadoop]中 [core-default.xml] hadoop-common-2.10.0.jar/core-default.xml [core-site.xml] [hdfs-default ...
分类:其他好文   时间:2020-06-22 12:33:23    阅读次数:48
[AWS][大数据][Hadoop] 使用EMR做大数据分析
实验包括:1.使用EMR创建Hadoop集群2.定义schema,创建示例表。3.通过HiveQL分析数据,并将分析结果保存到S3上4.下载已经分析结果数据。Task1:创建一个S3桶创建一个存储桶比如hadoop202006…Task2:创建EMR集群这里我解释一下Hadoop集群中的一些组件,了解大数据的同学直接忽略就好。ApacheHadoop:在分布式服务器集群上存储海量数据并运行分布式分
分类:其他好文   时间:2020-06-22 09:17:08    阅读次数:174
大数据结构生态体系
数据来源层 数据库 日志 视频,ppt 数据传输层 Sqoop数据传递 Flume日志收集 kafka消息队列 数据存储层 HDFS文件存储 HBase非关系型数据库 kafka(存储少量数据) 资源管理层 YARN资源管理 数据计算层 MapReduce离线计算 Hive数据查询 Mahout数据 ...
分类:其他好文   时间:2020-06-22 00:56:04    阅读次数:83
16575条   上一页 1 ... 42 43 44 45 46 ... 1658 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!