操作过程 2.1 数据准备 A.1sudo mkdir usr/local/bigdatacase A.2sudo chown -R hadoop:hadoop ./bigdatacase A.3mkdir usr/local/bigdatacase/dataset A.4 A.5 B.1sed - ...
分类:
Web程序 时间:
2020-12-30 11:30:32
阅读次数:
0
二 HDFS部署 主要步骤如下:1. 配置Hadoop的安装环境;2. 配置Hadoop的配置文件;3. 启动HDFS服务;4. 验证HDFS服务可用。1‘ 查看是否存在hadoop安装目录 ls /usr/cstor/hadoop 如果没有,利用工具从本地导入hadoop安装文件。 查看jdk是否 ...
分类:
其他好文 时间:
2020-12-30 11:10:24
阅读次数:
0
需要准备 hadoop-2.6.0-cdh5.7.0 、jdk1.8.0_161 、zookeeper-3.4.5-cdh5.7.0、 hive-1.1.0-cdh5.7.0 1.在hadoop 的etc/hadoop/目录中的文件 core-site.xml 添加下面代码 ,其中颜色标记部分为你的 ...
分类:
其他好文 时间:
2020-12-29 11:30:43
阅读次数:
0
hadoop1.X架构 架构模型 分布式文件系统核心模块: namenode:集群中的主节点,管理元数据(文件的大小,文件的位置,文件的权限)。 secondaryNameNode:辅助namenode管理元数据信息。 dadanode:集群当中的从节点,主要存储集群中的各种数据。 分布式数据计算核 ...
分类:
其他好文 时间:
2020-12-28 11:29:22
阅读次数:
0
hive作为一个sql查询引擎,自带了一些基本的函数,比如count(计数),sum(求和),有时候这些基本函数满足不了我们的需求,这时候就要写hive hdf(user defined funation),又叫用户自定义函数。 UDF 创建与使用步骤 继承org.apache.hadoop.hiv ...
分类:
其他好文 时间:
2020-12-25 13:07:42
阅读次数:
0
一. 前期准备 1. Vmware workstation pro 16 官网下载 : https://www.vmware.com/ 密钥:ZF3R0-FHED2-M80TY-8QYGC-NPKYF (若失效请自行百度) 2. xshell,xftp 官网下载(需要注册) 3. 国内镜像网站下载c ...
Yarn将用TypeScript重写,Flow惨遭亲爹抛弃!整理|覃云今天,Yarn官方团队在GitHubissue中宣布将对Yarn进行重大更改,主要包括:将代码库从Flow移植到TypeScript,不再支持Node4和Node6,并为Yarn新增了一些功能等,这个更改项目代号为Berry,目的是增强Yarn优势,弥补弱势。Yarn是Facebook开源的一款号称代替npm的js包管理工具,相
分类:
其他好文 时间:
2020-12-24 12:38:25
阅读次数:
0
MapReduce详细工作流程之Map阶段 如上图所示 首先有一个200M的待处理文件 切片:在客户端提交之前,根据参数配置,进行任务规划,将文件按128M每块进行切片 提交:提交可以提交到本地工作环境或者Yarn工作环境,本地只需要提交切片信息和xml配置文件,Yarn环境还需要提交jar包;本地 ...
分类:
其他好文 时间:
2020-12-22 12:23:51
阅读次数:
0
参考:https://forum.huawei.com/enterprise/zh/thread-435089.html 安全模式是HDFS的一种工作状态,处于安全模式下,只能给客户端提供只读视图,不接受增删改。 namenode启动时,会将映像文件(fsimage)和编辑日志(edit log)加 ...
分类:
其他好文 时间:
2020-12-21 11:55:04
阅读次数:
0
主3306my.cnf [client] port = 3306 socket = /var/lib/mysql/3306-mysql.sock [mysqld] user = hdfs port = 3306 socket = /var/lib/mysql/3306-mysql.sock data ...
分类:
数据库 时间:
2020-12-21 11:31:29
阅读次数:
0