[root@localhost ~]#firewall-cmd --state not running [root@bigdata hadoop]# systemctl is-enabled firewalld.service;echo $? (查看服务是否开机启动) enabled 0 [root ...
分类:
系统相关 时间:
2020-04-11 18:17:13
阅读次数:
249
建议修改一下主机名 centos7 #修改主机名为bigdata hostnamectl set-hostname bigdata ##重启服务器,验证主机名是否生效 hostname hosts表设置 将hosts文件 复制到各个主机 scp hosts root@ip:/etc/ 生产密钥 通过 ...
分类:
系统相关 时间:
2020-04-02 16:12:34
阅读次数:
110
1、BigData是什么?大数据(BigData),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据包括结构化、半结
分类:
其他好文 时间:
2020-03-18 14:04:51
阅读次数:
105
总结一下大数据开发基本常识: JDK(做java开发必备的开发工具包) Hadoop(Apache开发的分布式系统的基础框架)三大组件:MapReduce,Yarn,Hdfs Sqoop(数据迁移,清洗) Kettle(数据清洗,格式转换) Hive(基于Hadoop的数据仓库,并不是数据库,需要安 ...
分类:
系统相关 时间:
2020-03-15 22:17:01
阅读次数:
90
root@bigdata-159:/usr/local/mysql# ./bin/mysqld -- defaults-file=/etc/my.cnf --initialize --user=mysql./bin/mysqld: error while loading shared librari ...
分类:
数据库 时间:
2020-03-14 21:51:25
阅读次数:
85
import numpy as np import pandas as pd from matplotlib import pyplot as plt nasa=pd.read_table(r"Y:\Workplace\BigData\percent-bachelors-degrees-women- ...
分类:
其他好文 时间:
2020-03-08 14:24:12
阅读次数:
81
[toc] 1. "Kafka简介" Kafka是一种计算框架,结合了之前的MapReduce批处理和流式计算为一体,可以处理历史数据和实时数据。 流平台具有三个关键功能: 发布和订阅记录流,类似于消息队列或企业消息传递系统。 以容错的持久方式存储记录流。 处理记录流。 Kafka通常用于两大类应用 ...
分类:
其他好文 时间:
2020-03-07 21:04:52
阅读次数:
77
详细的讲解了hbase原理与架构,以及安装部署教程
分类:
其他好文 时间:
2020-02-12 18:33:52
阅读次数:
44
sudo docker pull hub-mirror.c.163.com/library/nginx:latest https://blog.csdn.net/BigData_Mining/article/details/87869147 https://www.cnblogs.com/fudon ...
分类:
其他好文 时间:
2020-02-02 23:33:12
阅读次数:
81
一、环境准备 机器: 10.21.58.94(coordinator服务) 10.21.58.95(worker服务) 10.21.58.96(worker服务) 下载presto环境并解压: 部署的presto版本为0.223.1,下载路径为 /opt/bigdata/app/ 下载地址:http ...
分类:
其他好文 时间:
2020-01-14 23:52:44
阅读次数:
164