新增了五个教程: Python 和 Jupyter 机器学习入门 零、前言 一、Jupyter 基础知识 二、数据清理和高级机器学习 三、Web 爬取和交互式可视化 Python 数据科学和机器学习实践指南 零、前言 一、入门 二、统计和概率回顾和 Python 实践 三、Matplotlib 和高 ...
分类:
Web程序 时间:
2021-03-15 11:11:19
阅读次数:
0
1. 阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系。 Hadoop对应于Google三驾马车:HDFS对应于GFS,即分布式文件系统,MapReduce即并行计算框架,HBase对应于BigTable,即分布式NoSQL列数据库,外加Zo ...
分类:
其他好文 时间:
2021-03-15 10:45:14
阅读次数:
0
1. 阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系,为什么要引入Yarn和Spark。 答: Hadoop对应于Google三驾马车:HDFS对应于GFS,即分布式文件系统,MapReduce即并行计算框架,HBase对应于BigTabl ...
分类:
其他好文 时间:
2021-03-15 10:30:53
阅读次数:
0
1. 阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系,为什么要引入Yarn和Spark。 Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。 Hadoop的核心是HDFS和MapReduce,hadoo ...
分类:
其他好文 时间:
2021-03-15 10:30:41
阅读次数:
0
MinIO服务器安装配置 docker启动MinIO服务器 # 创建minio目录用于存储数据文件 mkdir /srv/minio # 启动服务器,参数解析: # -d 后台启动 # -p 9000:9000 将宿主的9000端口指向容器的9000端口 # --restart always 开机自 ...
分类:
其他好文 时间:
2021-03-12 14:40:21
阅读次数:
0
设置metastore 机器: ke01、ke02、ke03、ke04 ke03 为元数据库 ke01、ke02、ke04 连接到元数据库 、 hive-metastore搭建 ke03: <configuration> <property> <name>hive.metastore.warehou ...
分类:
数据库 时间:
2021-03-12 13:42:56
阅读次数:
0
配置加速器(最新版的配置方法) [root@ming2 containers]# vim registries.conf [root@ming2 containers]# cat registries.conf unqualified-search-registries = ["docker.io" ...
分类:
其他好文 时间:
2021-03-11 14:17:03
阅读次数:
0
Docker版本 docker-ce.x86_64 # 社区版 docker-ee # 企业版 docker镜像站:https://hub.docker.com/ Kubernetes:https://kubernetes.io/zh/ 阿里云镜像站:https://developer.aliyun ...
分类:
Web程序 时间:
2021-03-11 12:07:03
阅读次数:
0
Spark的五种JOIN策略解析 JOIN操作是非常常见的数据处理操作,Spark作为一个统一的大数据处理引擎,提供了非常丰富的JOIN场景。本文分享将介绍Spark所提供的5种JOIN策略,希望对你有所帮助。本文主要包括以下内容: 影响JOIN操作的因素 Spark中JOIN执行的5种策略 Spa ...
分类:
其他好文 时间:
2021-03-10 13:42:57
阅读次数:
0
拉取镜像 docker pull mysql:5.7.3 运行镜像 docker run -e MYSQL_ROOT_PASSWORD=root -d mysql:5.7.32 # -e MYSQL_ROOT_PASSWORD=root意思是给root用户设置密码为root 启动一个mysql服务, ...
分类:
数据库 时间:
2021-03-10 13:25:55
阅读次数:
0