前面一篇文章提到大数据开发-Spark Join原理详解,本文从源码角度来看cogroup 的join实现 1.分析下面的代码 import org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContext} obje ...
分类:
其他好文 时间:
2021-02-16 12:23:59
阅读次数:
0
《Hadoop全权威指南第三版(原版)》 链接: https://pan.baidu.com/s/1O0AwkvstyRdB69Tiw8o7Ww 密码: 29li 有问题拿不到直接联系作者哦! 大数据越来越热。Hadoop技术是大数据技术的基础。 掌握了大数据技术,就意味着可以轻松找到高薪工作。 人 ...
分类:
其他好文 时间:
2021-02-15 11:48:45
阅读次数:
0
Redis Redis是一个开源的使用ANSI C语言编写、支持网络、 可基于内存亦可持久化的日志型、Key-Value型 NoSQL数据库,并提供多种语言的API。从2010年3 月15日起,Redis的开发工作由VMware主持。从 2013年5月开始,Redis的开发由Pivotal赞助。 一 ...
分类:
其他好文 时间:
2021-02-15 11:38:32
阅读次数:
0
一、虚拟化软件VMware® 0 下载及安装VMware Workstation 16 Pro 二、创建虚拟机配置 1 创建新的虚拟机 2 选择自定义,然后下一步 3 选择16.x,然后下一步 4 选择稍后安装,然后下一步 5 选择Linux、版本,然后下一步 6 输入虚拟机名称,选择存放位置,然后 ...
分类:
其他好文 时间:
2021-02-10 13:27:52
阅读次数:
0
#OSI && TCP 学习目标 了解OSI七层模型分层结构 了解TCP/IP协议簇四层模型分层结构 能够说出TCP/IP协议簇中运输层、网络层和数据链路层常见的相关协议 能够说出TCP/IP的三次握手四次断开过程 了解Vmware的三种网络模式 能够使用客户端工具连接虚拟机 掌握主机名、DNS和静 ...
分类:
其他好文 时间:
2021-02-10 13:06:34
阅读次数:
0
在围绕Hadoop形成的大数据技术生态当中,MapReduce的地位,在早期是处于核心地位的,但是伴随着数据处理实时性需求的不断提升,更多新的计算框架出现,MapReduce的地位受到压制,但是作为Hadoop原始计算框架,还是需要相应程度的了解和掌握的。今天的大数据入门分享,我们来具体讲一讲Map ...
分类:
其他好文 时间:
2021-02-09 12:33:28
阅读次数:
0
Kali Linux的安装、root获取、修改更新源、汉化 安装 Windows中使用VMware安装Kali Linux 2020.4,后续教程均在此基础上。 在Kali官网下载相应版本,Kali有专为VMware制做的镜像(Kali Linux VMware Images)。 解压后双击Kali ...
分类:
系统相关 时间:
2021-02-06 11:57:48
阅读次数:
0
postgresql数据库 timescaledb 时序库 把大数据量表转换为超表 文章目录 postgresql数据库 timescaledb 时序库 把大数据量表转换为超表一 创建新表二 把新表改为超表三 插入数据1.数据量不大的情况可以直接插入2.如果数据量比较大 可以采取 一天一天 插入 或 ...
分类:
数据库 时间:
2021-02-06 11:48:38
阅读次数:
0
postgresql数据库 timescaledb 时序库 把大数据量表转换为超表 文章目录 postgresql数据库 timescaledb 时序库 把大数据量表转换为超表一 创建新表二 把新表改为超表三 插入数据1.数据量不大的情况可以直接插入2.如果数据量比较大 可以采取 一天一天 插入 或 ...
分类:
数据库 时间:
2021-02-06 11:48:18
阅读次数:
0
安装Impala Impala是一个针对Apache Hadoop的开源分析数据库,可以快速返回查询响应。 按照以下步骤,通过从源码构建在集群上设置Impala。 下载最新版本。请参阅Impala下载页面以获取最新版本的链接。 检查 README.md 文件,以获得指向构建说明的指针。 请检查MD5 ...
分类:
其他好文 时间:
2021-02-06 11:41:43
阅读次数:
0