大数据开发专业需要学习的内容包括三大部分,分别是大数据基础知识、大数据平台知识、大数据场景知识。大数据基础知识:有三个主要部分,分别是数学、统计学和计算机等学科。大数据基础知识往往决定了开发人员未来的成长高度,所以要重视基础知识的学习。大数据平台知识:是大数据开发的基础,在学习期间,往往以搭建Hadoop、Spark平台为主,一方面Hadoop对机器的硬件要求不高,另一方面Hadoop的使用也非常
分类:
其他好文 时间:
2019-07-07 12:42:40
阅读次数:
88
hive中order by、distribute by、sort by和cluster by的区别和联系 order by order by 会对数据进行全局排序,和oracle和mysql等数据库中的order by 效果一样,它只在一个reduce中进行所以数据量特别大的时候效率非常低。 而且当 ...
分类:
其他好文 时间:
2019-07-05 20:56:06
阅读次数:
82
nginx是一款自由的、开源的、高性能的HTTP服务器和反向代理服务器,作为HTTP服务器的后起之秀,相比较于web服务器软件老大哥Apache有着很大的改进地方,主要在性能方面NGINX占用的系统资源更少,支持更多的并发连接数(特别是在静态小文件场景下),达到更高的访问效率。在功能上NGINX不但是个优秀的web服务器软件,还具有反向代理负载均衡,相当于LVS,Haproxy。缓存服务器相当于S
分类:
其他好文 时间:
2019-07-03 16:46:28
阅读次数:
129
本文仅是自己看书、学习过程中的个人总结,刚接触流式,视野面比较窄,不喜勿喷,欢迎评论交流。 1、为什么是流式? 为什么是流式而不是流式系统这样的词语?流式系统在我的印象中是相对批处理系统而言的,用来处理流数据,实现数据处理功能的一个系统,而流式一词提醒我要以数据产生的方式去看待数据和以及处理过程,即 ...
分类:
其他好文 时间:
2019-07-03 00:21:41
阅读次数:
73
实际生产环境中,大多系统都是红帽系列,那么如何使用二进制文件方式安装kubernetes集群,跟我一步步学习在centos系统上部署kubernetes集群!
分类:
Web程序 时间:
2019-07-01 14:34:07
阅读次数:
134
一、准备两台虚拟机并安装centos7.x版本系统 二、配置zabbix_server 1、http install: #安装各类软件支持库 yum install apr-devel apr-util-devel gcc c ncurses-devel cmake libaio bison gcc ...
分类:
其他好文 时间:
2019-07-01 14:03:33
阅读次数:
110
man 功能描述:获得帮助信息 如:man ls 查看ls命令的帮助信息 man services 查看配置文件services的帮助信息 1,命令的帮助?5,配置文件的帮助 whatis 列出命令的简短帮助信息 apropos 查看配置文件的简短帮助信息 --help 查看命令选项的帮助信息 he ...
分类:
系统相关 时间:
2019-07-01 01:16:16
阅读次数:
140
参考地址 https://blog.csdn.net/felix_yujing/article/details/52385890 一、需要安装的包 1. 安装 openssl-1.0.2 (Http2.0需要用到) 2. 安装 apr 3. 安装 apr-util 4. 安装 tomcat-nati ...
分类:
其他好文 时间:
2019-06-30 22:03:05
阅读次数:
163
1.apache2.4.39编译安装选项./configure--prefix=/usr/local/apache24--sysconf=/etc/httpd24--enable-so\--enable-ssl--enable-rewrite--with-zlib--with-pcre--with-apr=/usr/local/apr\--with-apr-util=/usr/local/apr-
分类:
Web程序 时间:
2019-06-28 10:27:46
阅读次数:
200
第1章 大数据概述本章将从故事说起,让大家明白大数据是与我们的生活息息相关的,并不是遥不可及的,还会介绍大数据的特性,以及大数据对我们带来的技术变革,大数据处理过程中涉及到的技术以及大数据典型应用。第2章 初识Hadoop本章节将带领大家认识Hadoop以及Hadoop生态系统、Hadoop的发展史 ...
分类:
其他好文 时间:
2019-06-28 01:04:10
阅读次数:
139