学习大数据需要的基础1、javaSE、EE(SSM)90%的大数据框架都是Java写的2、MySQLSQLonHadoop3、Linux大数据的框架安装在Linux操作系统上需要学什么.在入门学习大数据的过程当中有遇见学习,行业,缺乏系统学习路线,系统学习规划,欢迎你加入我的大数据学习交流裙:251956502,裙文件有我这几年整理的大数据学习手册,开发工具,PDF文档书籍,你可以自行下载。大数据
分类:
其他好文 时间:
2019-12-30 00:04:32
阅读次数:
102
Spark MLlib机器学习算法、源码及实战讲解pdf电子版下载 链接:https://pan.baidu.com/s/1ruX9inG5ttOe_5lhpK_LQg 提取码:idcb 《Spark MLlib机器学习:算法、源码及实战详解》书中讲解由浅入深慢慢深入,解析讲解了MLlib的底层原理 ...
分类:
编程语言 时间:
2019-12-29 18:11:23
阅读次数:
258
python2,python3两个kernel共存 引入:事情的起因是公司需要用pyspark,而将pyspark封装到jupyter中。而公司spark集群上都是py2的解释器。因此jupyter上运行时需要使用py2的kernel 环境:使用conda3自带的jupyter,已装py3解释器,非 ...
分类:
其他好文 时间:
2019-12-29 12:57:28
阅读次数:
73
下载Hadoop安装包 下载Hadoop安装包 登录 https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/ 镜像站,找到我们要安装的版本,点击进去复制下载链接 安装Hadoop时要注意版本与后续安装的HBase、Spark等相关组件的兼 ...
分类:
其他好文 时间:
2019-12-28 23:14:30
阅读次数:
162
1. 获取spark下载链接 1. 获取spark下载链接 登录官网:http://spark.apache.org/downloads.html 选择要下载的版本 2. 执行命令下载并安装 cd /usr/local/src/ wget http://mirrors.tuna.tsinghua.e ...
分类:
其他好文 时间:
2019-12-28 22:50:51
阅读次数:
79
1. 获取安装包下载链接 1. 获取安装包下载链接 访问https://kafka.apache.org/downloads 找到kafka对应版本 需要与服务器安装的scala版本一致(运行spark-shell可以看到当前安装的scala版本) 2. 执行命令下载并安装 cd /usr/loca ...
分类:
其他好文 时间:
2019-12-28 22:47:01
阅读次数:
89
本文始发于个人公众号:TechFlow 近两年AI成了最火热领域的代名词,各大高校纷纷推出了人工智能专业。但其实,人工智能也好,还是前两年的深度学习或者是机器学习也罢,都离不开底层的数据支持。对于动辄数以TB记级别的数据,显然常规的数据库是满足不了要求的。今天,我们就来看看大数据时代的幕后英雄——H ...
分类:
其他好文 时间:
2019-12-28 22:38:52
阅读次数:
106
本文在Windows端实现了WordCount功能
分类:
其他好文 时间:
2019-12-27 19:40:55
阅读次数:
100
Spark Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同 ...
分类:
其他好文 时间:
2019-12-27 00:11:15
阅读次数:
106
spark参数介绍 https://endymecy.gitbooks.io/spark-config-and-tuning/content/config.html ...
分类:
其他好文 时间:
2019-12-26 14:53:55
阅读次数:
65