本文参考https://blog.csdn.net/df0128/article/details/80953755 1.用户参数 在应用的时候使用${username}即可。用户参数相比Csv data set config的弊端在于,不适合取值范围非常大。 2.Bean Shell PreProc ...
分类:
其他好文 时间:
2021-06-08 23:13:51
阅读次数:
0
方法一: certutil -urlcache -split -f http://xx.xx.xx.xx/test.zip c:\test.zip (windows远程下载文件至本地,仅需要一个cmd执行的地方) 方法二: curl http://xx.xx.xx.xx/test.zip -o c: ...
1. 安装启动检查Mysql服务。##netstat -tunlp (3306) cd /usr/local/hive/lib ls mysql* cp mysql-connector-java-5.1.40-bin.jar /usr/local/spark/jars/ cd /usr/local/ ...
分类:
数据库 时间:
2021-06-07 20:10:49
阅读次数:
0
1. 阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系,为什么要引入Yarn和Spark。 HDFS是Hadoop体系中数据存储管理的基础,它是一个高度容错的系统,能检测和应对硬件故障,在低成本的通用硬件上运行。 HBase构建在HDFS之上 ...
分类:
其他好文 时间:
2021-06-07 20:05:58
阅读次数:
0
1. 准备文本文件: 从文件创建RDD lines=sc.textFile(): 筛选出含某个单词的行 lines.filter(),lambda 参数:条件表达式: 2. 生成单词的列表: 从列表创建RDD words=sc.parallelize(): 筛选出长度大于2 的单词 words.fi ...
分类:
其他好文 时间:
2021-06-07 20:04:33
阅读次数:
0
读学生课程分数文件chapter4-data01.txt,创建DataFrame。 一、用DataFrame的操作完成以下数据分析要求 每个分数+5分。 总共有多少学生? 总共开设了哪些课程? 每个学生选修了多少门课? 每门课程有多少个学生选? 每门课程大于95分的学生人数? Tom选修了几门课?每 ...
分类:
数据库 时间:
2021-06-07 19:58:41
阅读次数:
0
拉取redis镜像 docker pull redis 创建redis容器 docker create --name redis-node1 --net host -v /data/redis-data/node1:/data redis --cluster-enabled yes --cluste ...
分类:
其他好文 时间:
2021-06-06 19:28:17
阅读次数:
0
2021-06-06 关键字:Shell具体应用 需求:在指定目录中查找文件名包含指定字符的文件 - 支持自定义关键字查找 - 支持自定义查找路径及查找关键字 使用方式: 假设这个工具的名称为:fgtool.sh (取意 shell tool for find and grep)。 直接运行此工具, ...
分类:
系统相关 时间:
2021-06-06 19:18:00
阅读次数:
0
1.安装启动检查Mysql服务。netstat -tunlp (3306) 2.spark 连接mysql驱动程序。–cp /usr/local/hive/lib/mysql-connector-java-5.1.40-bin.jar /usr/local/spark/jars 3.启动 Mysql ...
分类:
数据库 时间:
2021-06-06 19:08:48
阅读次数:
0
1.pandas df 与 spark df的相互转换 df_s=spark.createDataFrame(df_p) df_p=df_s.toPandas() 2. Spark与Pandas中DataFrame对比 http://www.lining0806.com/spark%E4%B8%8E ...
分类:
其他好文 时间:
2021-06-06 19:08:07
阅读次数:
0