1. 准备文本文件: 从文件创建RDD lines=sc.textFile(): 筛选出含某个单词的行 lines.filter(),lambda 参数:条件表达式: 2. 生成单词的列表: 从列表创建RDD words=sc.parallelize(): 筛选出长度大于2 的单词 words.fi ...
分类:
其他好文 时间:
2021-06-07 20:04:33
阅读次数:
0
HTML 什么是HTML: Hyper Text Markup Langu(超文本标记语言) 超文本包括文本,图片, 音频,视频,动画等 目前使用的版本为HTML5,它提供了一些新的元素和一些有趣的新特性,同时也建立了一些新的规则。这些元素、特性和规则的建立,提供了许多新的网页功能,如使用网页实现动 ...
分类:
Web程序 时间:
2021-06-07 19:59:29
阅读次数:
0
读学生课程分数文件chapter4-data01.txt,创建DataFrame。 一、用DataFrame的操作完成以下数据分析要求 每个分数+5分。 总共有多少学生? 总共开设了哪些课程? 每个学生选修了多少门课? 每门课程有多少个学生选? 每门课程大于95分的学生人数? Tom选修了几门课?每 ...
分类:
数据库 时间:
2021-06-07 19:58:41
阅读次数:
0
事务是数据库的一个重要属性,有关事务的4个特性,原子性、一致性、隔离性、持久性,也就是ACID,这些属性既包含了对事务执行结果的要求,也有数据库在事务执行前后的数据状态变化的要求。 Redis可以完全保证ACID属性吗?如果保证不了,在一些场景下数据可能会出错,所以我们需要了解redis对于这些特性 ...
分类:
其他好文 时间:
2021-06-06 19:28:57
阅读次数:
0
cookie与session 由来及简介 HTTP协议四大特性 1.基于请求响应 2.基于TCP、IP作用于应用层之上 3.无连接 4.无状态 基于HTTP协议的通信无法记录客户端状态 但是现在很多软件都需要记录用户的状态 为了解决这个问题 发明了cookie session等一系列的技术 ? co ...
分类:
其他好文 时间:
2021-06-06 19:20:58
阅读次数:
0
1.安装启动检查Mysql服务。netstat -tunlp (3306) 2.spark 连接mysql驱动程序。–cp /usr/local/hive/lib/mysql-connector-java-5.1.40-bin.jar /usr/local/spark/jars 3.启动 Mysql ...
分类:
数据库 时间:
2021-06-06 19:08:48
阅读次数:
0
1.pandas df 与 spark df的相互转换 df_s=spark.createDataFrame(df_p) df_p=df_s.toPandas() 2. Spark与Pandas中DataFrame对比 http://www.lining0806.com/spark%E4%B8%8E ...
分类:
其他好文 时间:
2021-06-06 19:08:07
阅读次数:
0
1.Spark SQL出现的 原因是什么? Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个叫作Data Frame的编程抽象结构数据模型(即带有Schema信息的RDD),Spark SQL作为分布式SQL查询引擎,让用户可以通过SQL、DataFrame API和Data ...
分类:
数据库 时间:
2021-06-06 19:05:46
阅读次数:
0
LSMW: 老是摸我 这工具该退休了 ,S4下新工具强大亮相,LTMC:老唐卖钞 周日花了一天配通了LTMC的配置,周一研究了一天,周二开始导入数据: 特征及值:ZH_Characteristic.xml 分类:ZH_Class.xml 可配置物料:ZH_Material.xml VC BOM:ZH ...
分类:
其他好文 时间:
2021-06-06 18:48:16
阅读次数:
0
在今天的课程中,我们将向你介绍一些基本的概念,帮助你更容易的理解数字色彩。现在我们先来看一下色彩空间。 颜色空间定义了数字档案可用的颜色和色调范围。也许你总是这么想,但事实并非如此。色域是一个设计领域的总面具,那么理解他们是如何相互配合的吗?有哪些特性能影响我们观看图像?这个问题尤其重要。 我们需要 ...
分类:
其他好文 时间:
2021-06-05 18:23:20
阅读次数:
0