一、词频统计: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words flatmap() 3.全部转换为小写 lower() 4.去掉长度小于3的单词 filter() 5.去掉停用词 6.转换成键值对 map() 7.统计词频 reduceByKey() 二、学生课程分 ...
分类:
其他好文 时间:
2021-04-07 10:40:25
阅读次数:
0
一、词频统计: 1.读文本文件生成RDD 2.将文本分割成单词 words 3.全部转换为小写 4.去掉长度小于3的单词 5.去掉停用词 6.转换成键值对 map() 7.统计词频 reduceByKey() 二、学生课程分数 groupByKey() -- 按课程汇总全总学生和分数 1. 分解出字 ...
分类:
其他好文 时间:
2021-04-06 15:20:05
阅读次数:
0
一、词频统计: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words flatmap() lines=sc.textFile("file:///usr/local/spark/mycode/wordcount/word.txt") words = lines.flatMa ...
分类:
其他好文 时间:
2021-04-06 15:08:22
阅读次数:
0
一、filter,map,flatmap练习: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words 3.全部转换为小写 4.去掉长度小于3的单词 5.去掉停用词 二、groupByKey练习 6.练习一的生成单词键值对 7.对单词进行分组 8.查看分组结果 学生科目成绩 ...
分类:
其他好文 时间:
2021-04-06 15:04:43
阅读次数:
0
一,表格标签table 表格由<table> 标签来定义。每个表格均有若干行(由 <tr> 标签定义),每行被分割为若干单元格(由<td>标签定义)。字母 td 指表格数据(table data),即数据单元格的内容。数据单元格可以包含文本、图片、列表、段落、表单、水平线、表格等等 <!DOCTYP ...
分类:
Web程序 时间:
2021-04-06 14:50:30
阅读次数:
0
HTML(六)表格 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>TableStudy</title> </head> <body> <!--表格 table 行 tr 列 td --> <table bo ...
分类:
Web程序 时间:
2021-04-06 14:03:52
阅读次数:
0
前两天看了一个视频,介绍了 TIA Selection Tool做了选型之后,可以导入到TIA 中,避免重复组态,西门子打通了哥哥软件之间的关联。现学现用我也做了练习,现在把过程记录下来。 1.首先确认TIA里面安装了OPENNESS组件,没有安装的话,重新运行TIA的setup把这个组件勾选上,这 ...
分类:
其他好文 时间:
2021-04-05 12:46:32
阅读次数:
0
现在,你已经学会了修改文件,然后把修改提交到Git版本库,现在,再练习一次,修改readme.txt文件如下: Git is a distributed version control system. Git is free software distributed under the GPL. 然 ...
分类:
其他好文 时间:
2021-04-05 12:32:31
阅读次数:
0
基础习题 习题1 请用代码验证'name'是否在字典的键中 info = {'name': '王刚蛋', 'hobby': '铁锤', 'age': '18'} info = {'name': '王刚蛋', 'hobby': '铁锤', 'age': '18'} if info.get('name' ...
分类:
编程语言 时间:
2021-04-05 12:13:50
阅读次数:
0
ps 命令的作用是显示进程信息的; | 符号,是个管道符号,表示ps 和 grep 命令同时执行; grep 命令是查找(Global Regular Expression Print),能使用正则表达式搜索文本,然后把匹配的行显示出来; ps命令有一些参数: -e : 显示所有进程 -f : 全格 ...
分类:
其他好文 时间:
2021-04-02 13:33:41
阅读次数:
0