码迷,mamicode.com
首页 >  
搜索关键字:spark shell 词频统计    ( 35745个结果
RDD练习:词频统计
一、词频统计: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words flatmap() lines=sc.textFile("file:///usr/local/spark/mycode/wordcount/word.txt") words = lines.flatMa ...
分类:其他好文   时间:2021-04-06 15:08:22    阅读次数:0
05 RDD练习:词频统计
一、filter,map,flatmap练习: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words 3.全部转换为小写 4.去掉长度小于3的单词 5.去掉停用词 二、groupByKey练习 6.练习一的生成单词键值对 7.对单词进行分组 8.查看分组结果 学生科目成绩 ...
分类:其他好文   时间:2021-04-06 15:04:43    阅读次数:0
PySpark第一篇.PySpark简介
1.Spark概述 Apache Spark是一个闪电般快速的实时处理框架。它进行内存计算以实时分析数据。由于 Apache Hadoop MapReduce 仅执行批处理并且缺乏实时处理功能,因此它开始出现。因此,引入了Apache Spark,因为它可以实时执行流处理,也可以处理批处理。 除了实 ...
分类:其他好文   时间:2021-04-06 15:01:09    阅读次数:0
spark中的持久化(cache()、persist()、checkpoint())
RDD持久化级别 | 持久化级别 | 含义解释 | | | | | MEMORY_ONLY | 使用未序列化的Java对象格式,将数据保存在内存中。如果内存不够存放所有的数据,则数据可能就不会进行持久化。那么下次对这个RDD执行算子操作时,那些没有被持久化的数据,需要从源头处重新计算一遍。这是默认的 ...
分类:系统相关   时间:2021-04-06 14:53:55    阅读次数:0
Electron常用总结
1. 避坑总结 版本10以前默认开启webPreferences的enableRemoteModule,版本10以后需要手动开启,默认为false 2. 常用模块 remote remote 模块为渲染进程(web页面)和主进程通信(IPC)提供了一种简单方法 shell shell 模块提供与桌面 ...
分类:其他好文   时间:2021-04-06 14:21:16    阅读次数:0
Shell编程知识2
Linux下su与su -命令的本质区别 su命令和su -命令最大的本质区别就是: 前者只是切换了root身份,但Shell环境仍然是普通用户的Shell; 而后者连用户和Shell环境一起切换成root身份了。只有切换了Shell环境才不会出现PATH环境变量错误。su切换成root用户以后,p ...
分类:系统相关   时间:2021-04-06 14:01:20    阅读次数:0
ubuntu16.04安装zsh
1 安装 sudo apt-get install zsh 2 修改默认shell chsh -s /bin/zsh 3 配置passwd sudo vim /etc/passwd root:x:0:0:root:/root:/bin/bash改成root:x:0:0:root:/root:/bin ...
分类:系统相关   时间:2021-04-05 12:42:45    阅读次数:0
大数据总结
学习过得技术 HDFS YARN MR HIVE HBASE SPARK SPARK(sparkCore、sparkSql、sparkStreaming) HDFS 数据库管理、 存磁盘 Ha模式(在zookeeper之上) 联邦机制(把大象装进冰箱) split切片 Hbase 列式数据库 半结构 ...
分类:其他好文   时间:2021-04-05 12:37:34    阅读次数:0
HDFS回收站
hdfs会为每一个用户创建一个回收站目录:/usr用户名/.Trash/,每一个用户在Shell命令行删除的文件/目录,会进入到对应的回收站目录中,在回收站中的数据都有一个生命周期,也就是说当回收站中的文件/目录在一段时间之内没有被用户恢复的话,HDFS就会自动将这个文件/目录彻底删除。 默认情况下 ...
分类:其他好文   时间:2021-04-05 12:30:22    阅读次数:0
linux第一次部署gin项目记录
windows开发gin项目,最后生成linux 可以直接运行的文件 1.vs code 终端运行: PS L:\ginProject>set GOARCH=amd64PS L:\ginProject> set GOOS=linuxPS L:\ginProject> go build -o test ...
分类:系统相关   时间:2021-04-05 12:11:44    阅读次数:0
35745条   上一页 1 ... 24 25 26 27 28 ... 3575 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!