一、filter,map,flatmap练习: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words 3.全部转换为小写 4.去掉长度小于3的单词 5.去掉停用词 二、groupByKey练习 6.练习一的生成单词键值对 7.对单词进行分组 8.查看分组结果 学生科目成绩 ...
分类:
其他好文 时间:
2021-03-31 12:33:25
阅读次数:
0
一、filter,map,flatmap练习: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words 3.全部转换为小写 4.去掉长度小于3的单词 5.去掉停用词 6.练习一的生成单词键值对 ...
分类:
其他好文 时间:
2021-03-31 12:22:01
阅读次数:
0
一、filter,map,flatmap练习: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words 3.全部转换为小写 4.去掉长度小于3的单词 5.去掉停用词 6.练习一的生成单词键值对 最后相关文件已经保存。 ...
分类:
其他好文 时间:
2021-03-31 11:54:45
阅读次数:
0
1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words(map,flatmap) 3.全部转换为小写(lower()) 4.去掉长度小于3的单词(filter) 6.练习一的生成单词键值对(map) ...
分类:
其他好文 时间:
2021-03-31 11:48:28
阅读次数:
0
一、filter,map,flatmap练习: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words 3.全部转换为小写 4.去掉长度小于3的单词 5.去掉停用词 6.练习一的生成单词键值对 ...
分类:
其他好文 时间:
2021-03-31 11:44:46
阅读次数:
0
/* 总结:stl里数据结构,如hash(unordered_set\map),queue,deque,priority_queue,stack 主要会用以上数据结构的成员函数,empty(),count(),insert(),push(),push_back(),front(),top(),bac ...
分类:
其他好文 时间:
2021-03-30 13:58:40
阅读次数:
0
引申 1.Guava Cache和Ehcache一样也是本地缓存,虽然都是本地缓存,但是在细分领域中也还是有不同的应用场景,Guava是Google提供的一套Java工具包,而GuavaCache作为Guava的Cache部分而提供了一套非常完善的本地缓存机制。在Guava之前,JDK的Concur ...
分类:
系统相关 时间:
2021-03-30 13:27:56
阅读次数:
0
1 protoc是Protobuf编译器,可以从github上直接下载源码,下载地址https://github.com/google/protobuf/releases/tag/v3.0.2。 解压并添加到环境变量 安装扩展包 go get -u github.com/micro/go-micro ...
分类:
其他好文 时间:
2021-03-30 13:25:40
阅读次数:
0
更新多列 Updates 方法支持 struct 和 map[string]interface{} 参数。当使用 struct 更新时,默认情况下,GORM 只会更新非零值的字段 // 根据 `struct` 更新属性,只会更新非零值的字段 db.Model(&user).Updates(User{ ...
分类:
其他好文 时间:
2021-03-30 12:59:58
阅读次数:
0
1.MyJsonUtils.toJsonString 【toJsonString方法是自己定义的,详细如下】 public static String toJsonString(Object obj){ String jsonStr = null; try { jsonStr = mapper.wr ...
分类:
Web程序 时间:
2021-03-30 12:47:24
阅读次数:
0