读文本文件生成RDD lines 将一行一行的文本分割成单词 words flatmap() 全部转换为小写 lower() 去掉长度小于3的单词 filter() 去掉停用词 转换成键值对 map() 统计词频 reduceByKey() 按字母顺序排序 sortBy(f) 按词频排序 sortB ...
分类:
其他好文 时间:
2021-04-21 12:03:05
阅读次数:
0
Spring-拦截器学习 拦截器概述 SpringMVC的处理器拦截器类似于Servlet开发中的过滤器Filter,用于对处理器进行预处理和后处理。开发者可以自己定义一些拦截器来实现特定的功能。 **过滤器与拦截器的区别:**拦截器是AOP思想的具体应用。 过滤器 servlet规范中的一部分,任 ...
分类:
编程语言 时间:
2021-04-20 15:41:50
阅读次数:
0
一、词频统计: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words flatmap() 3.全部转换为小写 lower() 4.去掉长度小于3的单词 filter() 5.去掉停用词 6.转换成键值对 map() 7.统计词频 reduceByKey() 8.按字母顺序 ...
分类:
其他好文 时间:
2021-04-20 15:35:56
阅读次数:
0
一、词频统计: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words flatmap() 3.全部转换为小写 lower() 4.去掉长度小于3的单词 filter() 5.去掉停用词 6.转换成键值对 map() 7.统计词频 reduceByKey() 8.按字母顺序 ...
分类:
其他好文 时间:
2021-04-20 15:35:16
阅读次数:
0
1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words flatmap() 3.全部转换为小写 lower() 4.去掉长度小于3的单词 filter() 5.去掉停用词 6.转换成键值对 map() 7.统计词频 reduceByKey() 8.按字母顺序排序 sortB ...
分类:
其他好文 时间:
2021-04-20 15:17:39
阅读次数:
0
Redis基础 NoSQL 学名(not only sql) 特点: 存储结构与MySQL这一种关系型数据库完全不同,NoSQL存储的是key-value形式的数据。 NoSQL有很多产品,都有自己的api和语法,以及业务场景。 产品种类: Mongodb Redis Hbase hadoop No ...
分类:
其他好文 时间:
2021-04-19 14:35:28
阅读次数:
0
数据库的分类 2.2.1关系型数据库(RDBMS:relative database manager system) 特点: (1)表与表之间有关系 (2)有行有列(和Excel类似) (3)是通过SQL语句去操作数据库 比较有名代表: MySQL:免费,开源 Oracle:甲骨文,收费,大型公司, ...
分类:
数据库 时间:
2021-04-16 11:47:17
阅读次数:
0
可参考原作者:https://blog.csdn.net/a5671667/article/details/101078681?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522161841235716780269888983%2522% ...
分类:
其他好文 时间:
2021-04-15 12:39:26
阅读次数:
0
一.排序: 1.slice切片( ::-1) 2.reversed( ) 3.sorted( ,reverse=True)) 字母数字不可同时存在。默认为False升序,True降序。 4.filter(function,iterable) 二.常用 1.sum() 2.max() 3.min() ...
分类:
编程语言 时间:
2021-04-15 11:57:56
阅读次数:
0
ES2019 中对 Javascript 的新增和改进 1、 Optional Catch Binding - 可选的异常捕获绑定 以往的异常捕获语句,无论你是否用到,都需要在 catch 后面需要带上 error 参数,有代码洁癖的一定难以忍受,新的接口规范支持在不需要的时候不用带了 原来的方式 ...
分类:
编程语言 时间:
2021-04-13 12:33:13
阅读次数:
0