一、词频统计: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words flatmap() 3.全部转换为小写 lower() 4.去掉长度小于3的单词 filter() 5.去掉停用词 6.转换成键值对 map() 7.统计词频 reduceByKey() 二、学生课程分 ...
分类:
其他好文 时间:
2021-04-07 11:00:42
阅读次数:
0
计算机和编程语言、计算机思维方式、为什么是C、简单历史 计算机和编程语言 计算机解决问题的思想 程序是用特殊的编程语言写出来表达如何解决问题的 不是用编程语言和计算机交谈,而是描述要求它如何做事情的过程或方法。 算法 我们要让计算机做计算1,就需要这样找出计算的步骤,然后用编程语言写下来 计算机做的 ...
分类:
编程语言 时间:
2021-04-07 10:58:01
阅读次数:
0
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>12生肖相册</title> <style> html{ background: #000; height: 100%; } /*最外层容器样式*/ .wrap{ position ...
分类:
其他好文 时间:
2021-04-07 10:49:56
阅读次数:
0
一、词频统计: #1.读文本文件生成RDD lines #2.将一行一行的文本分割成单词 words flatmap() #3.全部转换为小写 lower() #4.去掉长度小于3的单词 filter() #5.去掉停用词 #6.转换成键值对 map() 7.统计词频 reduceByKey() 二 ...
分类:
其他好文 时间:
2021-04-07 10:49:31
阅读次数:
0
一、词频统计: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words flatmap() 3.全部转换为小写 lower() 4.去掉长度小于3的单词 filter() 5.去掉停用词 6.转换成键值对 map() 7.统计词频 reduceByKey() 二、学生课程分 ...
分类:
其他好文 时间:
2021-04-07 10:40:25
阅读次数:
0
包装类 java提供了8中基本数据类型的包装类,是的基本数据类的变量具有类的特征 基本数据类型、包装类、String三者之间的转换 基本数据类型 包装类 byte Byte short Short int Interger long Long float Float double Double bo ...
分类:
其他好文 时间:
2021-04-07 10:35:55
阅读次数:
0
第一part:介绍及安装 IP地址规划是网络设计中非常重要的一个环节,规划的好坏会直接影响路由协议算法的效率,包括网络性能,可扩展性等方面,在这个过程中,需要计算大量的IP地址, 包括网段,网络掩码,广播地址,子网数,IP类型等。python中使用IPy库可以高效的完成IP的规划工作。 安装:pip ...
分类:
编程语言 时间:
2021-04-07 10:34:31
阅读次数:
0
1. 2.十进制转换二进制:除二取余 二进制转换十进制:乘二取整 3. 255-0xff 127-0x7f 4. 整型 5.内存是由一个个存储单元构成, 6.sizeof 关键字 计算变量或数据类型所占的字节个数 7.const int max=10; 全局常变量,具有类型 会开辟空间 #defin ...
分类:
编程语言 时间:
2021-04-07 10:32:01
阅读次数:
0
break、continue、goto break : break在任何循环语句的主体部分,均可用 break控制循环的流程。break用于强行退出循环,不执行循环中剩余的语句。(break语句在switch语句中的使用) public class Demo04 { public static vo ...
分类:
其他好文 时间:
2021-04-07 10:29:07
阅读次数:
0
OpenAI GPT 是在 Google BERT 算法之前提出的,与 BERT 最大的区别在于,GPT 采用了传统的语言模型进行训练,即使用单词的上文预测单词,而 BERT 是同时使用上文和下文预测单词。因此,GPT 更擅长处理自然语言生成任务 (NLG),而 BERT 更擅长处理自然语言理解任务 ...
分类:
其他好文 时间:
2021-04-06 15:20:32
阅读次数:
0