这是我在《程序设计实习》课程上作的pre,目标是对C/C++中字符串的相关内容作一个尽量完整的介绍。(对于OIer可能不太实用) 课件链接: https://files.cnblogs.com/files/turboboost/slides.pdf.zip 目录截图: ...
分类:
编程语言 时间:
2021-04-09 13:08:36
阅读次数:
0
一、词频统计: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words flatmap() 3.全部转换为小写 lower() 4.去掉长度小于3的单词 filter() 5.去掉停用词 6.转换成键值对 map() 7.统计词频 reduceByKey() 二、学生课程分 ...
分类:
其他好文 时间:
2021-04-08 13:42:37
阅读次数:
0
1. 中英文平行语料预处理中文处理数据泛化,解决数据稀疏问题数字 $number日期 $date时间 $time网址等 $literal专有名词处理:如“东北大学信息学院”建议拆分为“东北大学”、“信息学院”,有助于抽取出更多翻译规则 英文大小写句尾结束符与最后单词用空格分开数据泛化处理 其他全角 ...
分类:
其他好文 时间:
2021-04-08 13:26:01
阅读次数:
0
幼儿园环境设计是建设幼儿园文化中很关键的一部分,而谈到幼儿园设计的相关内容,很多人都注重注意例如墙体的设计,教室的空间结构,走廊的布置等等,却常常忘记很多容易被忽视的细节,而这些细节对幼儿的成长发育、身心健康有着不容忽视的影响,没有经过系统化的研究与规划,没有了解幼儿自身的发展需求,很难说在幼儿园设 ...
分类:
其他好文 时间:
2021-04-08 13:14:57
阅读次数:
0
一、前言 ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS);目前我们使用CH作为实时数仓用于统计分析,在做性能优化的时候使用了 物化视图 这一特性作为优化手段,本文主要分享物化视图的特性与如何使用它来优化ClickHouse的查询性能。 二、概念 数据库中的 视图( ...
分类:
其他好文 时间:
2021-04-08 13:08:40
阅读次数:
0
最近找工作,感觉差的太多了,要学的东西还很多。希望自己可以每天都学习会,加油!如果有写的不对的欢迎大家留言分享经验哦! jvm类加载流程: Main方法中有一个类Math.class类,当加载math类的时候, 1.Windows系统下 java.exe会调用底层的jvm.dll文件创建虚拟机(由C ...
分类:
其他好文 时间:
2021-04-08 13:01:42
阅读次数:
0
一、词频统计: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words flatmap() 3.全部转换为小写 lower() 4.去掉长度小于3的单词 filter() 5.去掉停用词 6.转换成键值对 map() 7.统计词频 reduceByKey() 二、学生课程分 ...
分类:
其他好文 时间:
2021-04-07 11:00:42
阅读次数:
0
一、词频统计: #1.读文本文件生成RDD lines #2.将一行一行的文本分割成单词 words flatmap() #3.全部转换为小写 lower() #4.去掉长度小于3的单词 filter() #5.去掉停用词 #6.转换成键值对 map() 7.统计词频 reduceByKey() 二 ...
分类:
其他好文 时间:
2021-04-07 10:49:31
阅读次数:
0
一、词频统计: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words flatmap() 3.全部转换为小写 lower() 4.去掉长度小于3的单词 filter() 5.去掉停用词 6.转换成键值对 map() 7.统计词频 reduceByKey() 二、学生课程分 ...
分类:
其他好文 时间:
2021-04-07 10:40:25
阅读次数:
0
一、词频统计: 1.读文本文件生成RDD 2.将文本分割成单词 words 3.全部转换为小写 4.去掉长度小于3的单词 5.去掉停用词 6.转换成键值对 map() 7.统计词频 reduceByKey() 二、学生课程分数 groupByKey() -- 按课程汇总全总学生和分数 1. 分解出字 ...
分类:
其他好文 时间:
2021-04-06 15:20:05
阅读次数:
0