这是软件工程管理课第一次作业,也是我的第一篇随笔。 这篇随笔分为四个部分:1.自我介绍。 2.对这门课的期待。 3.第一周工作统计。 4.第一个小项目(词频统计与四则运算选其一)。 一、自我介绍 我叫夏一鸣,是东北师范大学计算机科学与信息技术学院,计算机应用技术专业的研一学生。本科也是东北师大的,专
分类:
其他好文 时间:
2016-03-08 23:44:53
阅读次数:
294
这是一个简单的词频统计系统,用javaWeb编写的。涉及到java的文件上传,EChart等技术。
分类:
其他好文 时间:
2016-03-08 00:34:46
阅读次数:
200
字典树又叫trie树,利用字符串的公共前缀来降低查询时间的开销,以及字符串的存储开销。所以经常被搜索引擎系统用于文本词频统计。 字典树的数据结构 #define MAX 26 typedef struct Tree { int count; //用来标记该节点是个可以形成一个单词,如果count!=
分类:
其他好文 时间:
2016-01-30 02:04:35
阅读次数:
172
一、只用2GB内存在20亿个整数(32位)中找到出现次数最多的数 解题思路: 想要在很多整数中找到出现次数最多的数,通常的做法是使用哈希表对出现的每一个数做词频统计,哈希表的key是某一个整数,value是这个数出现的次数。就本题来说,一共有20亿个数,哪怕只是一个数出现了20亿次,用32位的整数也...
分类:
编程语言 时间:
2016-01-26 21:47:36
阅读次数:
249
importturtle##全局变量###词频排列显示个数count=10#单词频率数组-作为y轴数据data=[]#单词数组-作为x轴数据words=[]#y轴显示放大倍数-可以根据词频数量进行调节yScale=6#x轴显示放大倍数-可以根据count数量进行调节xScale=30########...
分类:
其他好文 时间:
2015-12-06 22:38:22
阅读次数:
273
Tire树,又叫字典树,主要是用来查找单词,词频统计的.老规矩,直接上代码.package tireTree;public class TireTree { TireNode root; public TireTree(TireNode root) { this.root = root; } pr....
分类:
编程语言 时间:
2015-11-15 06:08:27
阅读次数:
1011
一、定义字典树又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来节约存储空间,最大限度地减少无谓的字符串比较,查询效率比哈希表高。字典树与字典很相似...
分类:
编程语言 时间:
2015-10-17 17:33:18
阅读次数:
217
字典树 又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。(From baik.....
分类:
其他好文 时间:
2015-10-14 00:09:03
阅读次数:
266
1.词频统计sed -e s/'[[:punct:]]'/' '/g -e s/'[[:digit:]]'/' '/g $filename| tr [A-Z] [a-z] | tr '\n' ' '| tr ' ' '\n' | sed '/^$/d' >>newfilename#干掉文本中的标点和...
分类:
系统相关 时间:
2015-09-29 14:24:30
阅读次数:
368
Trie树结构Trie树是一种树形数据结构,又称为单词查找树、字典树,是一种用于快速检索的多叉树结构。典型应用是统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的主要设计思想是空间换时间,利用字符串的公共前缀来降低查询时间的开销。它的优点是可以最大限度的减少无谓...
分类:
其他好文 时间:
2015-09-17 00:59:50
阅读次数:
154