File f=new File(path); Map<String,Integer>map=new HashMap<>(); Version matchVersion = Version.LUCENE_31; Analyzer analyzer = new StopAnalyzer(matchVer ...
分类:
编程语言 时间:
2017-05-15 15:05:51
阅读次数:
239
1、列表,字典,集合解析 2、为元组命名 执行结果如图 3、统计序列中元素出现频度 结果如图 词频统计 4、根据字典中值的大小,对字典中的项进行排序 结果如图 5、如何快速找到多个字典里面的公共键 结果如图 第二种方法 6,、如何让字典有序 结果如图 7、拆分含有多个分隔符的字符串 第二种方法 结果 ...
分类:
编程语言 时间:
2017-04-19 00:20:41
阅读次数:
290
有一段时间的软件了,感谢大家一直关注和支持! 下载地址:https://pan.baidu.com/s/1slxvTCx 最新版6.0 需要.net framework支持 主要功能: 1、分词 2、词频统计 3、词性识别 3、聚类 4、社会网络语义网络 5、情感计算 ........ 及众多的文本 ...
分类:
其他好文 时间:
2017-03-14 13:32:04
阅读次数:
536
#include <stdio.h> #include <stdlib.h> #include <string.h> #define MAX 27 //26个字母和'//字典树的结构体定义typedef struct Word { Word *next[MAX];//数组下标0-25代表小写字母,2 ...
分类:
其他好文 时间:
2016-12-27 11:41:36
阅读次数:
242
最近在忙考试的事情,没什么时间敲代码,一个月也没几天看代码,最近看到可视化的词云,看到网上也很多这样的工具, 但是都不怎么完美,有些不支持中文,有的中文词频统计得莫名其妙、有的不支持自定义形状、所有的都不能自定义颜色 于是网上找了一下,决定用python绘制词云,主要用到的是wordcloud库,安 ...
分类:
编程语言 时间:
2016-12-04 00:50:54
阅读次数:
588
项目:词频统计 项目类型:个人项目 项目完成情况:未完成 项目日期:2016.11.23 项目改进:正在改进 项目:四则运算 项目类型:结对项目 项目完成情况:未完成 项目日期:2016.11.23 项目改进:正在改进 PSP: 周进度: 代码累积量柱状图: 博客字数累积量柱状图: 饼状图: ...
分类:
其他好文 时间:
2016-12-01 22:20:36
阅读次数:
190
项目:词频统计 项目类型:个人项目 项目完成情况:已完成(暂无改动) 项目日期:- 项目改进:- 项目:四则运算 项目类型:结对项目 项目完成情况:已完成(暂无改动) 项目日期:- 项目改进:- 项目:“天天向上”连连看 项目类型:团队项目 项目完成情况:功能完善 项目日期:2016.11.26-2 ...
分类:
其他好文 时间:
2016-12-01 02:05:21
阅读次数:
248
通常我们做英文词频统计的时候,我们可能会采用单词树,或者map等等。 但是,在进行中文的词频统计的时候,中文之间没有空格和符号,不像在英 文词频统计一样,英文之间是有空格和符号的。所以,相对于英文来说,中 文词频统计比较难。主要是不好提取中文字通常我们在提取中文时候会进行 划分,通过汉字的关联等等来 ...
分类:
其他好文 时间:
2016-11-27 19:27:02
阅读次数:
230
项目:词频统计 项目类型:个人项目 项目完成情况:未完成 项目日期:2016.11.23 项目改进:正在改进 项目:四则运算 项目类型:结对项目 项目完成情况:未完成 项目日期:2016.11.23 项目改进:正在改进 PSP: 周进度: 代码累积量柱状图: 博客字数累积量柱状图: 饼状图: ...
分类:
其他好文 时间:
2016-11-24 07:52:58
阅读次数:
150
下面是我看见别人做的词频统计软件,我觉得做的很好,比我做的强很多,不仅仅有英文的统计,字符统计,汉字的统计,而且还有相应的比例。但是要想知道某一个单词出现的个数是不能显现出来的。对于想做某一篇文章出现的字数,或者字符的个数,使用这个软件直接明了,查看数据还是不错的,给大家分享,大家有时间可以去看看, ...
分类:
其他好文 时间:
2016-11-17 00:33:09
阅读次数:
283