一. 使用的开源库 爬虫:https://github.com/code4craft/webmagic.git 分词:https://github.com/ysc/word.git 本项目:https://github.com/umbrellary/beatles.git 二. 操作过程 进行编译 ...
分类:
Web程序 时间:
2016-05-08 16:47:37
阅读次数:
497
字典树(trie树) (图f) 字典树是一种以树形结构保存大量字符串。以便于字符串的统计和查找,经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来节约存储空间,最大限度地减少无谓的字符串比较,查询效率比哈希表高。具有以下特点(图f):(1)根节点为空;(2)除根节点外,每个节点包 ...
分类:
其他好文 时间:
2016-04-18 11:55:26
阅读次数:
170
第四周软件项目管理作业 1.Fantacy小组站立会议 周五上课之后3:00到3:30,我们4位开了站立会议,主要内容: 首先询问前一周大家所学和所做的内容,之后确定各位本周的任务,准备alpha版本的发布。 杨若鹏:词频统计核心代码实现与下载模块实现 郭又铭:上传模块实现 何美琪:参考java书籍 ...
分类:
其他好文 时间:
2016-03-31 01:38:25
阅读次数:
118
[必做 2] 读取小文本文件A_Tale_of_Two_Cities.txt 或者 大文本文件Gone_with_the_wind.txt,统计某一指定单词在该文本文件中出现的频率。 命令行格式: 提示符> Myapp.exe -f filename.txt -w word (PS:C++ 程序,J ...
分类:
其他好文 时间:
2016-03-30 08:18:46
阅读次数:
174
目的与要求 代码复审练习 结对练习 编写单元测试 基于上一个结对项目的结果,读取小文本文件A_Tale_of_Two_Cities.txt 或者 大文本文件Gone_with_the_wind.txt,统计某一指定单词在该文本文件中出现的频率。 命令行格式: 提示符> Myapp.exe -f fi ...
分类:
其他好文 时间:
2016-03-30 00:04:43
阅读次数:
207
作业要求: [必做 2] 读取小文本文件A_Tale_of_Two_Cities.txt 或者 大文本文件Gone_with_the_wind.txt,统计某一指定单词在该文本文件中出现的频率。 结对对象:袁宇鹏(http://www.cnblogs.com/yuanyupeng) Github链接 ...
分类:
其他好文 时间:
2016-03-30 00:00:35
阅读次数:
378
结对对象:石莉静 博客地址:http://www.cnblogs.com/shilijing/ Github地址:https://github.com/cchenhui/-4 贡献比例:1:1 结对编程照片: [必做 2] 读取小文本文件A_Tale_of_Two_Cities.txt 或者 大文本 ...
分类:
其他好文 时间:
2016-03-29 23:41:35
阅读次数:
198
[必做 2] 读取小文本文件A_Tale_of_Two_Cities.txt 或者 大文本文件Gone_with_the_wind.txt,统计某一指定单词在该文本文件中出现的频率。 命令行格式: 提示符> Myapp.exe -f filename.txt -w word (PS:C++ 程序,J ...
分类:
其他好文 时间:
2016-03-29 23:39:00
阅读次数:
173
结对对象:季天梦 博客地址:http://www.cnblogs.com/jitianmeng/ github链接:https://github.com/liuyutianlyt/EX_4.md 比例:1:1 要求 [必做 2] 读取小文本文件A_Tale_of_Two_Cities.txt 或者 ...
分类:
编程语言 时间:
2016-03-29 21:05:17
阅读次数:
215