协作:苗中峰,刘鑫成 我主要攻克排序,成哥写了文件流的使用。整合工作由我完成,成哥帮我查阅资料,避免和解决语法错误。 这次任务较作业三的变化是: *文件流读取,写入。 *单词排序(先按照频率排序,次数相同安字母顺序排序) java文件流的读取上次作业已经get,所以这个按道理来说不算问题。 而文件流
分类:
其他好文 时间:
2016-03-22 18:49:58
阅读次数:
185
刚刚接触R语言和文本分析,为了将二者结合,试着对《红楼梦》进行分析,首先对《红楼梦》进行分词处理,并统计词频,同时画出标签云。 其实文本分析还可以分析其它很多东西,我的下一步打算分析新浪微博。现在先写一个小的分析,作为学习用。 文本分析是指对文本的表示及其特征项的选取;文本分析是文本挖掘、信息检索的
分类:
其他好文 时间:
2016-03-21 18:22:35
阅读次数:
1138
1.上周任务 1000行程序完成,有关数组的训练 由于是照着一本项目书敲得,并没有什么个人体会,所以并未上传至github,倒是自己对数组的概念有了更深层次的体会。 下面是我对上次课老师对我布置项目的总结和展望!以及分项列表!要求逐项递增! 1.有关项目的设计(逐项递增) 1.词频统计。 2.+输入
分类:
其他好文 时间:
2016-03-21 00:04:58
阅读次数:
318
第一步 输入句子并全部小写。(预估30min,实际10min) 第二步 用指针定位并对比单词统计遇空格跳过(预计1h,实际1.30h) 第三部 返回统计数 结果: 学会了如何测量字符串长度,如何将字符串变小写,以及如何统计单词。 github账号: https://github.com/hjs12
分类:
其他好文 时间:
2016-03-17 12:20:20
阅读次数:
145
1:我本人自己觉得这次的作业可能难度是非常的大的,因为这种编程并不是原先程序那样的简单,这种程序还是有一定的难度的。这并不是说靠着老师上课说两句就可以真的自己开始编写这种对于我来说超级难的程序。 2:对于我来说,我的C++还是处于挂科的状态,本学期的重修还没有开始,而Java语言刚刚开始涉及一点点,
分类:
其他好文 时间:
2016-03-17 00:25:20
阅读次数:
150
准备阶段: 开发工具:VC6.0 所用语言:c++ 预计完成程序需要:好长时间 实际完成时间:12h 要求: 实现一个控制台程序,给定一段英文字符串,统计其中各个英文单词(4字符以上含4字符)的出现频率。 附加要求:读入一段文本文件,统计该文本文件中单词的频率。
分类:
其他好文 时间:
2016-03-16 18:45:35
阅读次数:
117
实现一个控制台程序,给定一段英文字符串,统计其中各个英文单词(4字符以上含4字符)的出现频率。 附加要求:读入一段文本文件,统计该文本文件中单词的频率。 github地址: 源程序 数据测试 输入 Word is case insensitive, i.e. “file”, “FILE” and “
分类:
其他好文 时间:
2016-03-16 17:08:36
阅读次数:
243
前言: 开发工具:Visual Studio 2013 开发语言:C++ 源代码管理工具:Github Github源代码网址:https://github.com/superyy/YY1/blob/master/%E8%AF%8D%E9%A2%91%E7%BB%9F%E8%AE%A1main.cp
分类:
其他好文 时间:
2016-03-15 23:30:30
阅读次数:
166
相关的类: java.util.regex.Pattern static Pattern compile(String regex) //编译模式 static Pattern compile(String regex, int flags) //编译模式并指定标志 Matcher matcher(
分类:
其他好文 时间:
2016-03-15 18:33:15
阅读次数:
143
一.作业。 对比我之前写的词频统计和linux命令词频统计“cat log.txt|tr ' ' '\n'|tr A-Z a-z|sort|uniq -c|sort |head”。(首先说明我写的词频统计是基于javaweb的,用户上传文件进行词频统计。) 1. 系统依赖。我的词频
分类:
其他好文 时间:
2016-03-14 00:07:14
阅读次数:
220