码迷,mamicode.com
首页 > 其他好文 > 详细

结对-英文词频检测程序-开发过程

时间:2017-12-15 13:29:30      阅读:138      评论:0      收藏:0      [点我收藏+]

标签:new   dwr   cep   检测   set   shm   java   value   写入文件   

 
note:没有词频排序功能。该程序用于实现统计词频功能,从文件读取内容,将统计结果输出到文件。
import java.util.*; 
import java.io.*; 
public class wordRate {
 
public static void main(String[] args) throws Exception {
 
BufferedReader infile = new BufferedReader(new FileReader("article.txt"));
String string;
String file = null;
while ((string = infile.readLine()) != null) {
file += string;
}
 
file = file.toLowerCase();// 所有字母小写化
file = file.replaceAll("[^A-Za-z]", " ");// 正则,匹配非英文字符为空格
file = file.replaceAll("\\s+", " "); // 正则,将1到多个空格匹配为一个空格
 
String words[];
words = file.split("\\s+");// 取出单词,并将单词存入数组中
 
Map hashMap = new HashMap();
for (int i = 0; i < words.length; i++) {
String key = words[i];
if (hashMap.get(key) != null) { 
int value = ((Integer) hashMap.get(key)).intValue();
value++;
hashMap.put(key, new Integer(value));
} else {
hashMap.put(key, new Integer(1));
}
}
 
Map treeMap = new TreeMap(hashMap);
Set entrySet = treeMap.entrySet();
 
// ================================modify==========================
BufferedWriter bw = new BufferedWriter(new FileWriter("result.txt"));  //实例化一个writer对象
for (Iterator iterator = entrySet.iterator(); iterator.hasNext();) { // 循环迭代
//注意:以下一行不能写成String result =String result =(String)iterator.next();
String result =iterator.next().toString();
bw.write(result); // 调用writer的write方法将得到的result写入文件
bw.newLine(); // 另起一行
bw.flush();  // 清空缓存
}
}
}

结对-英文词频检测程序-开发过程

标签:new   dwr   cep   检测   set   shm   java   value   写入文件   

原文地址:http://www.cnblogs.com/ccccryst/p/8042468.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
分享档案
周排行
mamicode.com排行更多图片
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!