改善特征提取往往可以对分类的accuracy(和precision和召回率)有显著的正面影响。在本文中,我将评估word_feats的两项修改特征提取的方法:
过滤停用词 包含二元语法搭配
为了有效地做到这一点,我们将修改前面的代码,这样我们就可以使用任意的特征提取函数,它接收一个文件中的词,并返回特征字典。和以前一样,我们将使用这些特征来训练朴素贝叶斯分类器。
...
分类:
其他好文 时间:
2014-07-19 11:22:04
阅读次数:
593
Why Hadoop2? 自从Hadoop2出现之后,其迅速取代了Hadoop1的地位,并丰富了Hadoop的应用场景。如果现在有公司使用Hadoop的话,往往直接采用Hadoop2了。
Hadoop2能被如此广泛的使用,肯定有其自身的优势,本文将对其进行梳理...
分类:
其他好文 时间:
2014-07-19 12:01:58
阅读次数:
179
POJ 1936 All in All(串)
水一个。。。...
分类:
其他好文 时间:
2014-07-19 11:33:04
阅读次数:
120
Problem Description
Speakless很早就想出国,现在他已经考完了所有需要的考试,准备了所有要准备的材料,于是,便需要去申请学校了。要申请国外的任何大学,你都要交纳一定的申请费用,这可是很惊人的。Speakless没有多少钱,总共只攒了n万美元。他将在m个学校中选择若干的(当然要在他的经济承受范围内)。每个学校都有不同的申请费用a(万美元),并且Speakless估计了...
分类:
其他好文 时间:
2014-07-19 12:09:44
阅读次数:
225
1、意义
开发项目中,前台的页面要发请求到服务器,服务器响应请求返回数据到前台,这段时间,有可能因为返回的数据量较大导致前台页面出现短暂性的等待,此时如果用户因不知情而乱点击有可能造成逻辑混乱,所以此时需要在加载数据中将前台进行提示在加载数据中,利用jquery的遮罩组件可以完成这个功能需求。
2、实现步骤
(1)、下载showLoading.css
jq...
分类:
Web程序 时间:
2014-07-19 11:22:04
阅读次数:
163
在C++中,实现语言时以及编译器处理时,他们做了什么,而对我们使用者来说,其又为我们使用提供了什么。static member function和nostatic member function在内存中都表现为函数,可是为什么static member function可以通过一般的函数指针来使用,可以作为callback。nostaitc member function,编译器到底对他们做了什么,我们是否可能不通过object来调用它们?...
分类:
其他好文 时间:
2014-07-19 11:21:04
阅读次数:
202
题目:poj1125Stockbroker Grapevine
题意:此题题意远比题目难
首先,题目可能有多组测试数据,每个测试数据的第一行为经纪人数量N(当N=0时,输入数据结束),然后接下来N行描述第i(1
分析:说的很清楚了,最短路算法基本都能水过,可以选熟悉的用
强调:floyd算法用前一定初始化为INF,否则会很惨。
代码:
#include ...
分类:
其他好文 时间:
2014-07-19 11:33:04
阅读次数:
221
广度优先搜索(BFS)算法
宽度优先搜索算法(又称广度优先搜索)是最简便的图的搜索算法之一,这一算法也是很多重要的图的算法的原型。Dijkstra单源最短路径算法和Prim最小生成树算法都采用了和宽度优先搜索类似的思想。
已知图G=(V,E)和一个源顶点s,宽度优先搜索以一种系统的方式探寻G的边,从而“发现”s所能到达的所有顶点,并计算s到所有这些顶点的距离(最少边数),该算法同时能生...
分类:
其他好文 时间:
2014-07-19 11:32:04
阅读次数:
535
进制转换
Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)
Total Submission(s): 24096 Accepted Submission(s): 13492
Problem Description
输入一个十进制数N,将它转换成R进制数输出。
...
分类:
其他好文 时间:
2014-07-19 11:21:03
阅读次数:
194
http://acm.hdu.edu.cn/showproblem.php?pid=1050
Moving Tables
Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)
Total Submission(s): 18850 Accepted Submission(...
分类:
其他好文 时间:
2014-07-19 11:32:03
阅读次数:
252
# -*- coding: utf-8 -*-
#code:myhaspl@myhaspl.com
#归一化块滤波
import cv2
import numpy as np
fn="test3.jpg"
myimg=cv2.imread(fn)
img=cv2.cvtColor(myimg,cv2.COLOR_BGR2GRAY)
#加上高斯噪声,可以参考以前博文中的内容
......
....
分类:
编程语言 时间:
2014-07-19 12:01:38
阅读次数:
362
转载请表明出处:http://blog.csdn.net/lmj623565791/article/details/37936275
1、概述
众所周知,Activity在不明确指定屏幕方向和configChanges时,当用户旋转屏幕会重新启动。当然了,应对这种情况,Android给出了几种方案:
a、如果是少量数据,可以通过onSaveInstanceState()和onRestoreI...
分类:
移动开发 时间:
2014-07-19 11:36:03
阅读次数:
272
滑雪
Time Limit: 1000MS
Memory Limit: 65536K
Total Submissions: 74996
Accepted: 27818
Description
Michael喜欢滑雪百这并不奇怪, 因为滑雪的确很刺激。可是为了获得速度,滑的区域必须向下倾斜,而且当你滑到坡底,你不得不再次走上坡或...
分类:
其他好文 时间:
2014-07-19 11:22:54
阅读次数:
182
Antenna Placement
Time Limit: 1000MS
Memory Limit: 65536K
Total Submissions: 6438
Accepted: 3176
看了别人的题解才过的。。。 渣啊。。
最主要的是构图
城市才是要构造的二分图的顶点!
构造方法如下:
例如输入:
*o...
分类:
其他好文 时间:
2014-07-19 11:11:54
阅读次数:
237
ListView 实现带有Filpper效果的左右滑动删除 Item 的实现最主要的方法还是 对 Listview 的继承重写 。然后是在删除过程中添加 TranslateAnimation 滑动事件。
public class FilpperActivity extends Activity {
private FilpperListvew flipperListView;...
分类:
其他好文 时间:
2014-07-19 11:48:54
阅读次数:
247
当你的分类模型有数百个或数千个特征,由于是文本分类的情况下,许多(如果不是大多数)的特点是低信息量的,这是一个不错的选择。这些特征对所有类都是通用的,因此在分类过程中作出很小贡献。个别是无害的,但汇总的话,低信息量的特征会降低性能。
通过消除噪声数据给你的模型清晰度,这样就去除了低信息量特征。它可以把你从过拟合和维数灾难中救出来。当你只使用更高的信息特征,可以提高性能,同时也降低了模型的大小...
分类:
其他好文 时间:
2014-07-19 11:22:54
阅读次数:
507