特征集分析
数据集为letter-recognition.data,一共为20000条数据,以逗号分隔,数据实例如下所示,第一列为字母标记,剩下的为不同的特征。
T,2,8,3,5,1,8,13,0,6,6,10,8,0,8,0,8
学习方法
1、读入数据,并去除分隔号2、将数据第一列作为标记,剩下的为训练数据3、初始化分类器并利用训练数据进行训练4、利用测试数据验证准确率...
分类:
编程语言 时间:
2015-04-20 15:01:11
阅读次数:
427
本人的毕设由于涉及到检索,需要使用准确率与召回率(precision-recall)指标衡量检索算法的有效性。众所周知,precision-recall曲线通常呈下降趋势,也即使用同一检索方法对不同检索用例进行检索,若检索结果的准确率越高,召回率总会反而越低。本人对这一现象表示好奇,一直想搞明白其中的道理,也在网上查过相关资料。但暂时未发现有人系统地讨论过原因,大多数都是炒冷饭式的描述:两者并无必...
分类:
其他好文 时间:
2015-04-16 09:06:41
阅读次数:
144
近期需要做一个TransferLearing的大作业,就先总结一下自己学习AdaBoost的一些思考
一直以来人们都想通过对分类器分错的样本构建单独的分类器来增加分类准确率,所以AdaBoost出现以前就有了boostrapping方法和bagging方法
AdaBoost历史:
1)bootstrapping方法的主要过程
主要步骤:
i)重...
分类:
其他好文 时间:
2015-04-15 13:42:37
阅读次数:
360
2.4 评估查准率(precision)和召回率(recall) 我们可以从更广义的角度去看待推荐问题:它并不是严格的要去估计偏好指数来提供推荐结果,也不总是要向用户提供准确的偏好指数的值。很多时候,我们只需从好到坏列出推荐排序,事实上,有些时候我们只需列出很少一部分排名考前的就可以了。 这样来看,...
分类:
其他好文 时间:
2015-04-10 09:29:24
阅读次数:
179
前4天,通过购物车购买
precision:0.0153313777615
recall:0.177594903106
f1:0.0282260616417
前4天,通过收藏夹购买
precision:0.00326368668608
recall:0.0270772498009
f1:0.00582524271845
前4天 , 通过购物车&收藏夹购买
precision:...
分类:
其他好文 时间:
2015-04-05 10:34:39
阅读次数:
132
准确率和召回率是数据挖掘中预测,互联网中得搜索引擎等经常涉及的两个概念和指标。准确率:又称“精度”,“正确率”召回率:又称“查全率”以检索为例,可以把搜索情况用下图表示:相关不相关检索到AB未检索到CDA:检索到的,相关的B:检索到的,但是不相关的C:未检索到的,但却是相关的D:未检索到的,也不相关...
分类:
其他好文 时间:
2015-04-01 19:16:24
阅读次数:
1055
准确率和召回率是数据挖掘中预测,互联网中得搜索引擎等经常涉及的两个概念和指标。准确率:又称“精度”,“正确率”召回率:又称“查全率”以检索为例,可以把搜索情况用下图表示:相关不相关检索到AB未检索到CDA:检索到的,相关的B:检索到的,但是不相关的C:未检索到的,但却是相关的D:未检索到的,也不相关...
分类:
其他好文 时间:
2015-04-01 17:25:27
阅读次数:
174
原文:http://blog.sina.com.cn/s/blog_57a1cae80101bit5.html举例说明 svmtrain -s 0 -?c 1000 -t 1 -g 1 -r 1 -d 3 data_file 训练一个由多项式核(u'v+1)^3和C=1000组成的分类器。 ...
分类:
其他好文 时间:
2015-03-29 20:44:09
阅读次数:
298
今天中邪了, 觉得看看bloom filter。 看看海量数据处理的经典算法。
这是1970年提出来。 是用于检测一个元素是不是一个集合的成员。 如果检测结果为True, 则该元素不一定在该集合中。 如果检测结果为False, 表明该元素一定在这个集合中。 这说明bloom filter 具有 100%的召回率。 每个检测请求返回的结果只有两种, 也就是“在集合内(可能错误)” 和 “绝对不...
分类:
其他好文 时间:
2015-03-20 18:47:25
阅读次数:
163
3月6-8日,2015广州国际旅游展览会在羊城中国进出口商品交易会展览馆(琶洲展馆)
C 区盛大开幕,北京文通科技有限公司(展位号4B015)的旅行社护照录入系统将参展,该系统几秒钟就能完成护照信息识别与录入,准确率高,还可以直接导出EXCEL表格,能大大减轻旅行社工作量,提高旅行社的工作效率。真的这么神奇?那就欢迎您莅临文通展位亲眼见证吧。...
分类:
其他好文 时间:
2015-03-06 17:13:46
阅读次数:
198