之前写过一篇blog叫做机器学习实战笔记之非均衡分类问题:http://blog.csdn.net/lu597203933/article/details/38666699其中对Precision和Recall及ROC都有所讲解,其中区别在于Precision,Recall, F-score,
MAP主要用于信息检索,而ROC曲线及其度量指标AUC主要用于分类和识别,ROC的详细介绍见上面的b...
分类:
其他好文 时间:
2014-12-08 14:01:53
阅读次数:
448
??
一:
1
搜索引擎的历史
萌芽:Archie、Gopher
Archie:搜索FTP服务器上的文件
Gopher:索引网页
2
起步:Robot(网络机器人)的出现与spider(网络爬虫)
Robot基于网络的,可以执行特定任务的程序
Spider:特殊的机器人,网络爬虫,爬取互联网上的信息(可以是文件,网络)----网络自...
分类:
Web程序 时间:
2014-12-08 00:56:28
阅读次数:
301
《信息检索》第一期期末考试返回考试列表全部为单项选择题,共15道30分,在课程中占30%分数倒计时:170:511()是高校或科研机构的毕业生为获取学位而撰写的。(单选2分)A.学位论文B.科技报告C.政府出版物D.档案文献2对于企业来说,以下哪一项检索对其作用最大?(单选2分)A.专利、商标信...
分类:
其他好文 时间:
2014-12-04 00:57:44
阅读次数:
486
经典的机器学习方面源代码库(非常全,数据挖掘,计算机视觉,模式识别,信息检索相关领域都适用的了)今天给大家介绍一下经典的开源机器学习软件:编 程语言:搞实验个人认为当然matlab最灵活了(但是正版很贵),但是更为前途的是python(numpy+scipy+matplotlib)和 C/C++,这...
分类:
其他好文 时间:
2014-12-02 22:14:59
阅读次数:
219
在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近做了一个汇总。准确率、召回率、F1信息检索、分类、识别、翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(Precision Rate),召回率也叫查全率,准确率也叫查准率,概念公式: ....
分类:
其他好文 时间:
2014-12-02 00:01:36
阅读次数:
438
1、TF-IDF TF-IDF(term frequency/inverse document frequency) 的概念被公认为信息检索中最重要的发明。描述单个term与特定document的相关性。 TF(Term Frequency): 表示一个term与某个document的相关性。公.....
分类:
其他好文 时间:
2014-12-01 11:23:06
阅读次数:
251
Bag-of-words模型是信息检索领域常用的文档表示方法。在信息检索中,BOW模型假定对于一个文档,忽略它的单词顺序和语法、句法等要素,将其仅仅看作是若干个词汇的集合,文档中每个单词的出现都是独立的,不依赖于其它单词是否出现。也就是说,文档中任意一个位置出现的任何单词,都不受该文档语意影响而独立...
分类:
其他好文 时间:
2014-11-28 15:41:33
阅读次数:
186
安装MySql sudo apt-get install mysql-server 进入Mysql Shell mysql -u root -p 查询数据库 SHOW DATABASES; 创建数据库 CREATE DATABASE $DB_NAME; 数据库信息检索 use $DB_NAME;
S...
分类:
数据库 时间:
2014-11-22 16:02:55
阅读次数:
229
召回率:(Recall Ratio,简称R)是衡量信息检索系统在实施某一检索作业时检出相关文献能力的一种测度指标,其计算方法为:Recall=检出的相关文献量/检索系统中的相关文献总量.
准确率:(Precision Ratio,简称P)是衡量系统在实施某一检索作业时检索精准度的一个测度指标,其计算方法为:
Precision=检出的相关文献量/检出的文献总量....
分类:
其他好文 时间:
2014-11-20 00:06:33
阅读次数:
203
自动摘要(利用计算机自动地从原始文献中提取文摘)指代消解语篇分析机器翻译形态学分割命名实体识别自然语言生成自然语言理解光学字符识别标注词性解析问答关系提取破句(又称句界歧义)情感分析语音识别语音分割主题分割与识别分词词义消歧信息检索信息抽取语音处理
分类:
其他好文 时间:
2014-11-16 22:51:19
阅读次数:
202