码迷,mamicode.com
首页 >  
搜索关键字:信息检索    ( 257个结果
基于搜索引擎优化策略的研究
1.1.1随着Internet技术的迅速发展,使得用户要想在信息海洋里查找目标信息,就如大海捞针一样,搜索引擎技术恰好解决了这一难题。搜索引擎是人们获取网络资源的主要工具,然而搜索引擎在给网络用户带来巨大便捷的同时, 由于其信息检索技术智能水平的限制以及对自然语言理解的制约,在网络信息的检索中存在许...
分类:其他好文   时间:2014-10-13 03:44:48    阅读次数:186
Lucene 3.0 输出相似度
http://www.cnblogs.com/ibook360/archive/2011/10/19/2217638.htmlLucene3.0之结果排序(原理篇)传统上,人们将信息检索系统返回结果的排序称为"相关排序"(relevance ranking),隐含其中各条目的顺序反映结果和查询的相关...
分类:Web程序   时间:2014-10-10 22:54:54    阅读次数:270
字符串匹配
字符串匹配是经常遇到的问题,比如信息检索、拼写检查,甚至是生物信息学中DNA相关的问题。1、比较简单的匹配算法是直接暴力匹配,算法原理:1)取指针i,j分别指向字符串S和目标串P,如果S[i] == P[j],i和j分别自增。2)如果不相等,i回溯到初始位置的下一个位置,即i = i - j + 1...
分类:其他好文   时间:2014-10-07 22:05:14    阅读次数:142
[原]关于对求两个排序数组交集的扫描算法正确性的证明
在看《信息检索导论》的时候看到了这个算法的实现,书里是用来演示如何将两个term的倒排列表求交集。伪代码如下:INTERSECT( p1, p2)1 answer ← {}2 while p1 != NIL and p2 != NILdo3 if docID( p1) = docID( p2)th....
分类:其他好文   时间:2014-09-28 18:03:53    阅读次数:156
基于搜索引擎优化Internet的策略研究
随着Internet技术的迅速发展,使得用户要想在信息海洋里查找目标信息,就如大海捞针一样,搜索引擎技术恰好解决了这一难题。搜索引擎是人们获取网络资源的主要工具,然而搜索引擎在给网络用户带来巨大便捷的同时, 由于其信息检索技术智能水平的限制以及对自然语言理解的制约,在网络信息的检索中存在许多不足。因此,搜索引擎优化(Search Engine Optimization,SEO)技术应运而生。  ...
分类:Web程序   时间:2014-09-21 21:56:01    阅读次数:301
信息检索导论学习笔记 -- 第二章:词项词典及倒排记录表
2.1.1 文档分析及编码转换: 文档处理第一步,是将文件或web服务器上的一系列二进制字节序列转换为字符序列。 在实际中,首先要判断出文档的编码方式(机器学习分类、启发式等方法),确定文档的类型(word?zip?)然后将字节序列转换成字符序列。 2.1.2 文档单位(document unit)...
分类:其他好文   时间:2014-09-15 21:04:59    阅读次数:250
Trie树—字典树(单词查找树)
Trie树,又称字典树,单词查找树。它来源于retrieval(检索)中取中间四个字符构成的。用于存储大量的字符串以便支持快速模式匹配。主要应用在信息检索领域。 Trie有三种结构:标准Trie(standard trie),压缩Trie,后缀Trie(suffix trie)。 1、标准Trie ...
分类:其他好文   时间:2014-09-14 14:06:37    阅读次数:242
Trie树(转)
Trie 树,又称字典树,单词查找树。它来源于retrieval(检索)中取中间四个字符构成(读音同try)。用于存储大量的字符串以便支持快速模式匹配。主要应用在信息检索领域。Trie 有三种结构: 标准trie (standard trie)、压缩trie、后缀trie(suffix trie)。...
分类:其他好文   时间:2014-09-05 09:56:01    阅读次数:197
图像特征提取方法:Bag-of-words
Bag-of-words简单介绍最初的Bag-of-words ,也叫做“词袋”,在信息检索中,Bag-of-words model假定对于一个文本,忽略其词序和语法,句法,将其只看做是一个词集合,或者说是词的一个组合,文本中每一个词的出现都是独立的,不依赖于其它词是否出现。应用于文本的BoW简单实...
分类:其他好文   时间:2014-08-25 14:51:14    阅读次数:238
数据挖掘算法修炼--协同过滤Collaborative Filtering
从外部看协同过滤 从互联网上寻找有用的信息越来越难,这催生了三类方法:信息检索、信息过滤和推荐系统。信息检索是指Google、百度这样的搜索引擎,这是一种被动的方式;信息过滤是指先对信息进行分类,再根据用户的偏好进行过滤,比如我们注册知乎/豆瓣/微博等时都会要求选择感兴趣的领域,之后会对我们选定领域...
分类:其他好文   时间:2014-08-24 01:32:51    阅读次数:196
257条   上一页 1 ... 22 23 24 25 26 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!