前段时间听同事谈起过,公司内部的一个搜索功能用的就是Sphinx,但一直没时间去整一下,今天刚好有点时间,那么就折腾一次吧。一般在linux上比较多,今天就在windows下安装于调试一下吧。前言:一、关于SphinxSphinx 是一个在GPLv2 下发布的一个全文检索引擎,商业授权(例如, 嵌入...
1 ----1 准备工作 解锁ctxsys用户并授权----- 2 3 --解锁ctxsys 4 alter user ctxsys account unlock; 5 --修改ctxsys密码(如果ctxsys用户过期了的话,需要重新设置一下密码) 6 alter user ctxsys id.....
分类:
数据库 时间:
2015-07-17 11:37:37
阅读次数:
318
检索结构php -> sphinx -> mysql非结构化数据又叫全文数据,非固定长度字段例如文章标题搜索这类适用sphinx全文数据搜索:1 顺序扫描 : 如like查找2 索引扫描 : 把非结构化数据中的内容提取出来一部分重新组织,这部分数据就叫做索引全文检索分为两个过程1.创建索引2....
分类:
其他好文 时间:
2015-07-14 09:51:09
阅读次数:
133
1.检查数据库是否具有全文检索功能(这是针对已经建成使用的数据库) 查看用户中是否存在ctxsys用户,查询角色里是否存在ctxapp角色。以上两个中的1个不满足(不存在),则说明没有装过全文检索功能。 使用contains函数的时候,若没有全文检索则会报错的。 2.若没有,则需要手动建立,先建立....
分类:
数据库 时间:
2015-07-10 12:56:53
阅读次数:
168
一、问题描述 ????在对用solr实现的全文检索系统做性能测试时,发现并发量达到400时,内存溢出。200并发量无任何问题。 二、问题追踪 ????使用jconsole查看内存消耗,老年代基本占满。线程数大量处于blo...
分类:
其他好文 时间:
2015-07-08 19:16:01
阅读次数:
236
Score computation mechanismI am learning Elasticsearch these days, so I’m really curious about how Elasticsearch compute the score of retrieved documents.在Elasticsearch的官方文档中,给出了文档score的计算的公式,但是其中有个que...
分类:
其他好文 时间:
2015-07-08 16:27:25
阅读次数:
275
使用Lucene.Net实现全文检索目录一Lucene.Net概述二 分词三 索引四 搜索五 实践中的问题一Lucene.Net概述 Lucene.Net是一个C#开发的开源全文索引库,其源码包括“核心”与“外围”两部分。外围部分实现辅助功能,而核心部分包括:Lucene.Net.Index 提供....
分类:
Web程序 时间:
2015-07-05 12:16:02
阅读次数:
200
转载自http://www.cnblogs.com/dewin/archive/2009/11/24/1609905.htmlLucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives...
分类:
Web程序 时间:
2015-07-03 01:37:23
阅读次数:
100
TinySpider是一个基于Tiny HtmlParser的网络数据抓取框架。Maven引用坐标:?12345org.tinygrouptinyspider0.0.12网络爬虫,一般用在全文检索或内容获取上面。Tiny框架对此也做了有限的支持,虽然功能不多,但是想做全文检索或从网页上获取数据也是非...
分类:
其他好文 时间:
2015-07-01 11:28:41
阅读次数:
116
原文:使用Lucene.Net实现全文检索目录 一 Lucene.Net概述 二 分词 三 索引 四 搜索 五 实践中的问题 一 Lucene.Net概述 Lucene.Net是一个C#开发的开源全文索引库,其源码包括“核心”与“外围”两部分。外围部分实现辅助功能,而核心部分包括: Lucene.N...
分类:
Web程序 时间:
2015-06-26 14:59:59
阅读次数:
118