简介Sphinx是开源的搜索引擎,它支持英文的全文检索。所以如果单独搭建Sphinx,你就已经可以使用全文索引了但是有些时候我们还要进行中文分词所有scws就出现了,我们也可以使用Coreseek来建立中文索引,而Coreseek的内核就是Sphinx1、环境PHP 5.5.23+centos 6....
分类:
Web程序 时间:
2015-08-08 01:14:46
阅读次数:
461
solr是干嘛的?Solr(读作“solar”)是ApacheLucene项目的开源企业搜索平台。其主要功能包括全文检索、命中標示[1]、分面搜索、动态聚类、数据库集成,以及富文本(如Word、PDF)的處理。Solr是高度可扩展的,并提供了分布式搜索和索引复制。Solr是最流行的企业级搜索引擎,[2]..
分类:
其他好文 时间:
2015-08-07 16:33:20
阅读次数:
208
Elasticsearch教程摘要: 参考资料Elasticsearch中文参考文档思维导图阅读全文posted @2015-08-05 11:49xingoo 阅读(18) |评论 (0)编辑Elasticsearch使用REST API实现全文检索摘要: 通过rest api添加检索数据,阅读官...
分类:
其他好文 时间:
2015-08-06 08:15:53
阅读次数:
271
通过rest api添加检索数据,阅读官方文档可以发现,elasticsearch支持动态映射,但是其中有不少问题,且听慢慢详解。本文主要讲述三点内容:1 Elasticsearch常用的rest api2 Elasticsearch在添加索引时,动态映射报错:MapperParsingExcept...
Lateral是一家内容推荐服务提供商,其模拟程序使用PostgreSQL存储文档。每个文档包含一个 text列和一个存储标题、日期和URL等元数据的JSON列。他们希望为模拟程序创建快速搜索功能,搜索文档全文和标题,生成推荐...
分类:
数据库 时间:
2015-08-04 13:46:58
阅读次数:
159
9个基于Java的搜索引擎框架 [导读]?Lucene是目前最受欢迎的Java全文搜索框架,准确地说,它是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。Lucene为开发人员提供了相当完整的工具...
分类:
编程语言 时间:
2015-07-30 11:36:23
阅读次数:
150
Mysql的优化方面,一般我们很少去考虑它,即使想到优化一般也更多是程序级别的,比如不要写过于消耗资源的SQL语句,但是除此以外,在整个系统上其实仍然有很多可以优化的地方。1. 选择合适的存储引擎: InnoDB除非你的数据表使用来做只读或者全文检索 (相信现在提到全文检索,没人会用 MYSQL 了...
分类:
数据库 时间:
2015-07-28 18:14:33
阅读次数:
220
一 sphinx 简介 在 使用mysql数据库过程中,如果想实现全文检索的优化,可以使用mysql自带全文索引,但是不支持中文。。关于sphinx的安装网上很多教程写的都 不错比如:http://www.coreseek.cn/products-install/。这里就不再说明安装方法了。...
分类:
其他好文 时间:
2015-07-28 06:32:18
阅读次数:
143
题目的意思:给你一篇文章,再给你T个字符串,判断这T个字符串有哪些在文章中出现过。
由于文章很大,普通的方法必定超时,所以需要用 AC自动机算法。
AC自动机算法是多模匹配算法之一,主要是用于在一篇文章中,找出给定的N个单词在这篇文章中出现的个数。
AC自动机算法,我也是刚刚学习,主要是在建立字典树的基础上,增加了失败指针,提高了匹配的效率。而且最难的是失败指针的建立。
它的优点是:最大限...
分类:
编程语言 时间:
2015-07-23 00:49:08
阅读次数:
124
检索引擎Elasticsearch支持插件模式,有些时候你可能需要安装一些插件,甚至自己开发插件,这里就提供一个开始ES插件开发示例,ES版本为5.2.0。
一、插件类继承自org.elasticsearch.plugins.AbstractPlugin
package org.elasticsearch.plugin.helloworld;
import java.util.A...
分类:
其他好文 时间:
2015-07-22 18:59:20
阅读次数:
134