分词lucene在查询和建立索引文件的过程中,都是基于语素单元来操作的。而分词就是将查询语句,转换为一个个单独的语素单元。
主要通过Analyzer类解析实现,Analyzer通过调用TokenStream来实现。
分词的主要架构:Analyzer 常用的有: SimpleAnalyzer: 将查询语句转换为语素单元时完成转换为小写的操作。 StandardAnalyzer :最为...
分类:
Web程序 时间:
2015-06-03 11:49:11
阅读次数:
153
Redis简介 1. 支持5种数据结构 支持strings, hashes, lists, sets, sorted sets string是很好的存储方式,用来做计数存储。sets用于建立索引库非常棒; 2. K-V 存储 vs K-V 缓存 新浪微博目前使用的98%都是持久化...
分类:
其他好文 时间:
2015-06-01 17:01:54
阅读次数:
134
百万数据查询优化1.合理使用索引 索引是数据库中重要的数据结构,它的根本目的就是为了提高查询效率。现在大多数的数据库产品都采用IBM最先提出的ISAM索引结构。索引的使用要恰到好处,其使用原则如下: ●在经常进行连接,但是没有指定为外键的列上建立索引,而不经常连接的字段则由优化器自动生成索引。 .....
分类:
数据库 时间:
2015-06-01 09:36:41
阅读次数:
235
今天看《MySql技术内幕InnoDB存储引擎》一书,学习了Mysql的三大关健特性,并记录如下: 插入缓冲 双写(double write) 自适应Hash索引 在记录这些特性之前,先对Mysql的索引实现进行了学习。主键索引 非主键索引 可以看出,B+树是用于建立索引的,而非主键索引...
分类:
数据库 时间:
2015-05-28 21:25:36
阅读次数:
361
使用solr从pdf、office文档中建立索引和从数据库中建立相似,只不过这里需要tika来解析这些文档。8.1配置一个handler这个handler首先要在solrConfig.xml中配置,如下所示:
<requestHandler
name="/dataimport"
class="org.apache.solr.handler.dataimport.DataImportHandle..
分类:
其他好文 时间:
2015-05-28 18:21:28
阅读次数:
209
使用solr从pdf、office文档中建立索引和从数据库中建立相似,只不过这里需要tika来解析这些文档。8.1 配置一个handler
这个handler首先要在solrConfig.xml中配置,如下所示:
tika-data-config.xml
...
分类:
其他好文 时间:
2015-05-28 18:13:02
阅读次数:
749
使用solr从pdf、office文档中建立索引和从数据库中建立相似,只不过这里需要tika来解析这些文档。8.1配置一个handler这个handler首先要在solrConfig.xml中配置,如下所示: tika-data-config.xml ...
分类:
其他好文 时间:
2015-05-28 17:57:02
阅读次数:
213
1.前言 实现一个本地搜索引擎,允许容错搜索,也就是搜索结果不需要和搜索的关键字完全精准匹配。比如,搜索”eric wang“,搜索结果可以包括Erica Watts等等。搜索效率十分高.这里我们需要用到作者:Jerome Morissard的Lib,大家可以进我的github下载.https:/....
分类:
移动开发 时间:
2015-05-26 18:30:46
阅读次数:
157
1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:select id from xuehi.com where num is nu...
分类:
数据库 时间:
2015-05-25 18:31:02
阅读次数:
134
1.合理使用索引 索引是数据库中重要的数据结构,它的根本目的就是为了提高查询效率。现在大多数的数据库产品都采用IBM最先提出的ISAM索引结构。索引的使用要恰到好处,其使用原则如下: ●在经常进行连接,但是没有指定为外键的列上建立索引,而不经常连接的字段则由优化器自动生成索引。 ●在频繁进行排...
分类:
其他好文 时间:
2015-05-25 18:25:36
阅读次数:
114