luceneLucene.Net系列一本文介绍了什么是Lucene,Lucene能做什么.如何从一个文件夹下的所有txt文件中查找特定的词?本文将围绕该个实例介绍了lucene.net的索引的建立以及如何针对索引进行搜索.最后还将给出源代码供大家学习.源代码下载What’s LuceneLucene...
分类:
其他好文 时间:
2014-09-18 16:17:34
阅读次数:
325
最近研究分布式数据库架构,发现排序、分组及分页让着实人有点头疼。现把问题及解决思路整理如下。 一、 多分片(水平切分)返回结果合并(排序) ??????????1、Select + None Aggregate Function的有序...
分类:
数据库 时间:
2014-09-18 11:42:34
阅读次数:
293
Solr4.8.0源码分析(9)之Lucene的索引文件(2)一.Segments_N文件 一个索引对应一个目录,索引文件都存放在目录里面。Solr的索引文件存放在Solr/Home下的core/data/index目录中,一个core对应一个索引。 Segments_N例举了索引所有有效的s...
分类:
其他好文 时间:
2014-09-18 00:48:03
阅读次数:
325
Solr4.8.0源码分析(8)之Lucene的索引文件(1)题记:最近有幸看到觉先大神的Lucene的博客,感觉自己之前学习的以及工作的太为肤浅,所以决定先跟随觉先大神的博客学习下Lucene的原理。由于觉先大神主要介绍的是Lucene3.X系的,那我就根据源码以及结合觉先大神的来学习下4.X系的...
分类:
其他好文 时间:
2014-09-18 00:42:13
阅读次数:
582
注明:本文是由本人在开发有关基于lucene资源检索系统时的一点总结,当中一部分是自己依据开发过程自己总结的,也有部分是摘自网络,因无法获取当时摘文的地址,所以在此没有写源地址。转载请声明出处Lucene-3.0.0配置一、Lucene开发环境配置step1.Lucene开发包下载step2.Jav...
分类:
其他好文 时间:
2014-09-17 23:16:53
阅读次数:
367
这里忽略java安装和tomcat安装,这里使用的是solr-4.10.01、到apache下载solr,地址:http://mirrors.hust.edu.cn/apache/lucene/solr/2、解压出solr-4.10.03、复制solr-4.10.0\example\webapps中...
分类:
其他好文 时间:
2014-09-17 20:14:12
阅读次数:
231
我的基础版本很混乱,配置文件里是5.0.17但是Admin页面显示的是5.0.10,访问Update Center显示是最新,突然发现官网已经升级到7.0.2了。应该是本地检测版本更新失败了,导致一直显示最新。找到了两个手动升级的文档:大版本升级:http://doc.owncloud.org/se...
分类:
其他好文 时间:
2014-09-16 12:17:10
阅读次数:
211
2.1Lucene如何对搜索内容进行建模2.1.1文档和域2.1.2灵活的架构往文档添加域,跟重建索引二者是什么关系?Lucene和数据库之间的第二个主要的区别是,Lucene要求你在进行索引操作时简单化或反向规格化原始数据。2.1.3反向规格化(Denormalization)2.2理解索引过程2...
分类:
其他好文 时间:
2014-09-16 12:15:10
阅读次数:
164
多核心的概念
多核心说白了就是多索引库。也可以理解为多个"数据库表"
说一下使用multicore的真实场景,比若说,产品搜索和会员信息搜索,不使用多核也没问题,这样带来的问题是 indexs文件很多,而且产品的索引文件和会员信息的索引文件混在一起,备份也是个问题。 如果使用了多核,那就很轻松了,产...
分类:
其他好文 时间:
2014-09-16 10:24:30
阅读次数:
264
什么是Solr搜索
我们经常会用到搜索功能,所以也比较熟悉,这里就简单的介绍一下搜索的原理。
当然只是介绍solr的原理,并不是搜索引擎的原理,那会更复杂。
流程图 这是一个非常简单的流程图:
User:即需要搜索的用户。
Raw Data:需要搜索的内容,当然是源数据,可能是文本文件,可能是数据库...
分类:
其他好文 时间:
2014-09-15 15:48:39
阅读次数:
218