码迷,mamicode.com
首页 >  
搜索关键字:lucene nrt    ( 2456个结果
第一章 初识Lucene
多看几遍索引操作将原始数据引入可被高效查找的对照表中,以便能够对这些内容进行快速搜索。这里的对照表的结构是什么样的?是二叉排序树还是红黑树?索引是一个精心设计的数据结构。
分类:其他好文   时间:2014-09-15 14:16:48    阅读次数:122
Java版网络爬虫基础
网络爬虫不仅仅可以爬取网站的网页,图片,甚至可以实现抢票功能,网上抢购,机票查询等。这几天看了点基础,记录下来。 网页的关系可以看做是一张很大的图,图的遍历可以分为深度优先和广度优先。网络爬虫采取的广度优先,概括的说来如下: 2个数组,一个记录已访问的网页(Al),一个记录未访问的网页(Un...
分类:编程语言   时间:2014-09-14 12:51:17    阅读次数:427
.net面试题1[转载]
1、简述private、protected、public、internal修饰符的访问权限。private:私有成员,在类的内部才可以访问。protected:保护成员,该类内部和继承类中可以访问。public:公共成员,完全公开,没有访问限制。internal:当前程序集内可以访问。2、ADO.N...
分类:Web程序   时间:2014-09-12 23:28:44    阅读次数:438
Lucene初试——关于大文本建立索引和中文乱码以及QueryParser检索的一些体会
这几天因为一个小项目用到Lucene,于是去学习了一下,现在还有很多地方没有了解,先就我遇到的问题做下总结。 一、大文本建索引问题 我这里说的大文本,实际上也就200M左右的txt,或许不应该成为大文本,但是我在建索引时遇到200M左右的的确导致了内存溢出,报错误java.lang.OutOfMemoryError: Java heap space ,到网上查了很久,试了一些方法,比如修改JV...
分类:其他好文   时间:2014-09-12 12:02:13    阅读次数:270
搭建企业级搜索服务Solr
·什么是Solr? Solr是基于lucene搭建的java搜索引擎服务端,是一个搜索中心式的程序。 ·Solr的组成: Solr由一个服务端程序,若干个搜索模块core,和一套java客户端组件Solrj组成。core运行在服务端之上,可以把一个core理解成一个网站的搜索服务提供者,虽然一个core里面可以配置多个网站,但并不建议这么做。所有的core都存放在一个目录下,这个目录叫做solrHome,这是Solr安装中必须配置的一个文件夹目录。...
分类:其他好文   时间:2014-09-12 10:18:23    阅读次数:234
Lucene初识之Analyzer
刚接触Lucene,虽然跑通了一个demo,但对很多东西还不了解。下面简单记录下对Analyzer的理解,以后再系统整理。后面来自Lucene官方文档,Lucene版本为4.10.0.欢迎感兴趣的同学一起学习交流,求大牛指导,我现在还有很多不明白的地方。  包org.apache.lucene.analysis 将文本转换为可索引和检索的标记标记(token)。 Lucene,建索引和检...
分类:其他好文   时间:2014-09-12 10:15:13    阅读次数:241
初学小白该怎样开发出高效J2EE系统
当前,J2EE学习者可谓是越来越多,并且随着J2EE本身技术不断的发展,也涌现出各种新型概念,笔者特此撰写此文,目的就是试图从一种容易理解的角度对这些概念向初学者进行解释,从而让大家掌握学习J2EE学习方向,达到条理清晰。 首先,我们需要搞清楚的是,Java和J2EE是两种不同的概...
分类:其他好文   时间:2014-09-11 17:07:22    阅读次数:213
在Solr4.9中使用IKAnalyzer,实现同义词,扩展词库,停顿词的添加
在使用solr4.9的过程中,使用了IKAnalyzer分词器,其中遇到了不少问题,现在做个记录,以备后续只用。 ? ? ?首先使用IKAnalyzer是看到群里有人介绍,但是貌似现在IKAnalyzer已经没人更新了。。。不知道...
分类:其他好文   时间:2014-09-11 09:45:52    阅读次数:234
IKAnalyzer中文分词器
1. IKAnalyzer3.0介绍 IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词...
分类:其他好文   时间:2014-09-10 12:47:00    阅读次数:374
搜索学习内容
1、Lucene (1)书籍:Lucene in Action(基于3.0版本,有点旧)、解密搜索引擎技术(Lucene & Java精华版) (2)官方材料:http://lucene.apache.org/core/ (3)视频:孔浩老师lucene视频教程(基于3.5版本,讲得...
分类:其他好文   时间:2014-09-09 18:40:29    阅读次数:181
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!