Lucene.Net简介
Lucene.Net是由Java版本的Lucene(卢思银)移植过来的,所有的类、方法都几乎和Lucene一模一样,因此使用时参考Lucene 即可。Lucene.Net只是一个全文检索开发包(就像ADO.Net和管理系统的关系),不是一个成型的搜索引擎,它的功能就是:把数据扔给Lucene.Net ,查询数据的时候从Lucene.Net 查询数据,可以看做是提供了全文...
分类:
Web程序 时间:
2015-03-07 18:42:37
阅读次数:
190
散仙,在上篇文章中介绍了,如何使用ApachePig与Lucene集成,还不知道的道友们,可以先看下上篇,熟悉下具体的流程。在与Lucene集成过程中,我们发现最终还要把生成的Lucene索引,拷贝至本地磁盘,才能提供检索服务,这样以来,比较繁琐,而且有以下几个缺点:(一)在生成索引..
分类:
Web程序 时间:
2015-03-07 06:22:00
阅读次数:
256
散仙,在上篇文章中介绍了,如何使用Apache Pig与Lucene集成,还不知道的道友们,可以先看下上篇,熟悉下具体的流程。? 在与Lucene集成过程中,我们发现最终还要把生成的Lucene索引,拷贝至本地磁盘,才能提供检...
分类:
Web程序 时间:
2015-03-06 23:44:13
阅读次数:
589
经过一番研究(2days),终于把solr 搭建起来了。由于现在网上的资料实在太旧,所以现在准备写如何搭建solr5.0。
环境:window7
1.安装jdk1.8, tomcat6.0。(jdk1.6不支持啊!)
2.在apace solr官网下载,solr-5.0.0.zip
http://mirrors.hust.edu.cn/apache/lucene/solr/5.0.0/...
分类:
其他好文 时间:
2015-03-06 17:11:41
阅读次数:
231
分词:
① 单字切分
把一段文字按照每个字去建立索引。
如切分“我爱中华”,就会切成“我”,“爱”,“中”,“华”。这种分词法效率低,但也能解决一些问题。
② 二分法
二分法就是把一段文字的每两个相邻的字算作一个词。
如果用来切分“我爱中华”,就会切成“我爱”,“爱中”,“中华”。这种分词效率低,但比单字切分好得多。
③ 词典法
词典法就是建立一个词典文件,然后使...
分类:
Web程序 时间:
2015-03-06 17:07:51
阅读次数:
140
1、创建索引器:
package yushibujue;
import java.awt.BorderLayout;
import java.awt.Container;
import java.awt.GridLayout;
import java.awt.event.ActionEvent;
import java.awt.event.ActionListener;
import java...
分类:
Web程序 时间:
2015-03-06 17:05:51
阅读次数:
194
在文章开始之前,我们还是简单来回顾下Pig的的前尘往事:
1,Pig是什么?
Pig最早是雅虎公司的一个基于Hadoop的并行处理架构,后来Yahoo将Pig捐献给Apache(一个开源软件的基金组织)的一个项目,由Apache来负责维护,Pig是一个基于 Hadoop的大规模数据分析平台,它提供的SQL-like语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转...
分类:
Web程序 时间:
2015-03-06 09:47:10
阅读次数:
140
在文章开始之前,我们还是简单来回顾下Pig的的前尘往事:? 1,Pig是什么?? Pig最早是雅虎公司的一个基于Hadoop的并行处理架构,后来Yahoo将Pig捐献给Apache(一个开源软件的基金组织)的一个项目,由Apach...
分类:
Web程序 时间:
2015-03-06 06:26:48
阅读次数:
173
在文章开始之前,我们还是简单来回顾下Pig的的前尘往事:1,Pig是什么?Pig最早是雅虎公司的一个基于Hadoop的并行处理架构,后来Yahoo将Pig捐献给Apache(一个开源软件的基金组织)的一个项目,由Apache来负责维护,Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-like..
分类:
Web程序 时间:
2015-03-06 06:21:44
阅读次数:
146
在文章开始之前,我们还是简单来回顾下Pig的的前尘往事:1,Pig是什么?Pig最早是雅虎公司的一个基于Hadoop的并行处理架构,后来Yahoo将Pig捐献给Apache(一个开源软件的基金组织)的一个项目,由Apache来负责维护,Pig是一个基于 Hadoop的大规模数据分析平台,它提供的SQ...
分类:
Web程序 时间:
2015-03-06 06:09:45
阅读次数:
138