上篇介绍了如何把Pig的结果存储到Solr中,那么可能就会有朋友问了,为什么不存到数据库呢? 不支持还是? 其实只要我们愿意,我们可以存储它的结果集到任何地方,只需要重写我们自己的StoreFunc类即可。 关于如何...
分类:
数据库 时间:
2015-03-07 21:25:02
阅读次数:
305
散仙,在上篇文章中介绍了,如何使用ApachePig与Lucene集成,还不知道的道友们,可以先看下上篇,熟悉下具体的流程。在与Lucene集成过程中,我们发现最终还要把生成的Lucene索引,拷贝至本地磁盘,才能提供检索服务,这样以来,比较繁琐,而且有以下几个缺点:(一)在生成索引..
分类:
Web程序 时间:
2015-03-07 06:22:00
阅读次数:
256
散仙,在上篇文章中介绍了,如何使用Apache Pig与Lucene集成,还不知道的道友们,可以先看下上篇,熟悉下具体的流程。? 在与Lucene集成过程中,我们发现最终还要把生成的Lucene索引,拷贝至本地磁盘,才能提供检...
分类:
Web程序 时间:
2015-03-06 23:44:13
阅读次数:
589
经过一番研究(2days),终于把solr 搭建起来了。由于现在网上的资料实在太旧,所以现在准备写如何搭建solr5.0。
环境:window7
1.安装jdk1.8, tomcat6.0。(jdk1.6不支持啊!)
2.在apace solr官网下载,solr-5.0.0.zip
http://mirrors.hust.edu.cn/apache/lucene/solr/5.0.0/...
分类:
其他好文 时间:
2015-03-06 17:11:41
阅读次数:
231
1.使用DIH上传结构化数据 许多搜索应用索引结构化数据,如关系型数据库.DIH提供了一个这样的存储并索引结构化数据的机制.除了关系型数据库,solr可以索引来自HTTP的内容,基于数据源如RSS和ATOM feeds,e-mail库和结构化XML(可以使用XPath来生成字段) 更多信息参考 .....
分类:
其他好文 时间:
2015-03-03 20:33:26
阅读次数:
173
1. Uploading Data with Solr Cell using Apache Tika solr使用Apache Tika工程的代码提供了一个框架,用于合并所有不同格式的文件解析器为solr自己的解析器,如Apache PDFBox,Apache POI.通过这个框架,solr使用E....
分类:
Web程序 时间:
2015-03-03 13:25:03
阅读次数:
338
一、开篇语 ? ? ? ? 其实Solr就是一个你可以通过他来查询文档的东西,他整个都是基于Document的,那么这些Document从何而来列? ?当然是我们给他,而这些来源就包括了:数据库文件,XML,Json,CSV等。。。 ...
分类:
其他好文 时间:
2015-03-03 12:02:12
阅读次数:
117
Uploading Data with Index Handlers 索引处理器就是Request Handlers,用于添加,更新,删除索引中的文档.另外,使用Tika抽取富文档数据,使用Data Import Handler抽取结构化数据.solr自然也就支持XML, CSV 和 JSON格式....
分类:
其他好文 时间:
2015-03-02 10:52:17
阅读次数:
168
这部分描述了建立索引的过程:添加内容到solr索引中,如果有需要,修改内容或者删除它.通过添加内容到索引里边,我们使其内容可以搜索. solr索引能够接收不同来源的数据,xml文件,逗号分隔值的(CVS)文件,数据库,普通格式文件如Word或者PDF. 这里有三种不同的方式来加载数据到索引中...
分类:
其他好文 时间:
2015-03-02 10:52:10
阅读次数:
106
首先到官网下载最新版本的solr安装包?http://www.apache.org/dyn/closer.cgi/lucene/solr/4.10 安装好jdk?1.7.0_15,安装好tomcat(apache-tomcat-7.0.6),并配置环境变量。 将解压包中的solr-4.10/dist/solr...