Hadoop的MR作业支持链式处理,类似在一个生产牛奶的流水线上,每一个阶段都有特定的任务要处理,比如提供牛奶盒,装入牛奶,封盒,打印出厂日期,等等,通过这样进一步的分工,从而提高了生产效率,那么在我们的Hadoop的MapReduce中也是如此,支持链式的处理方式,这些Mapper像Linux管道...
分类:
移动开发 时间:
2014-08-15 12:43:28
阅读次数:
285
Lucene有多种搜索方式,可以根据需要选择不同的方式。1、词条搜索(单个关键字查找) 主要对象是TermQuery 调用方式如下:Term term=new Term(字段名,搜索关键字);Query query=new TermQuery(term);Hits hits=searcher.sea...
分类:
其他好文 时间:
2014-08-15 12:40:18
阅读次数:
293
http://blog.sina.com.cn/s/blog_82ac67c101012r9z.htmlpackage com.javabean;import java.io.File;import java.io.IOException;import java.sql.ResultSet;impo...
分类:
数据库 时间:
2014-08-14 19:24:09
阅读次数:
246
上文写到Solr的启动过程是在SolrDispatchFilter的init()里实现,当Tomcat启动时候会自动调用init();Solr的启动主要在this.cores = createCoreContainer();语句中实现。/** *初始化,当tomcat启动时候开始初始化,其中主要调....
分类:
其他好文 时间:
2014-08-14 01:13:27
阅读次数:
326
因为Lucene4.9要求Java版本最低为Java7,所以之前一直用的Java6要升级了,要不然会报如下错误:
Exception in thread "main" java.lang.UnsupportedClassVersionError: org/apache/solr/client/solrj/SolrServerException : Unsupported major.mino...
分类:
编程语言 时间:
2014-08-13 18:55:17
阅读次数:
309
本文出自:http://blog.csdn.net/feelig/article/details/8499614最大的特点:1. 数据库的 database, 就是 index2. 数据库的 table, 就是 tag3. 不要使用browser, 使用curl来进行客户端操作. 否则会出现 jav...
分类:
其他好文 时间:
2014-08-13 01:03:45
阅读次数:
306
暂时只是跑起来了,不知道是否正确,困了,睡觉了,改天再弄。搜索那块是分页的,也没仔细弄。。。参考着http://blog.csdn.net/kingskyleader/article/details/8444739在data下放了三个txt...S:\lucene\data\永生.txtS:\luc...
分类:
其他好文 时间:
2014-08-13 00:56:44
阅读次数:
232
眼下全量索引17G,不到1300万document花费大约25分钟的时间(Lucene 4.0),吞吐量远远低于lucene nightly build宣称的170G/h的量。换用StandardAnalyzer,有34%的提高,比較下使用的KAnalyzer,mmseg4j1.9.2-snapsh...
分类:
其他好文 时间:
2014-08-12 21:45:54
阅读次数:
193
1st projects Spring 3.0.5 FullStack library. Hibernate 3.6.1(4.0 alpha1) ORM library. Mybatis 3.0.4 ORM library. Blueprint 1.0 CSS framework CXF 2.3.2...
分类:
其他好文 时间:
2014-08-12 17:02:24
阅读次数:
292
搜索流程中的第二步就是构建一个Query。下面就来介绍Query及其构建。当用户输入一个关键字,搜索引擎接收到后,并不是立刻就将它放入后台开始进行关键字的检索,而应当首先对这个关键字进行一定的分析和处理,使之成为一种后台可以理解的形式,只有这样,才能提高检索的效率,同时检索出更加有效的结果。那么,在...
分类:
其他好文 时间:
2014-08-12 13:21:24
阅读次数:
403