最近要处理后台的文件检索,于是在老大的指导下知道了有lucene这种牛B的开源文件检索引擎,于是来学学,lucene得用java开发,所以很明显首先得把环境搭建好,哈哈当然先搭建linux下java了。说到java我又想说说我之前配置java环境变量的时候,老是把jre和jdk混淆了,现在是理清了,...
分类:
编程语言 时间:
2014-07-16 19:33:50
阅读次数:
238
[文章作者:张宴 本文版本:v1.0 最后修改:2008.12.09 转载请注明原文链接:http://blog.zyan.cc/post/385/] 曾经在七月,写过一篇文章──《基于Sphinx+MySQL的千万级数据全文检索(搜索引擎)架构设计》,前公司的分类信息搜索基于此架构,效果明显,甚....
分类:
其他好文 时间:
2014-07-16 19:01:06
阅读次数:
326
从各个角度总结了电商平台中的架构实践,由于时间仓促,定了个初稿,待补充完善,欢迎大家一起交流。转载请声明出处:http://blog.csdn.net/yangbutao/article/details/12242441作者:杨步涛关注分布式架构、大数据、搜索、开源技术QQ:306591368技术B...
分类:
其他好文 时间:
2014-07-15 23:51:01
阅读次数:
669
引言 最近LZ带头在做一个互联网项目,互联网的东西总是那么新鲜,这也难怪大部分猿友都喜欢互联网。这个互联网项目不仅让LZ开发了一个HBase大数据应用,近期的一次需求讨论会上,又出来一个小需求,蛮有意思的。这些需求在之前枯燥的企业内部应用开发中,还是很难见到的,毕竟内部应用更多的是业务流程的体现。....
分类:
其他好文 时间:
2014-07-13 19:13:57
阅读次数:
266
在lucene里面,suggest 的支持非常完善,可以随心所欲的定制;但是在es中使用起来就没有那么方便了。es给suggest 分类4类:term ;phrase; completion; context;目前最新版本是es1.2.1 这一块也还在不断完善中;[term suggester](....
分类:
其他好文 时间:
2014-07-13 13:04:41
阅读次数:
1433
solr4.9发布了,用一个网友的意思,现在solr绝壁是Firefox之外最大的版本帝。公司的solr版本是4.0,这几天决定给升级到4.8(4.9在maven上资源还不够),抽时间在整理下分布式solr. 今天先把solr4.8安装过程写下来,其实和4.0区别不大。1,环境必须是tomcat7....
分类:
其他好文 时间:
2014-07-13 09:55:28
阅读次数:
467
解决 Twitter的“问题”就像玩玩具一样,这是一个很有趣的扩展性比喻。每个人都觉得 Twitter很简单,一个菜鸟架构师随便摆弄一下个可伸缩的 Twitter就有了,就这么简单。然而事实不是这样, Twitter的工程副总裁 Raffi Krikorian细致深入的描述了在 Twitter在可伸...
分类:
其他好文 时间:
2014-07-13 09:32:28
阅读次数:
279
近期做项目中有用到过Lucene,那个模块是由一位前端大神负责的,空闲时间我也做了个关于Lucene做全文检索的Demo,记录下来,方便以后学习。
关于Lucene的原理,网上有长篇大论的文章,有兴趣的话可以去阅读,再次我就直奔主题,在代码中分析其原理。
1、创建索引(此处我用的是盘古分词)
注:在后台代码的第一行上加上 #define notes这样一行代码,目的是可以用外侧代码的#if,...
分类:
Web程序 时间:
2014-07-12 23:52:43
阅读次数:
509
今天来写写搜索,现在做的这个项目中涉及到了很多的搜索大部分是我做的,有次经理问我有没有用过luence这个搜索引擎,这个还真没有用过只是听说过有这么个搜索工具包,一直没有接触过,利用做项目空闲的时间也在逐渐了解搜索方面的东西,对搜索也重新认识了一下觉得搜索方向还是很值得我们研究和应用的。
在学习方面有时选择好一个正确的学习方向是比较重要的,在我们学的过程中米老师给我指明了方向所以你不...
分类:
其他好文 时间:
2014-07-12 23:37:55
阅读次数:
214