前面一篇开始学习solr的时候,做了个入门的示例http://blog.csdn.net/zjc/article/details/24414271 。虽然可以检索出内容,但总和想象的结果有差异——比如,检索“天龙”两个字,按常规理解,就应该只出来《天龙八部》才对,可是竟然也会把《倚天屠龙记》检出来。后来研究了一下,发现系统是这样处理的:无论是抽索引时还是分析检索词时,都把所有文字按单字拆开。这样,...
分类:
其他好文 时间:
2014-05-26 06:11:39
阅读次数:
270
总结一下我遇到的问题:
1.设置最小分词长度分词
被搜索名字为:andy
这时搜索andy正常,但是搜索a就搜不到。
解决办法,在索引配置文件中的index中添加
min_infix_len = 1
2.调用API返回记录总是只有20条
因为coreseek它默认返回的result里面,function SetLimits ( $offset, $limit, $max_...
分类:
其他好文 时间:
2014-05-26 05:32:58
阅读次数:
266
你要好好的思考,及其在百度更接近完美的时候就更要做好这些,其实这些都是影响用户体会的要素。一个成功的网站可以说它在收取利益的同时也在帮助用户。现在说说网站权重有何重要性呢?其实搜索引擎给网站(包含页面)赋予一定的威望值,对网站(含页面)威望的评价,一个网站权重越高,在搜索引擎所占的价值成分就越好,在搜索引擎排行就越好。一个网站在搜索引擎中的权重是件非常艰难的工作,因为种种要素的搅扰,影响了咱们正确...
分类:
Web程序 时间:
2014-05-26 04:42:45
阅读次数:
307
部分内容转自:http://blog.csdn.net/hguisu/article/details/8024799
一、 开源项目
1.Lucene全文检索系统
http://lucene.apache.org和 http://www.lucene.com.cn/
Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代...
分类:
Web程序 时间:
2014-05-26 04:36:55
阅读次数:
297
从昨天晚上还是叼coreseek,结果一直出现很奇怪的问题,结果晚上觉都没睡好。
在命令行下可以搜索成功,但一旦调用API以后,就会很奇怪的问题,无论是字段还是原来的属性都没出现过,出现的是以前的情况。索引建立也是成功的,端口也在监听,结果却一直有问题。在我们实验室大哥跟二哥合力一个多小时之下终于找到了问题。
在任务管理器下停止服务时,仍然可以调用API搜索,!!!说明searchd服务没有被...
分类:
其他好文 时间:
2014-05-26 03:12:00
阅读次数:
254
第一次接触SEO,请阅读本基础指南入门,也可以注册论坛:从一句话入门SEO开始 已经意识到SEO的重要性,渴望系统掌握并与行业精英们深入交流你可以:加入SEOWHY成为VIP会员
什么是SEO,SEO是什么意思?
SEO的中文意思是搜索引擎优化。通俗理解是:通过总结搜索引擎的排名规律,对网站进行合理优化,使你...
分类:
其他好文 时间:
2014-05-24 22:22:21
阅读次数:
406
CREATE INDEX 语句
CREATE INDEX 语句用于在表中创建索引。
在不读取整个表的情况下,索引使数据库应用程序可以更快地查找数据。
索引
您可以在表中创建索引,以便更加快速高效地查询数据。
用户无法看到索引,它们只能被用来加速搜索/查询。
注释:更新一个包含索引的表需要比更新一个没有索引的表花费更多的时间,这是由于索引本身也需要更新。因此,理想...
分类:
数据库 时间:
2014-05-24 22:21:22
阅读次数:
377
【A JAVA】
【B JavaEE】
【C Android】
【D 前端】
【E 大数据】
【F Oracle】
【G 云计算】
【H Linux】
【I 计算机基础】
【J PM ITIL SOA】
【K Others】
【S 搜索引擎】
【Z 方法、人文】...
分类:
其他好文 时间:
2014-05-24 21:44:27
阅读次数:
287
一开始时,为了省服务器,把Mongodb和Redis放在一个服务器上。网站每到高峰期都特别卡,还经常出现502。找了很久的原因,发现硬盘的写数据很大,IOPS也很高,排查了很多原因都没找到。然后再仔细研究监控,发现写硬盘的操作很有规律,每隔几分钟就有一次频繁的写硬盘,联想到Redis同步数据到硬盘的间隔就是几分钟,所以开始怀疑是Redis引起的。于是加了一台服务器,把Redis单独放在那里,发现网...
分类:
数据库 时间:
2014-05-24 19:38:43
阅读次数:
302
引 言
随着多媒体技术及[nternet技术的迅速发展,各行各业对图像的使用越来越广泛,图像信息资源的管理和检索显得越来越重要。传统的通过手工标记和索引图像(即基于文本的图像检索)的方法已经不能满足人们的需求,随之而来的问题是:随着图像数据的剧增和人们对图像的理解具有不同的侧重点,不同的人从不同的角度对同一幅图像的认识可能存在很大的差异性,因此无法准确反映图像...
分类:
其他好文 时间:
2014-05-24 18:07:11
阅读次数:
353