前面一篇开始学习solr的时候,做了个入门的示例http://blog.csdn.net/zjc/article/details/24414271 。虽然可以检索出内容,但总和想象的结果有差异——比如,检索“天龙”两个字,按常规理解,就应该只出来《天龙八部》才对,可是竟然也会把《倚天屠龙记》检出来。后来研究了一下,发现系统是这样处理的:无论是抽索引时还是分析检索词时,都把所有文字按单字拆开。这样,...
分类:
其他好文 时间:
2014-05-26 06:11:39
阅读次数:
270
BULK COLLECT 可以降低 SQL 引擎到 PL/SQL 引擎的上下文交换(context
switch)次数,,从而实现数据的高速检索。”并不是限制必须一次完成。Oracle 提供了 LIMIT
子句,可以限制每次从表中获取的记录数,测试如下:SQL> select count(*) fr...
分类:
其他好文 时间:
2014-05-26 01:20:07
阅读次数:
273
所谓学习问题,是指观察由n个样本组成的集合,并根据这些数据来预测未知数据的性质。学习任务(一个二分类问题):区分一个普通的互联网检索Query是否具有某个垂直领域的意图。假设现在有一个O2O领域的垂直搜索引擎,专门为用户提供团购、优惠券的检索;同时存在一个通用的搜索引擎,比如百度,通用搜索引擎希望能...
分类:
其他好文 时间:
2014-05-25 23:18:41
阅读次数:
468
敏感词、文字过滤是一个网站必不可少的功能,如何设计一个好的、高效的过滤算法是非常有必要的。前段时间我一个朋友(马上毕业,接触编程不久)要我帮他看一个文字过滤的东西,它说检索效率非常慢。我把它程序拿过来一看,整个过程如下:读取敏感词库、如果HashSet集合中,获取页面上传文字,然后进行匹配。我就想这...
分类:
编程语言 时间:
2014-05-25 22:06:08
阅读次数:
496
Alfresco 是一个开源的企业内容管理系统(ECM),功能相对于微软的SharePoint,
Documentum与FileNet这样的产品。 支持多国语言, 支持LDAP, NTLM, Kerberos,活动目录,支持与Ms
Sharepoint,Google Docs的集成, 跨平台,支持W...
分类:
其他好文 时间:
2014-05-25 22:03:04
阅读次数:
525
(1)
你需要精通面向对象分析与设计(OOA/OOD)、涉及模式(GOF,J2EEDP)以及综合模式。你应该了解UML,尤其是class,object,interaction以
及statediagrams。 (2) 你需要学习JAVA语言的基础知识以及它的核心类库(collections,seri...
分类:
编程语言 时间:
2014-05-25 18:44:20
阅读次数:
268
MMapDirectory继承自FSDirectory,针对jre至今没解决的Mmap close不回收空间(直至full gc才回收)的bug,lucene用hack方式回收(仅对sun jam)(线上目前还是出现这个问题,是什么情况,得确认一下)。其中64位linux下chunk是1G,MMAP之后返回ByteBuffer数组,其IndexInput类是MMapIndexInput。
FSD...
分类:
其他好文 时间:
2014-05-25 18:17:00
阅读次数:
314
在实际应用中,数据库中的数据会有很多,若要从这些数据表中检索数据,就需要对系统进行优化,提高数据库系统的响应速度,下面就是日常一些查询优化的方法。
1.创建索引
索引可以提高数据库查询的速度,提高数据库的访问性能,但同时也会影响数据更新操作(例如插入、修改、删除)的速度。
如果WHERE子句中经常用到的某一列或者某几列创建索引...
分类:
数据库 时间:
2014-05-25 16:44:01
阅读次数:
315
所谓学习问题,是指观察由n个样本组成的集合,并根据这些数据来预测未知数据的性质。
学习任务(一个二分类问题):
区分一个普通的互联网检索Query是否具有某个垂直领域的意图。假设现在有一个O2O领域的垂直搜索引擎,专门为用户提供团购、优惠券的检索;同时存在一个通用的搜索引擎,比如百度,通用搜索引擎希望能够识别出一个Query是否具有O2O检索意图,如果有则调用O2O垂直搜索引擎,获取结...
分类:
编程语言 时间:
2014-05-25 13:34:47
阅读次数:
495
异步使用 HTTP
到现在,我们所关注的还只是通过 HTTP 一次检索一个文档,或进行一次更新,在这种情况下,使用异步编程模式就没什么意义了。然而,我们通常的想法是一次能进行多个 HTTP 请求,这样,就可以从多个源检索、汇总数据,在这种情况下,使用 F# 的异步工作流,我们第一次碰到是在第十章“异步编程”一节,就能极大提高应用程序的性能。事实上,我们可能还希望能得到比使用本地磁盘更高的性...
分类:
其他好文 时间:
2014-05-24 21:02:10
阅读次数:
313