1. Sphin x简介
1.1. 什么是全文检索
全文检索是指以文档的全部文本信息作为检索对象的一种信息检索技术 。检索的对象有可能是文章的标题,也有可能是文章的作者,也有可能是文章摘要或内容。
1.2. 介绍
Sphin x是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能 ,使得应用程序更...
分类:
其他好文 时间:
2014-05-23 07:36:05
阅读次数:
227
主要内容:对通用搜索引擎的查询推荐技术的方法、评价进行了总结
具体内容:
“查询推荐”的不同英文叫法:Query Suggestion、Term Suggestion、Query Recommendation、Query Substitution、Query Rewriting
查询推荐的任务:找出和用户查询相似的query,以便更好地表达用户查询意图,供用户便捷输入...
分类:
其他好文 时间:
2014-05-22 12:39:21
阅读次数:
251
1. ArrayList,Vector, LinkedList 的存储性能和特性
ArrayList 和 Vector 都是使用数组方式存储数据,此数组元素数大于实际存储的数据以便增加和插入元素,它们都允许直接按 序号索引元素,但是插入元素要涉及数组元素移动等内存操作,所以索引数据快而插入数据慢,Vector 由于使用了 synchroni zed 方法(线程安全),通常性能上较 ArrayLi...
分类:
移动开发 时间:
2014-05-22 11:18:21
阅读次数:
266
libsvm的函数调用方法 详解
本文地址: http://blog.csdn.net/caroline_wendy/article/details/26261173
需要加载(load)SVM的模型, 然后将结点转换为SVM的格式, 即索引(index)+数据(value)的形式;
释放SVM的model有专用的函数: svm_free_and_destroy_model, 否则容易内存泄露;
可以预测数据的概率, 则需...
分类:
其他好文 时间:
2014-05-22 10:52:57
阅读次数:
335
随着网络信息时代的发展,数据转换技术也在不断的飞速发展。人们可以通过计算机与互联网联接,从世界各地实时的接收和发送大量、最新的信息,但在信息交换的过程中存在着一个突出的问题,就是多种多样的数据格式,给信息的有效使用带来了障碍。所以在信息时代,如何以最便捷、最可靠、最有效的方式获取所需的信息是一个很大的困扰。如何让用户在必要的时刻快速简单的得到必要的数据--HYFsoft(北京红樱枫软件有限公司)的数据格式转换技术日益受到社会的瞩目。...
分类:
其他好文 时间:
2014-05-22 10:20:13
阅读次数:
270
MongoDB的日志增长的很快,/var所在的空间马上就占满了,即便换到另一个磁盘分区保存日志,日志还是增长的很快,磁盘眼看要告磬。有一个好办法,就是使用旋转日志。MongoDB的旋转日志有点怪,Linux下mongd服务接受一个kill -SGIUSR1命令后就立刻将当前日志文件重命名为带日期的文件,然后创建新的日志文件。不想一般的旋转日志,可以配置旋转策略。不过没关系,经过测试,发送该命令时不...
分类:
数据库 时间:
2014-05-22 07:47:22
阅读次数:
427
监控指标性能测试通常需要监控的指标包括:1.服务器Linux(包括CPU、Memory、Load、I/O)。2.数据库:1.Mysql 2.Oracle(缓存命中、索引、单条SQL性能、数据库线程数、数据池连接数)。3.中间件:1.Jboss 2. Apache ......
分类:
其他好文 时间:
2014-05-22 07:06:48
阅读次数:
340
最近有朋友问我有关网站被K的问题,其中有提到如何知道网站被K方面的。之后总结了六个方法,至于还有没有其他的方法,欢迎和我一起交流探讨。遭到搜索引擎惩罚的网站检测方法:
首先要明确的是,搜索引擎惩罚并不容易检测。网站一些关键词排名下降,流量下降,到底是因为被惩罚还是因为搜索引擎算法变动?或者有新的竞争对手加入进来?或者现有的竞争对手加强了SEO?还是因为外部链接权重降低?这些情况之间很难准确区...
分类:
Web程序 时间:
2014-05-22 06:29:38
阅读次数:
274
1、 索引介绍
索引是用于加速数据存取的数据对象,是对数据表中一个或多个列进行排序的结构。合理的使用索引可以大大降低I/O次数,从而提高数据访问性能。
2、 问题:为什么需要索引?
Select * from scott.emp where empno=’8379’ --遍历emp表?
制约程序规模增大的两个瓶颈:网络和数据库,需要用更好的方式组织、管理数据。
3、 索引分类
? 按索引列个数...
分类:
数据库 时间:
2014-05-22 06:25:09
阅读次数:
346
用QT也已经三四年了,今天从QT的tools中看到qtclucene,原来这个就是从clucene移植过来的一个全文检索工具,用在QTHelp中。
下面是clucene的说明:
CLucene是Lucene的一个C++移植,Lucene是一个基于java的高性能的全文搜索引擎。CLucene因为使用C++编写,所以理论上要比lucene快。[1]
Lucene不是一个完整的全文索...
分类:
其他好文 时间:
2014-05-20 17:17:03
阅读次数:
300