1、有关PHP字符串的说法,不对的是: A.如果一个脚本的编码是 ISO-8859-1,则其中的字符串也会被编码为 ISO-8859-1。 B.substr()、strpos()、strlen()、htmlentities() 处理字符串时依据的编码方式是相同的。 C....
分类:
Web程序 时间:
2014-11-21 12:51:21
阅读次数:
290
需要的jar包:
org.apache.lucene
lucene-core
${lucene-version}
org.apache.lucene
lucene-analyzers-common
${lucene-version}
org.apache.lucene
lucene-queryparser
${...
分类:
Web程序 时间:
2014-11-21 12:39:09
阅读次数:
205
集成 PHP 应用和 Solr 搜索引擎您的评价:收藏该经验你为什么需要搜索引擎?单纯数据库不够用?如果你只是创建小网站,数据库就够了。但当你创建中性或大型应用的时候,搜索引擎是更明智的选择。当然如是一说,小网站也可以利用Solr,获得高相关性的搜索结果。想象一下你在写一个电子商务网站的搜索查询程序...
分类:
Web程序 时间:
2014-11-20 23:28:58
阅读次数:
437
1、常用的压缩算法 1)snappy是Google的一个快速压缩和解压数据的库,使用C++编写。它的目标不是最大限度的压缩,也不是与其它压缩库兼容。snappy旨在提供非常高的压缩速度和合理的压缩率。64位模式下,使用单个Core i7处理器内核,压缩和解压速度可分别达到250MB/s和500...
分类:
其他好文 时间:
2014-11-20 00:01:23
阅读次数:
374
在较复杂的lucene搜索业务场景下,直接网上下载一个作为项目的分词器,是不够的。那么怎么去评定一个中文分词器的好与差:一般来讲,有两个点;词库和搜索效率,也就是算法。
lucene的倒排列表中,不同的分词单元有不同的PositionIncrementAttribute,如果两个词有着相同位置属性,比如:我定义美国和中国这两个词在倒排列表中是同一个位置,那么搜索美国的话,中国也能出来。这就是同义词搜索原理。
以下代码(用mmseg的 Tokenizer 去切词之后,然后再做同义词):
先自定义...
分类:
Web程序 时间:
2014-11-19 18:47:09
阅读次数:
265
一、安装虚拟机 Solr 必须运行在Java1.6 或更高版本的Java 虚拟机中,运行标准Solr 服务只需要安装JRE 即可,但如果需要扩展功能或编译源码则需要下载JDK 来完成。可以通过下面的地址下载所需JDK 或JRE : OpenJDK ( http://java.sun.com/j...
分类:
其他好文 时间:
2014-11-19 12:25:16
阅读次数:
291
Solr配置与简单Demo简介:solr是基于Lucene Java搜索库的企业级全文搜索引擎,目前是apache的一个项目。它的官方网址在http://lucene.apache.org/solr/。solr需要运行在一个servlet容器里,例如tomcat。solr在lucene的上层提供了一...
分类:
其他好文 时间:
2014-11-19 10:49:24
阅读次数:
118
一、什么是solr 首先,要了解下Solr是什么,以下是官方的描述。 Solr是一个来自Apache Lucence项目,是一个热门开源的企业级搜索平台。为目前世界上相当多的大型互联网站点提供搜索和导航服务。 [http://wiki.apache.org/solr/] Solr使用Ja...
分类:
其他好文 时间:
2014-11-19 10:45:45
阅读次数:
191
客户端开发 Solrj客户端开发SolrjSolr是搭建好的lucene服务器当然不可能完全满足一般的业务需求可能要针对各种的架构和业务调整这里就需要用到Solrj了Solrj是Solr提供的api库可以进行Solr的二次开发。主要实现原理服务端利用httpClient发送Solr格式的HTTP请求...
分类:
其他好文 时间:
2014-11-19 10:41:41
阅读次数:
313
Apache Solr查询语法查询参数常用:q - 查询字符串,必须的。fl - 指定返回那些字段内容,用逗号或空格分隔多个。start - 返回第一条记录在完整找到结果中的偏移位置,0开始,一般分页用。rows - 指定返回结果最多有多少条记录,配合start来实现分页。sort - 排序,格式:...
分类:
其他好文 时间:
2014-11-19 10:39:27
阅读次数:
323