前面一篇开始学习solr的时候,做了个入门的示例http://blog.csdn.net/zjc/article/details/24414271 。虽然可以检索出内容,但总和想象的结果有差异——比如,检索“天龙”两个字,按常规理解,就应该只出来《天龙八部》才对,可是竟然也会把《倚天屠龙记》检出来。后来研究了一下,发现系统是这样处理的:无论是抽索引时还是分析检索词时,都把所有文字按单字拆开。这样,...
分类:
其他好文 时间:
2014-05-26 06:11:39
阅读次数:
270
总结一下我遇到的问题:
1.设置最小分词长度分词
被搜索名字为:andy
这时搜索andy正常,但是搜索a就搜不到。
解决办法,在索引配置文件中的index中添加
min_infix_len = 1
2.调用API返回记录总是只有20条
因为coreseek它默认返回的result里面,function SetLimits ( $offset, $limit, $max_...
分类:
其他好文 时间:
2014-05-26 05:32:58
阅读次数:
266
在Java中,String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。
String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示,如
byte[] b_gbk = "中".getBytes("GBK");
byte[] b_utf8 = "中".getBytes("UTF-8");
...
分类:
其他好文 时间:
2014-05-26 05:04:23
阅读次数:
257
决解乱码费了我好些时间啊!
乱码原因有
1.mysql未设置为支持汉字
2.没有发送头信息
3.使用的编译器不符合相应的编码
决解的方法是
在mysql里
我用的是Wanmp Server
1.在mysql目录下找到my.ini,在[client]新增default-character-set=utf8
[client]
#password = your_passwor...
分类:
数据库 时间:
2014-05-26 04:39:31
阅读次数:
273
部分内容转自:http://blog.csdn.net/hguisu/article/details/8024799
一、 开源项目
1.Lucene全文检索系统
http://lucene.apache.org和 http://www.lucene.com.cn/
Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代...
分类:
Web程序 时间:
2014-05-26 04:36:55
阅读次数:
297
从昨天晚上还是叼coreseek,结果一直出现很奇怪的问题,结果晚上觉都没睡好。
在命令行下可以搜索成功,但一旦调用API以后,就会很奇怪的问题,无论是字段还是原来的属性都没出现过,出现的是以前的情况。索引建立也是成功的,端口也在监听,结果却一直有问题。在我们实验室大哥跟二哥合力一个多小时之下终于找到了问题。
在任务管理器下停止服务时,仍然可以调用API搜索,!!!说明searchd服务没有被...
分类:
其他好文 时间:
2014-05-26 03:12:00
阅读次数:
254
【A JAVA】
【B JavaEE】
【C Android】
【D 前端】
【E 大数据】
【F Oracle】
【G 云计算】
【H Linux】
【I 计算机基础】
【J PM ITIL SOA】
【K Others】
【S 搜索引擎】
【Z 方法、人文】...
分类:
其他好文 时间:
2014-05-24 21:44:27
阅读次数:
287
引 言
随着多媒体技术及[nternet技术的迅速发展,各行各业对图像的使用越来越广泛,图像信息资源的管理和检索显得越来越重要。传统的通过手工标记和索引图像(即基于文本的图像检索)的方法已经不能满足人们的需求,随之而来的问题是:随着图像数据的剧增和人们对图像的理解具有不同的侧重点,不同的人从不同的角度对同一幅图像的认识可能存在很大的差异性,因此无法准确反映图像...
分类:
其他好文 时间:
2014-05-24 18:07:11
阅读次数:
353
java021
file讲解:文件和目录路径名的抽象表示形式
IO流操作的是数据,而数据一般是以文件的表现形式。
File类:用来将文件或者文件夹封装成对象
方便对文件与文件夹的属性信息进行操作
file对象可以作为参数传递给流的构造函数
File类常见的方法:
1. 文件的创建:
boolean ...
分类:
其他好文 时间:
2014-05-24 18:06:16
阅读次数:
388
上午:老师首先回顾了昨天作业。
首先在安卓工程中的TOOLS文件中,解析字节流那里,不用改变,而是把服务器端的编码方式变为UTF-8,然后将在安卓工程的LoginActivity类中的USERNAME给他强制转换下。
总结一句话:如果一个字符通过某个编码转换成字节码之后,那你在转换的时候必须拿到转换之前的字节码
补充:如何改变mysql连接工具的编码方式:
jdbc:mys...
分类:
移动开发 时间:
2014-05-24 17:14:32
阅读次数:
365