在创建索引库的基础上,加上中文分词器的,更好的支持中文的查询。引入jar包je-analysis-1.5.3.jar,极易分词.还是先看目录。
建立一个分词器的包,analyzer,准备一个AnalyzerTest的类.里面的代码如下,主要写了一个testAnalyzer的方法,测试多种分词器对于中文和英文的分词;为了可以看到效果,所以写了个analyze()的方法,将...
分类:
Web程序 时间:
2014-12-31 13:05:16
阅读次数:
244
搜集了一些资料,与同学一起进行了简单的測试,总结例如以下。分词工具特点支持语言原理词典及扩展性StandardAnalyzer中文、英文(unicode)中文:单字符切分英文:依据空格切分ChineseAnalyzer中文,不支持中文和英文及数字混合的文本分词按字分词,与StandardAnalyz...
分类:
其他好文 时间:
2014-12-26 12:57:08
阅读次数:
142
Eclipse中设置编码的方式如果要使插件开发应用能有更好的国际化支持,能够最大程度的支持中文输出,则最好使 Java文件使用UTF-8编码。然而,Eclipse工作空间(workspace)的缺省字符编码是操作系统缺省的编码,简体中文操作系统(Windows XP、Windows 2000简体中文...
分类:
系统相关 时间:
2014-12-25 18:17:15
阅读次数:
181
1.在JSP页面中出现中文乱码
要在在JSP页面中输出中文,要设置页面的编码方式。如果不设置,默认是ISO-8859-1,这样,中文就会出现乱码。解决方法是在JSP页面中加入page指令,设置页面编码pageEncoding支持中文字符,例如GBK或者UTF-8。但要注意的是,在保存文件时的编码要和这里设置的pageEncoding一致。
示例:
解决JS...
分类:
其他好文 时间:
2014-12-24 21:36:07
阅读次数:
189
如果要使插件开发应用能有更好的国际化支持,能够最大程度的支持中文输出,则最好使Java文件使用UTF-8编码。然而,Eclipse工作空间(workspace)的缺省字符编码是操作系统缺省的编码,简体中文操作系统(WindowsXP、Windows2000简体中文)的缺省编码是GB18030,在此工作空间中建立..
分类:
系统相关 时间:
2014-12-19 19:19:07
阅读次数:
189
让sublime text2支持中文 安装Sublime Package Control 在Sublime Text 2上用Ctrl+~打开控制台并在里面输入以下代码,Sublime Text 2就会自动安装Package Control import urllib2,os; pf='Package...
分类:
其他好文 时间:
2014-12-17 20:29:34
阅读次数:
263
1、首先编译安装Wine为了让Wine能更好的支持中文,编译之前最好修改/dlls/gdi32/freetype.c文件GetObjectW(hfont,sizeof(lf),&lf);lf.lfWidth=abs(lf.lfWidth);+lf.lfCharSet=GetTextCharset(dc);//增加这一条can_use_bitmap=GetDeviceCaps(dev->hdc,TEXTCAPS)&TC_R..
公司有个项目是准备基于jeesite再做开发,于是学习一下该框架。因为第一次接触java项目,部署的过程中也遇到一些问题。主要步骤还是按照开发文档一步一步来,但是到了数据导入时,报错了,发现是mysql默认安装编码不支持中文,需要修改编码为utf-8但是,发现修改编码后仍然报错,这是因为mysql修...
分类:
数据库 时间:
2014-12-16 11:17:33
阅读次数:
533