一、IK简介 ElasticSearch(以下简称ES)默认的分词器是标准分词器Standard,如果直接使用在处理中文内容的搜索时,中文词语被分成了一个一个的汉字,因此引入中文分词器IK就能解决这个问题,同时用户可以配置自己的扩展字典、远程扩展字典等。 二、IK安装 1、首先前往GitHub下载安 ...
分类:
其他好文 时间:
2018-09-28 12:50:25
阅读次数:
181
直接在web.xml中配置即可 <filter><filter-name>characterEncodingFilter</filter-name> <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filte ...
分类:
其他好文 时间:
2018-08-28 18:53:08
阅读次数:
686
系统升级 换源 更新软件源和软件包 1. sudo apt update && sudo apt upgrade y 配置中文环境 1. 安装中文语言包 sudo apt install y language pack zh hans language pack zh hans base 2. 设置 ...
分类:
系统相关 时间:
2018-08-11 23:24:39
阅读次数:
250
全文检索技术 Lucene&Solr Part3 全文检索技术 Lucene&Solr Part3 1. 课程计划 1、 Solr配置中文分析器 a) Schema.xml的配置 b) 配置IKAnalyzer 2、 DataimportHandler插件 3、 Solrj的复杂查询 a) 后台复杂 ...
分类:
其他好文 时间:
2018-07-14 10:21:06
阅读次数:
177
1. 学习计划 1. Solr的安装及配置 a) Solr整合tomcat b) Solr后台管理功能介绍 c) 配置中文分析器 2. 使用Solr的后台管理索引库 a) 添加文档 b) 删除文档 c) 修改文档 d) 查询文档 3. 使用SolrJ管理索引库 a) 添加文档 b) 修改文档 c) ...
分类:
其他好文 时间:
2018-06-20 11:17:14
阅读次数:
221
这里谈论的还是CJK的解决办法,不过很简单,一步一步照做就是了。 这里的重点是中文字体配置(UTF8 编码)。 latex的中文字体配置一直是很令人头疼的。如果没有找对方法, 可能浪费了很多时间后还不一定能搞定。 这篇文章的对象是刚接触一点latex,知道怎么套用别人的英文模板,但不知道怎么配置中文 ...
分类:
其他好文 时间:
2018-06-09 15:31:59
阅读次数:
641
1. 初始myblog 项目地址:https://github.com/timscm/myblog 2. 启动项目 通过pycharm启动项目,进入调试模式: "D:\Program Files\JetBrains\PyCharm 2018.1.3\bin\runnerw.exe" C:\Pytho ...
分类:
移动开发 时间:
2018-06-03 23:31:55
阅读次数:
258
第一步下载分词器https://pan.baidu.com/s/1X8v65YZ4gIkNQXsXfSULBw 第二歩打开已经解压的ik分词器文件夹 将ik-analyzer-solr5-5.x.jar,IKAnalyzer.cfg.xml复制到 apache-tomcat-8.5.24\webap ...
分类:
其他好文 时间:
2018-04-21 17:41:42
阅读次数:
185
Linux提供了丰富的帮助手册,当你需要查看某个命令的参数时不必到处上网查找,只要man一下即可。但是对于新手,尤其英文不好,使用还是有困难,所以最好配置中文的man手册yum下载中文说明手册,包名称为man-pages-zh-CNyuminstallman-pages-zh-CN下载完成后,安装保存在/usr/share/man下为了区别原有的man命令,采用cman进行别名配置aliascma
分类:
其他好文 时间:
2018-04-14 23:32:43
阅读次数:
224
1. 下载或者编译 IK 分词器的 jar 包文件,然后放入 ...\apache-tomcat-8.5.16\webapps\solr\WEB-INF\lib\ 这个 lib 文件目录下; IK 分词器下载地址:http://download.csdn.net/download/qq_353185 ...
分类:
其他好文 时间:
2018-02-07 14:39:45
阅读次数:
110