引入jar包 zxing-2.3.0.jar、IKAnalyzer2012_u6.jar ZXingCode .java package com.util; import java.awt.BasicStroke; import java.awt.Color; import java.awt.Fon ...
分类:
编程语言 时间:
2020-05-12 12:05:04
阅读次数:
64
最近学习主题模型pLSA、LDA,就想拿来试试中文。首先就是找文本进行切词、去停用词等预处理,这里我找了开源工具IKAnalyzer2012,下载地址:(:(注意:这里尽量下载最新版本,我这里用的IKAnalyzer2012.zip 这本版本后来测试时发现bug,这里建议IKAnalyzer2012 ...
分类:
其他好文 时间:
2019-04-15 18:10:26
阅读次数:
278
IK Analyzer是基于lucene实现的分词开源框架,下载路径:http://code.google.com/p/ik-analyzer/downloads/list 需要在项目中引入: IKAnalyzer.cfg.xml IKAnalyzer2012.jar lucene-core-3.6 ...
分类:
其他好文 时间:
2018-05-23 14:56:13
阅读次数:
174
一、扩展停用词字典IK Analyzer默认的停用词词典为IKAnalyzer2012_u6/stopword.dic,这个停用词词典并不完整,只有30多个英文停用词。可以扩展停用词字典,新增ext_...
分类:
Web程序 时间:
2017-02-06 13:32:50
阅读次数:
254
一、配置IKAnalyzer中文分词器Solr版本5.2.1IKAnalyzer2012_u6.jar报错,用IKAnalyzer2012_FF_hf1.jar替换可解决解决lucene4.0与IKAnalyzer的冲突。解决Exceptioninthread"main"java.lang.VerifyError:classorg.wltea.analyzer.lucene.IKAnalyzeroverridesfinalmethodtokenStrea..
分类:
其他好文 时间:
2016-03-20 18:09:01
阅读次数:
1197
需要导入IK 对应的jar 包 IKAnalyzer2012.jar lucene-core-4.10.jarpublic static void main(String[] args) throws IOException { // String text="基于java语言开发的...
分类:
编程语言 时间:
2015-09-17 19:05:21
阅读次数:
175
在Solr中配置中文分词IKAnalyzer1、在配置文件schema.xml(位置{SOLR_HOME}/config/下),配置信息如下: 2、在IKAnalyzer相关的jar包(IKAnalyzer2012_u6.jar 本博客不提供下载)放在{SOLR_HOME}...
分类:
其他好文 时间:
2015-05-28 15:59:39
阅读次数:
218
最近,在做关于搜索方面的程序,查阅了许多了资料,写下了下面的代码,已作为后备 首先所需要的jar包:lucene-core-3.6.2.jar,lucene-memory-3.6.2.jar,lucene-highlighter-3.6.2.jar,lucene-analyzers-3.6.2.jarIKAnalyzer2012.jar
下载地址:http://download....
分类:
其他好文 时间:
2015-05-09 10:16:00
阅读次数:
103
配置的过程中出现了一些小问题,一下将详细讲下IK Analyzer的配置过程,配置非常的简单,但是首先主要你的Solr版本是哪个,如果是3.x版本的用IKAnalyzer2012_u6.zip如果是4.x版本的用IK Analyzer 2012FF_hf1.zip,一定要对应上,要不然会配置失败。以下是详细步骤:
1、下载IK Analyzer。
下载地址为:http://code.googl...
分类:
其他好文 时间:
2015-02-03 19:28:06
阅读次数:
223