word分词是一个Java实现的分布式中文分词组件 1、下载http://luke.googlecode.com/files/lukeall-4.0.0-ALPHA.jar(国内不能访问) 2、下载并解压Java中文分词组件word-1.0-bin.zip 3、?将解压后的 Java中文分词...
分类:
其他好文 时间:
2015-04-07 21:54:58
阅读次数:
157
using System;
using System.Windows.Forms;
using System.IO;
using System.Text.RegularExpressions;
using System.Collections;
using System.Collections.Generic;
using System.ComponentModel;
namespace HMM...
Sphinx中文入门指南wuhuiming,转载请注明来源和作者 最后修改:2010年1月23日1、简介1.1.Sphinx是什么1.2.Sphinx的特性1.3.Sphinx中文分词2、安装配置实例2.1 在GNU/Linux/unix系统上安装2.1.1 sphinx安装2.1.2.sfc安装(...
分类:
其他好文 时间:
2015-04-07 11:15:20
阅读次数:
292
本文记录Lucene+Paoding的使用方法图解:一、下载Lucene(官网:http://archive.apache.org/dist/lucene/java/)本文中使用的是:2.9.4,下载后解压,Lucene所需要的基本jar文件如下列表: lucene-core-2.9.4.jar L...
分类:
Web程序 时间:
2015-04-04 12:01:19
阅读次数:
147
elasticsearch官方只提供smartcn这个中文分词插件,效果不是很好,好在国内有medcl大神(国内最早研究es的人之一)写的两个中文分词插件,一个是ik的,一个是mmseg的,下面分别介绍ik的用法,当我们创建一个index(库db_news)时,easticsearch默认提供的分词...
分类:
其他好文 时间:
2015-04-03 19:17:11
阅读次数:
149
PHP+mysql数据库开发类似百度的搜索功能:中英文分词+全文检索中文分词:a) robbe PHP中文分词扩展: http://www.boyunjian.com/v/softd/robbe.html i. Robbe完整版本下载:Robbe完整版本(PHP测试程序, 开发帮助文档, W...
分类:
数据库 时间:
2015-03-18 13:55:08
阅读次数:
1039
中文分词实例3:分词(返回一个书包,以_0、_1、_2 ...取出分好的词)...
分类:
其他好文 时间:
2015-03-16 14:36:25
阅读次数:
114
返回以逗号隔开每个词带上引号的词组,gap=",",quotes="'"或quotes='"')...
分类:
其他好文 时间:
2015-03-15 12:26:20
阅读次数:
130
只需一行代码就实行中文+英文混合智能分词,相当轻松...
分类:
其他好文 时间:
2015-03-13 14:23:25
阅读次数:
116