码迷,mamicode.com
首页 >  
搜索关键字:elasticsearch ik 中文分词    ( 5835个结果
分布式搜索elasticsearch 环境搭建
1、elasticsearch安装 elasticsearch的安装超级easy,解压即用(要事先安装好java环境)。 到官网 http://www.elasticsearch.org下载最新版的 elasticsearch 运行包; 下载完解开有三个包: bin 是运行的脚本, config 是设置文件, lib 是放依赖的包。 plugins 的文件夹,把插件放到这个文件夹...
分类:其他好文   时间:2014-10-14 15:32:28    阅读次数:191
分布式搜索elasticsearch 基本概念
ElasticSearch官网:http://www.elasticsearch.org/ 先上一张elasticsearch的总体框架图: ElasticSearch是基于Lucene开发的分布式搜索框架,包含如下特性: 分布式索引、搜索 索引自动分片、负载均衡 自动发现机器、组建集群 支持Restful 风格接口 配置简单等。 下图是ElasticSearc...
分类:其他好文   时间:2014-10-14 14:42:48    阅读次数:217
explore your hadoop data and get real-time results
explore your hadoop data and get real-time results 深度api集成使你大数据访问更加容易...
分类:其他好文   时间:2014-10-13 14:03:19    阅读次数:271
Choosing Between ElasticSearch, MongoDB & Hadoop
Choosing Between ElasticSearch, MongoDB & Hadoop...
分类:数据库   时间:2014-10-13 11:58:20    阅读次数:416
PHP中文分词扩展 SCWS
SCWS是一套基于词频词典的机械式中文分词引擎,它能将一整段的中文文本基本正确地切分成词。 词是中文的最小语素单位,但在书写时并不像英语会在词之间用空格分开, 所以如何准确并快速分词一直是中文分词的攻关难点,但是如何通过SCWS实现呢?...
分类:Web程序   时间:2014-10-11 00:49:54    阅读次数:355
logstash启动报错 Exception in thread ">output" org.elasticsearch.discovery.MasterNotDiscoveredException: waited for [30s]
部署ELK时候,logstash启动报错Sending logstash logs to /var/log/logstash.log.Exception in thread ">output" org.elasticsearch.discovery.MasterNotDiscoveredExcept...
分类:其他好文   时间:2014-10-10 11:35:24    阅读次数:397
kibana显示elasticsearch集群中flume到入的日志
elasticsearch kibana3安装...
分类:其他好文   时间:2014-10-09 17:29:58    阅读次数:221
flume 日志导入elasticsearch
Flume配置 。 flume生成的数据结构 "_index" : "logstash-2013.01.07", "_type" : "tms_jboss_syslog", "_id" : "a_M9X_0YSpmE7A_bEzIFiw", "_score" : 1.0, "_source" : {"@source":"file://localhost.localdomain/tmp...
分类:其他好文   时间:2014-10-09 17:03:48    阅读次数:290
CentOS 设置 Elasticsearch 只允许内网访问
vi /etc/sysconfig/iptables添加以下代码即可,设置内网网段iptables -A INPUT -p tcp --dport 9200 ! -s 127.0.0.1 -j DROP-----------------------------------------
分类:其他好文   时间:2014-10-05 14:58:38    阅读次数:270
(3.1)用ictclas4j进行中文分词,并去除停用词
酒店评论情感分析系统——用ictclas4j进行中文分词,并去除停用词 ictclas4j是中科院计算所开发的中文分词工具ICTCLAS的Java版本,因其分词准确率较高,而备受青睐。1. 下载ictclas4j 后面的附件中,我有放上ictclas4j的源码包ictclas4j.zip2. ...
分类:其他好文   时间:2014-10-03 22:56:25    阅读次数:532
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!