码迷,mamicode.com
首页 > 其他好文 > 详细

15.1 自定义分词器

时间:2019-06-16 21:36:31      阅读:161      评论:0      收藏:0      [点我收藏+]

标签:hue   toe   res   rip   bbs   hspa   tdm   apn   sehll   

创建自定义分词器
技术图片技术图片
测试分词器
技术图片技术图片
DELETE /test_analyzer
PUT /test_analyzer
{
  "settings": {
    "analysis": {
      "char_filter": {
        "sign_to_word": {
          "type": "mapping",
          "mappings": ["&=> and","+=>add"]
        }
      },
      "filter": {
        "my_stopwords": {
          "type": "stop",
          "stopwords": ["the", "a", "her", "his"]
        }
      },
      "analyzer": {
        "my_analyzer": {
          "type": "custom",
          "char_filter": ["html_strip", "sign_to_word"],
          "tokenizer": "standard",
          "filter": ["lowercase", "my_stopwords"]
        }
      }
    }
  }
}
 
GET /test_analyzer/_analyze
{
  "text": "ruru is a her <a href/> HAHA!!!",
  "analyzer": "my_analyzer"
}

15.1 自定义分词器

标签:hue   toe   res   rip   bbs   hspa   tdm   apn   sehll   

原文地址:https://www.cnblogs.com/cc299/p/11032848.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!