Analyzer的三个组成部分

Analyzer的三个组成部分

Content #

Elasticsearch Analyzer是专门处理分词的组件,由哪三部分组成?

  1. Character Filters 针对原始文本处理,例如去除html标签
  2. Tokenizer 按照规则切分单词
  3. token Filter 将切分的单词进行加工、小写,删除stopwords,增加同义词

From #