页面树结构

2017-11-09 ApacheCN 开源组织,第二期邀请成员活动,一起走的更远 : http://www.apachecn.org/member/209.html


MachineLearning 优酷地址 : http://i.youku.com/apachecn

转至元数据结尾
转至元数据起始

 

 

 

 

 

Elasticsearch内置有众多的分析器,可以在任何索引中使用,无需进一步配置:

Standard Analyzer(标准分析器)

standard(标准)分析器划分文本是通过词语来界定的,由Unicode文本分割算法定义。它删除大多数标点符号,将词语转换为小写,并支持删除停止词。

Simple Analyzer(简单分析器)

simple(简单)分析器每当遇到不是字母的字符时,将文本分割为词语。它将所有词语转换为小写。

Whitespace Analyzer(空白分析器)

whitespace(空白)分析器每当遇到任何空白字符时,都将文本划分为词语。它不会将词语转换为小写。

Stop Analyzer(停止分析器)

stop(停止)分析器类似simple(简单)分析器,也支持删除停用词。

Keyword Analyzer(关键字分析器)

keyword(关键字)分析器是一个noop(空)分析器,可以接受任何给定的文本,并输出与单个词语相同的文本。

Pattern Analyzer(模式分析器)

pattern(模式)分析器使用正则表达式将文本拆分为词语,它支持小写和停止字。

Language Analyzers(语言分析器)

Elasticsearch提供许多特定语言的分析器,例如english(英语)或french(法语)。

Fingerprint Analyzer(指纹分析器)

fingerprint(指纹)分析器是专门的分析器,可以创建用于重复检测的指纹。

Custom analyzers(定制分析器)

如果你没有找到适合你需求的分析器,则可以创建一个自定义分析器,结合适当的字符过滤器,分词器和词语过滤器。

原文链接 : https://www.elastic.co/guide/en/elasticsearch/reference/5.3/getting-started.html(修改该链接为官网对应的链接)

译文链接 : http://www.apache.wiki/display/Elasticsearch(修改该链接为 ApacheCN 对应的译文链接)

贡献者 : 曾少峰ApacheCNApache中文网

 

 

 

 

  • 无标签