页面树结构

2017-11-09 ApacheCN 开源组织,第二期邀请成员活动,一起走的更远 : http://www.apachecn.org/member/209.html


MachineLearning 优酷地址 : http://i.youku.com/apachecn

转至元数据结尾
转至元数据起始

porter_stem 类型的词元过滤器,根据波特干扰算法转换词元流。

请注意,Porter Stem 词元过滤器的输入必须已经是小写,所以您需要使用 Lower Case Token Filter or Lower Case Tokenizer 在之前的分词器链上,以使其正常工作!例如,使用自定义分词器时,请确保过滤器列表中的 lowercase 过滤器位于 porter_stem 过滤器之前