页面树结构

2017-11-09 ApacheCN 开源组织,第二期邀请成员活动,一起走的更远 : http://www.apachecn.org/member/209.html


MachineLearning 优酷地址 : http://i.youku.com/apachecn

转至元数据结尾
转至元数据起始

简述

有几个词元过滤器可用于尝试规范某种语言的特殊字符。

阿拉伯

arabic_normalization

德语

german_normalization

印地语

hindi_normalization

印度

indic_normalization

库尔德语(Sorani)

sorani_normalization

波斯语

persian_normalization

斯堪的纳维亚文

scandinavian_normalizationscandinavian_folding

塞尔维亚

not-released-yet[serbian_normalization],

  • 无标签