Elasticsearch 按指定字符分词

请知悉：本文最近一次更新为 4年前，文中内容可能已经过时。

Elasticsearch 解析器啊，不知道的时候会默认用自己的standard解析器进行。

但是呢，如果你需要按自己指定字符分词解析，是要自定义tokenizer分词器的，类型为：char_group，属性tokenize_on_chars为你要指定的字符串数组。

然后解析器的类型使用custom自定义，并指定tokenizer为自建分词器即可。

PHP的示例代码为：

$analysis['tokenizer']['testTokenizer']['type']              = 'char_group';
$analysis['tokenizer']['testTokenizer']['tokenize_on_chars'] = ['*'];
$analysis['analyzer']['testAnalyzer']['type']                = 'custom';
$analysis['analyzer']['testAnalyzer']['tokenizer']           = 'testTokenizer';

上述示例就是按字符*进行强制分词。

参考资料

Character group tokenizer

如您从本文得到了有价值的信息或帮助，请考虑扫描下方二维码捐赠和鼓励。

捐赠赞

如本文对您有用，捐赠和留言 将是对我最好的支持~
如愿意，请向朋友推荐本站，谢谢。

尊重他人劳动成果。转载请务必附上原文链接，我将感激不尽。

M	T	W	T	F	S	S
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

时鹏亮的Blog

代码-工作经验-成长积累

Elasticsearch 按指定字符分词

参考资料

与《Elasticsearch 按指定字符分词》相关的博文：

5
留言

参考资料

与《Elasticsearch 按指定字符分词》相关的博文：

5 留言

5
留言