Elasticsearch 解析器啊,不知道的时候会默认用自己的standard解析器进行。
但是呢,如果你需要按自己指定字符分词解析,是要自定义tokenizer分词器的,类型为:char_group,属性tokenize_on_chars为你要指定的字符串数组。
然后解析器的类型使用custom自定义,并指定tokenizer为自建分词器即可。
PHP的示例代码为:
$analysis['tokenizer']['testTokenizer']['type'] = 'char_group';
$analysis['tokenizer']['testTokenizer']['tokenize_on_chars'] = ['*'];
$analysis['analyzer']['testAnalyzer']['type'] = 'custom';
$analysis['analyzer']['testAnalyzer']['tokenizer'] = 'testTokenizer';
上述示例就是按字符*
进行强制分词。
参考资料
如您从本文得到了有价值的信息或帮助,请考虑扫描文末二维码捐赠和鼓励。
如本文对您有用,捐赠和留言 将是对我最好的支持~(捐赠可转为站内积分)
如愿意,请向朋友推荐本站,谢谢。
尊重他人劳动成果。转载请务必附上原文链接,我将感激不尽。
搜索大金刚国度,结果标题符合分词搜索条件的 【Switch-大金刚 热带寒流 游戏下载】却排在内容符合分词搜索条件的【Switch-尤卡莱莉与无妄巢穴 游戏下载】,搜索权重分配应该是有问题的。