看到探究 | Elasticsearch CPU高排查思路,其实和昨天说的思路一致,首先考虑的就是扩大内存。

但其中有一点,是:插入数据的时候,副本数设置为0。分片数不可以修改,副本数是可以修改的。注意:分片过多,会导致:堆内存压力大。

这点有点疑问,副本和分片有什么差异?[……]

阅读全文

本文衔接昨日的 ElasticSearch根据字段去重。

如果桶聚合时,不去重,那么会造成统计的数量和实际输出的数量对不上的情况。那么,如何在桶聚合中根据数据字段去重呢?

这个问题因为限定在ElasticSearch 5.3的版本,没办法用更新版本(6.8及以上)的cardin[……]

阅读全文

背景:已故前辈们设计的傻逼架构,造成比较奇葩的数据结构。比如一部相同code的电影,会有多个栏目code,用户组code对应的多条数据。然后索引就会出现冗余。
那这个架构咱不评价了,毕竟已经评价过了。就说下解决方案好了。

鉴于code不唯一了,所以多条数据冗余的情况,应当根据cod[……]

阅读全文

用ElasticSearch,一般都会自写一些特别需求的分析器(analyzer)吧,其中涉及到字符过滤器(character filter)、分词器(tokenizer)和过滤器(filter)的使用。
那么,这些涉及到的部分是如何在一次分析中执行的呢?顺序又是如何的呢?且看下文。[……]

阅读全文