2017 December 26 es

ES（六）Finite State Transducers

在项目中，有大量的结构化的数据，大概10亿条左右，用Hbase，二级索引太麻烦，而且查询条件的组合非常多，大概有10个字段，任意几个字段都能自由组合，如果自己维护很多二级索引，会非常麻烦。然后，项目中就采用了ES，ES每列都自带倒排索引，但写查询语句的时候要注意term过滤的先后次序，一般区别度最大的字段在前面，尽快过滤掉更多的数据。

问题来了，从数据库的角度看，这ES虽然每个列都有倒排索引，但也是单一列上的索引，如果一个复杂的查询，涉及到假设7个字段，而且这个查询非常频繁，即使语句优化的再好，难道比有多字段的联合索引的数据库更快么？比如在7个字段上建立了联合索引的MongoDB或者Mysql。没有找到理论的依据，但是从直观判断上，如果不考虑内存问题，肯定时不如有联合索引的MongoDB来的快啊。

以上比较，其实有点牵强，ES擅长的是全文索引，只拿精确的匹配来比较其实并不公平。

那不涉及全文索引，在有大量集群节点环境下，数据量较大的情况下，这种精确的查询命中条数较多的情况下，ES的性能是可能超过Mysql或Mongodb的。这里说了很多的限制条件，实际情况中，可能并不是需要所有条件都要。下面简单分析下。

先看下，在有索引，返回多条数据的情况。Mongodb都干了啥，首先要知道，这种二级索引，如果shards是按照hash进行的，那么按照二级索引查询，是不知道在哪个shard的，是需要广播到所有的shard上的，然后所有的查询返回到汇总的处理节点，然后排序后返回给客户端。

其实ES也非常像，只不过没有专门的二级索引，只不过是一个Node上有多个shard，也是需要汇总结果，只不过没有二级索引，需要把各个条件的聚合的结果进行求交集操作。

像Mysql、MongoDB、ES这种，其实都是数据存储系统，要想速度快，除了分片，加副本等方式，最重要的就是尽量少的IO，尽量少的磁盘IO，B+Tree也是为了适合磁盘检索而设计的。较少IO的一个方式就是尽量少的表扫描，最好有索引，直接找到数据在磁盘上的位置，直接访问，所以，对于MySQL和MongoDB，合理的索引是非常关键的。但这又有一个问题，索引是一颗树，而且在数据量大的情况下，是一颗大树。

典型的B+Tree，理想情况下，树高为3，根节点常驻内存，理想情况，需要两次IO，能定位出在磁盘上的大概位置。但是，以上都是在数据规模相对不大的情况下，如果数据量特别大，要么，树特别高，要么一个节点中存放的数据特别多。树高了，IO次数就多了，节点中数据多了，从前到后的遍历节点中的数据也是需要花时间的，特别是在高并发的情况下，影响应该很明显。而且一个非常重要的是，数据量特别多，想提高效率，那么索引树要尽量的常驻在内存，但是内存这个时候，很可能就是个问题，频繁的读取索引树，也增加了IO的次数。

那么ES是如何处理的呢？通过上面的分析，可以看出，索引树变大，无法常驻内存，会大大降低效率。而ES，使用了这FST结构，这结构如下：

引用lucene作者文中的一句话：

Essentially, an FST is a SortedMap<ByteSequence,SomeOutput>, if the arcs are in sorted order. With the right representation, it requires far less RAM than other SortedMap implementations, but has a higher CPU cost during lookup. The low memory footprint is vital for Lucene since an index can easily have many millions (sometimes, billions!) of unique terms.

这东西看上去像前缀索引，很多的词，都会有公共的前缀，尤其是字母型的语言如英语，尤其是海量的数据的时候，如果使用这FST的结构，可以大大减少内存，然后这结构（相当于以前的B树索引）就能常驻内存，当然是有代价的，就是CPU使用率变高了，但是一般的数据检索系统，CPU一般是有剩余的。从机器的整体使用上看，这样能够发挥一个机器更多的综合性能，而不是IO满了，CPU还在空闲的状态。

这种拿CPU获取内存的思路，还是第一次用到，可能也是lucene的一个设计理念，与ceph很像，尽量可能利用机器所有的硬件。

Using Finite State Transducers in Lucene
Lucene学习总结之三：Lucene的索引文件格式 (1)
Lucene’s RAM usage for searching
Apache Lucene - Index File Formats
Choosing a fast unique identifier (UUID) for Lucene