合规国际互联网加速 OSASE为企业客户提供高速稳定SD-WAN国际加速解决方案。 广告
### 1 奇怪的现象 在使用Hazelcast的Eviction时,发现观察到的现象与想象的不同。按照官方文档介绍,Eviction有这样几个配置选项: ~~~ <hazelcast> <map name="default">    ...    <time-to-live-seconds>0</time-to-live-seconds>    <max-idle-seconds>0</max-idle-seconds>    <eviction-policy>LRU</eviction-policy>    <max-size policy="PER_NODE">5000</max-size>    <eviction-percentage>25</eviction-percentage>    ... </map> </hazelcast> ~~~ 看后三项,按照参数的描述应为:当每个结点的entry数达到5000时,使用LRU策略,剔除25%的entry,即1250个。可是观察到的现象一般是entry数达到4200左右就止步不前,继续大量高并发的insert测试,既不会增长也不会减少。这是怎么回事?而且相比Redis,Hazelcast在达到eviction临界条件后继续并发插入和读写时,性能表现依旧良好,就像没有发生eviction一样。是使用了多线程还是什么神奇的算法?源码之前,了无秘密,还是从代码中寻找答案吧。 ### 2 代码剖析 我们客户端使用的,也是最顶层的API,就是IMap了,这里以比put()更为高效的set()作为分析的起点。后面其实能够看到,因为使用了命令模式(command),两者都是继承一个父类,evict都是在一个地方触发的。 ### 2.1 MapProxyImpl包装器 IMap的直接实现类是MapProxyImpl,但它只是个Wrapper,负责转换key和value。 ![](https://box.kancloud.cn/2016-08-31_57c6b13ed4dc3.jpg) ### 2.2 MapProxySupport封装命令对象 真正的实现都是在它继承的MapProxySupport类中,例如set()调用的setInternal()就能在Support类中找到。各种internal方法将操作包装成Operation类,这方便了远程调用的实现,例如set()要执行的结点不在本地。 ![](https://box.kancloud.cn/2016-08-31_57c6b13eea968.jpg) ### 2.3 SetOperation命令模式 invokeOperation()中会确定操作应该在哪个分区执行,这个分区位于哪个结点上。这里Hazelcast维护了一个线程池,每个分区都有对应的线程去执行本分区的操作。因为过程比较复杂,所以这里直接略过,继续关注我们重点想知道的eviction过程的实现。那么直接看一下SetOperation中的逻辑。SetOperation很简单,直接调用RecordStore保存键值对,但afterRun()中有一些隐含的后处理。 ![](https://box.kancloud.cn/2016-08-31_57c6b13f0b9a5.jpg) ### 2.4 BasePutOperation触发eviction 果然,在afterRun()中除了广播事件、使Near缓存失效外,还有触发eviction过程。Evict()调用的就是RecordStore的evictEntries()方法。 ![](https://box.kancloud.cn/2016-08-31_57c6b13f1e69e.jpg) ### 2.5 AbstractEvictableRecordStore控制eviction 真正的evict控制逻辑就在这里。首先,shouldEvict()会判断是否满足了我们之前配置的eviction的触发条件,如PER_NODE=5000。如果满足则调用removeEvictableRecords()开始剔除数据。 ![](https://box.kancloud.cn/2016-08-31_57c6b13f3420a.jpg) ### 2.6 EvictionOperator事有蹊跷 最终removeEvictableRecords调用的是EvictionOperator,具体的实现都在这里。但仔细看这段代码却看不出有什么高明之处,只是简单地迭代RecordStore的记录,将满足条件的entry剔除掉。既没用多线程,也没什么特殊的算法,这到底是怎么回事? ![](https://box.kancloud.cn/2016-08-31_57c6b13f49286.jpg) ### 2.7 答案揭晓 谜底其实就在Operation类对应的RecordStore初始化上。我们知道,默认情况下,Hazelcast将map分为271个partition。其实RecordStore也是按这些partition划分的,而不是使用一个大的RecordStore。所以从BasePutOperation的evict()到后续处理的都只是当前key对应分区的RecordStore。也就是说:当key要被处理时,Eviction发生在对应的partition里,而不会evict所有数据的25%(Redis就是处理database中的所有数据,所以延迟会有所增加)。所以,当我们继续压力测试时,不断有key继续插入,这些分区就会不断发生eviction,导致整体的内存使用会保持不变。 ![](https://box.kancloud.cn/2016-08-31_57c6b13f6589e.jpg) ### 3 类图全貌 梳理了上面的执行流程后,我们最后整理一下这些类之间的关系。 ![](https://box.kancloud.cn/2016-08-31_57c6b13f78ac8.jpg)