第28章　享元模式 · 设计模式之禅（第2版）

第28章　享元模式 28.1 内存溢出，司空见惯下午，我正在开会中，老大推门进来。 “三儿，出来一下。” 我刚出会议室门口，老大就发话了。 “郎当（姓朗，顺口就叫郎当）的那个报考系统又crash了一台机器，两天已经宕了4次了，你这边还有紧急的事情没有？……没有，那赶快过去顶一下，就运行三天的程序，两天宕了4次，还怎么玩？！” 我马上收拾东西，冲到马路上拦了出租车，同时打电话给郎当。 “三哥，厂商人员已经定位出了，OutOfMemory内存溢出，没查到有内存泄漏的情况，现在还在跟踪……是突然暴涨的，都是在繁忙期出现问题的……” 内存溢出对Java应用来说实在是太平常了，有以下两种可能。 ● 内存泄漏无意识的代码缺陷，导致内存泄漏，JVM不能获得连续的内存空间。 ● 对象太多代码写得很烂，产生的对象太多，内存被耗尽。现在的情况是没有内存泄漏，那只有一种原因——代码太差把内存耗尽。到现场后，郎当给我介绍了一下系统情况。该系统是一个报考系统，其中有一个模块负责社会人员报名，该模块对全国的考试人员只开放3天，并且限制报考人员数量。第一天9点开始报考，系统慢得像蜗牛，基本上都不能访问，后来设置了HTTP Server的并发数量，稍有缓解，40分钟后宕了一台机器，10分钟后，又挂了一台，下午3点又挂了一台，看样子晚上要让郎当去寺庙烧烧香了。该系统一共有8台应用服务器，基本上CPU繁忙程度都在60%以上，HTTP的最大并发是2000，平均分配到每台应用服务器上没有太大的压力，于是怀疑是代码问题，然后详细了解了一下业务和数据流逻辑，基本的业务操作过程清楚了，先登录（没有账号的，则要先注册），登录后，需要填写以下信息： ● 考试科目，选择框。 ● 考试地点，选择框，根据科目不同，列表不同。 ● 准考证邮寄地址，输入框。还有其他一堆信息，我们以这三者作为代表来讲解。信息填写完毕后，点击确认，报名就结束了。简单程序的业务逻辑也确实是这样，为什么出现Crash情况呢？那肯定是和压力有关系！我们先把这个过程的静态类图画出来，如图28-1所示。 ![](https://box.kancloud.cn/2016-08-14_57b0036bd75d3.jpg) 图28-1 报考系统类图很简单的工厂方法模式，表现层通过工厂方法模式创建对象，然后传递给业务层和持久层，最终保存到数据库中，为什么要使用工厂方法模式而不用直接new一个对象呢？因为是在框架下编程，必须有一个对象工厂（ObjectFactory,Spring也有对象工厂）。我们先来看报考信息，如代码清单28-1所示。代码清单28-1 报考信息 public class SignInfo { //报名人员的ID private String id; //考试地点 private String location; //考试科目 private String subject; //邮寄地址 private String postAddress; public String getId() { return id; } public void setId(String id) { this.id = id; } public String getLocation() { return location; } public void setLocation(String location) { this.location = location; } public String getSubject() { return subject; } public void setSubject(String subject) { this.subject = subject; } public String getPostAddress() { return postAddress; } public void setPostAddress(String postAddress) { this.postAddress = postAddress; } } 它是一个很简单的POJO对象（Plain Ordinary Java Object，简单Java对象）。我们再来看工厂类，如代码清单28-2所示。代码清单28-2 报考信息工厂 public class SignInfoFactory { //报名信息的对象工厂 public static SignInfo getSignInfo(){ return new SignInfo(); } } 工厂类就这么简单？非也，这是我们的教学代码，真实的ObjectFactory要复杂得多，主要是注入了部分Handler的管理。表现层是如何创建对象的，如代码清单28-3所示。代码清单28-3 场景类 public class Client { public static void main(String[] args) { //从工厂中获得一个对象 SignInfo signInfo = SignInfoFactory.getSignInfo(); //进行其他业务处理 } } 就这么简单，但是简单为什么会出现问题呢？而且这样写也没有问题呀，很标准的工厂方法模式，应该不会有大问题，然后又看了看系统厂商提供的分析报告，报告中指出：内存突然由800MB飙升到1.4GB，新的对象申请不到内存空间，于是出现OutOfMemory，同时报告中还列出宕机时刻内存中的对象，其中SignInfo类的对象就有400MB，疯子，绝对是疯子！报告都没有看嘛！问题找到了，我拉郎当过来谈话，“厂商不是分析出原因了嘛，人家已经指出SignInfo类的对象占用了400MB多的内存，这是怎么回事？” “三哥，这是很正常的，这么大的访问量，产生出这么多的SignInfo对象也是应该的，内存中有这么多对象并不表示这些对象正在被使用呀，估计很大一部分还没有被回收而已，垃圾回收器什么时候回收内存中的对象这是不确定的。你看，并发200多个，这可是并发数量……” 我想了想，也确实是这么回事。既然已经定位是内存中对象太多，那就应该想到使用一种共享的技术减少对象数量，那怎么共享呢？大家知道，对象池（Object Pool）的实现有很多开源工具，比如Apache的commons-pool就是一个非常不错的池工具，我们暂时还用不到这种重量级的工具，我们自己来设计一个共享对象池，需要实现如下两个功能。 ● 容器定义我们要定义一个池容器，在这个容器中容纳哪些对象。 ● 提供客户端访问的接口我们要提供一个接口供客户端访问，池中有可用对象时，可以直接从池中获得，否则建立一个新的对象，并放置到池中。设计思路有了，那我们池中对象的标准是什么呢？你想想看，如果你把所有的对象都放到池中，那还有什么意义？内存早就给你撑爆了！这么多对象，必然有一些相同的属性值，如几十万SignInfo对象中，考试科目就4个，考试地点也就是30多个，其他的属性则是每个对象都不相同的，我们把对象的相同属性提取出来，不同的属性在系统内进行赋值处理，是不是就可以建立一个池了？话无须多说，我们以类图来表示，如图28-2所示。 ![](https://box.kancloud.cn/2016-08-14_57b0036c0072a.jpg) 图28-2 增加对象池的类图做一个很小的改动，增加了一个子类，实现带缓冲池的对象建立，同时在工厂类上增加了一个容器对象HashMap，保存池中的所有对象。我们先来看产品子类，如代码清单28-4所示。代码清单28-4 带对象池的报考信息 public class SignInfo4Pool extends SignInfo { //定义一个对象池提取的KEY值 private String key; //构造函数获得相同标志 public SignInfo4Pool(String _key){ this.key = _key; } public String getKey() { return key; } public void setKey(String key) { this.key = key; } } 很简单，就是增加了一个key值，为什么要增加key值？为什么要使用子类，而不在SignInfo类上做修改？好，我来给你解释为什么要这样做，我们刚刚已经分析了所有的SignInfo对象都有一些共同的属性：考试科目和考试地点，我们把这些共性提取出来作为所有对象的外部状态，在这个对象池中一个具体的外部状态只有一个对象。按照这个设计，我们定义key值的标准为：考试科目+考试地点的复合字符串作为唯一的池对象标准，也就是说在对象池中，一个key值唯一对应一个对象。注意　在对象池中，对象一旦产生，必然有一个唯一的、可访问的状态标志该对象，而且池中的对象声明周期是由池容器决定，而不是由使用者决定的。你可能马上就要提出了，为什么不建立一个新的类，包含subject和location两个属性作为外部状态呢？嗯，这是一个办法，但不是最好的办法，有两个原因： ● 修改的工作量太大，增加的这个类由谁来创建呢？同时，SignInfo类是否也要修改呢？你不可能让两段相同的POJO程序同时出现在同一模块中吧！ ● 性能问题，我们会在扩展模块中讲解。说了这么多，我们还是继续来看程序，工厂类如代码清单28-5所示。代码清单28-5 带对象池的工厂类 public class SignInfoFactory { //池容器 private static HashMap<String,SignInfo> pool = new HashMap<String,SignInfo>(); //报名信息的对象工厂 @Deprecated public static SignInfo(){ return new SignInfo(); } //从池中获得对象 public static SignInfo getSignInfo(String key){ //设置返回对象 SignInfo result = null; //池中没有该对象，则建立，并放入池中 if(!pool.containsKey(key)){ System.out.println(key + "----建立对象，并放置到池中"); result = new SignInfo4Pool(key); pool.put(key, result); }else{ result = pool.get(key); System.out.println(key +"---直接从池中取得"); } return result; } } 方法都很简单，不多解释。读者需要注意一点的是@Deprecated注解，不要有删除投产中代码的念头，如果方法或类确实不再使用了，增加该注解，表示该方法或类已经过时，尽量不要再使用了，我们应该保持历史原貌，同时也有助于版本向下兼容，特别是在产品级研发中。我们再来看看客户端是如何调用的，如代码清单28-6所示。代码清单28-6 场景类 public class Client { public static void main(String[] args) { //初始化对象池 for(int i=0;i<4;i++){ String subject = "科目" + i; //初始化地址 for(int j=0;j<30;j++){ String key = subject + "考试地点"+j; SignInfoFactory.getSignInfo(key); } } SignInfo signInfo = SignInfoFactory.getSignInfo("科目1考试地点1"); } } 运行结果如下所示：科目3考试地点25----建立对象，并放置到池中科目3考试地点26----建立对象，并放置到池中科目3考试地点27----建立对象，并放置到池中科目3考试地点28----建立对象，并放置到池中科目3考试地点29----建立对象，并放置到池中科目1考试地点1---直接从池中取得前面还有很多的对象创建提示语句，不再复制。通过这样的改造后，我们想想内存中有多少个SignInfo对象？是的，最多120个对象，相比之前几万个SignInfo对象优化了非常多。细心的读者可能注意到了SignInfo4Pool类基本上没有跑出我们的视线范围，仅仅在工厂方法中使用到了，尽量缩小变更引起的风险，想想看我们的改动是不是很小，只要在展示层中拼一个字符串，然后传递到工厂方法中就可以了。通过这样的改造后，第三天系统运行得非常稳定，CPU占用率也下降了，而且以后再也没有出现类似问题，这就是享元模式的功劳。