企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
# 第2章 深入理解Java Binder和MessageQueue 本章主要内容: + 介绍Binder系统的Java层框架 + 介绍MessageQueue 本章所涉及的源代码文件名及位置: + IBinder.java frameworks/base/core/java/android/os/IBinder.java + Binder.java frameworks/base/core/java/android/os/Binder.java + BinderInternal.java frameworks/base/core/java/com/android/intenal/os/BinderInternal.java + android_util_Binder.cpp frameworks/base/core/jni/android_util_Binder.cpp + SystemServer.java frameworks/base/services/java/com/android/servers/SystemServer.java + ActivityManagerService.java frameworks/base/services/java/com/android/servers/ActivityManagerService.java + ServiceManager.java frameworks/base/core/java/android/os/ServiceManager.java + ServcieManagerNative.java frameworks/base/core/java/android/os/ServcieManagerNative.java + MessageQueue.java frameworks/base/core/java/android/os/MessageQueue.java + android_os_MessageQueue.cpp frameworks/base/core/jni/android_os_MessageQueue.cpp + Looper.cpp frameworks/base/native/android/Looper.cpp + Looper.h frameworks/base/include/utils/Looper.h + android_app_NativeActivity.cpp frameworks/base/core/jni/android_app_NativeActivity.cpp ## 2.1 概述 由于本书所介绍的内容主要是以Java层的系统服务为主,因此Binder相关的应用在本书中比比皆是。而MessageQueue作为Android中重要的任务调度工具,它的使用也是随处可见。所以本书有必要对这两个工具有所介绍。根据邓凡平的同意与推荐,本章由卷II第2章升级到4.2.2而来,并且增加了对AIDL相关的知识点的分析。 以本章作为本书Android分析之旅的开篇,将重点关注两个基础知识点,它们是: + Binder系统在Java世界是如何布局和工作的。 + MessageQueue的新职责。 先来分析Java层中的Binder。 建议 读者先阅读《深入理解Android:卷I》(以下简称“卷I”)的第6章“深入理解Binder”。网上有样章可下载。 ## 2.2 Java层中的Binder分析 ### 2.2.1 Binder架构总览 如果读者读过卷I第6章“深入理解Binder”,相信就不会对Binder架构中代表Client的Bp端及代表Server的Bn端感到陌生。Java层中Binder实际上也是一个C/S架构,而且其在类的命名上尽量保持与Native层一致,因此可认为,Java层的Binder架构是Native层Binder架构的一个镜像。Java层的Binder架构中的成员如图2-1所示。 ![](https://box.kancloud.cn/2016-03-01_56d567b12c31b.png) 图 2 - 1 Java层中的Binder家族 由图2-1可知: + 系统定义了一个IBinder接口类以及DeathRecepient接口。 + Binder类和BinderProxy类分别实现了IBinder接口。其中Binder类作为服务端的Bn的代表,而BinderProxy作为客户端的Bp的代表。 + 系统中还定义一个BinderInternal类。该类是一个仅供Binder框架使用的类。它内部有一个GcWatcher类,该类专门用于处理和Binder相关的垃圾回收。 + Java层同样提供一个用于承载通信数据的Parcel类。 注意 IBinder接口类中定义了一个叫FLAG_ONEWAY的整型,该变量的意义非常重要。当客户端利用Binder机制发起一个跨进程的函数调用时,调用方(即客户端)一般会阻塞,直到服务端返回结果。这种方式和普通的函数调用是一样的。但是在调用Binder函数时,在指明了FLAG_ONEWAY标志后,调用方只要把请求发送到Binder驱动即可返回,而不用等待服务端的结果,这就是一种所谓的非阻塞方式。在Native层中,涉及的Binder调用基本都是阻塞的,但是在Java层的framework中,使用FLAG_ONEWAY进行Binder调用的情况非常多,以后经常会碰到。 思考 使用FLAG_ONEWAY进行函数调用的程序在设计上有什么特点?这里简单分析一下:对于使用FLAG_ONEWAY的函数来说,客户端仅向服务端发出了请求,但是并不能确定服务端是否处理了该请求。所以,客户端一般会向服务端注册一个回调(同样是跨进程的Binder调用),一旦服务端处理了该请求,就会调用此回调来通知客户端处理结果。当然,这种回调函数也大多采用FLAG_ONEWAY的方式。 ### 2.2.2 初始化Java层Binder框架 虽然Java层Binder系统是Native层Binder系统的一个Mirror,但这个Mirror终归还需借助Native层Binder系统来开展工作,即Mirror和Native层Binder有着千丝万缕的关系,一定要在Java层Binder正式工作之前建立这种关系。下面分析Java层Binder框架是如何初始化的。 在Android系统中,在Java初创时期,系统会提前注册一些JNI函数,其中有一个函数专门负责搭建Java Binder和Native Binder交互关系,该函数是register_android_os_Binder,代码如下: ``` [android_util_Binder.cpp-->register_android_os_Binder()] int register_android_os_Binder(JNIEnv* env) {     // 初始化Java Binder类和Native层的关系     if(int_register_android_os_Binder(env) < 0)        return -1;     // 初始化Java BinderInternal类和Native层的关系     if(int_register_android_os_BinderInternal(env) < 0)        return -1;     // 初始化Java BinderProxy类和Native层的关系     if(int_register_android_os_BinderProxy(env) < 0)        return -1;     ......     return0; } ``` 据上面的代码可知,register_android_os_Binder函数完成了Java Binder架构中最重要的3个类的初始化工作。 #### 1\. Binder类的初始化 int_register_android_os_Binder函数完成了Binder类的初始化工作,代码如下: ``` [android_util_Binder.cpp-->int_register_android_os_Binder()] static int int_register_android_os_Binder(JNIEnv*env) {     jclassclazz;    //kBinderPathName为Java层中Binder类的全路径名,“android/os/Binder“     clazz =env->FindClass(kBinderPathName);     /*gBinderOffSets是一个静态类对象,它专门保存Binder类的一些在JNI层中使用的信息,       如成员函数execTranscat的methodID,Binder类中成员mObject的fildID */    gBinderOffsets.mClass = (jclass) env->NewGlobalRef(clazz);    gBinderOffsets.mExecTransact                      =env->GetMethodID(clazz, "execTransact", "(IIII)Z");    gBinderOffsets.mObject                      =env->GetFieldID(clazz, "mObject", "I");     // 注册Binder类中native函数的实现     returnAndroidRuntime::registerNativeMethods(                             env,kBinderPathName,                             gBinderMethods,NELEM(gBinderMethods)); } ``` 从上面代码可知,gBinderOffsets对象保存了和Binder类相关的某些在JNI层中使用的信息。它们将用来在JNI层对Java层的Binder对象进行操作。execTransact()函数以及mObject成员的用途将在2.2.3节介绍。 建议 如果读者对JNI不是很清楚,可参阅卷I第2章“深入理解JNI”。 #### 2\. BinderInternal类的初始化 下一个初始化的类是BinderInternal,其代码在int_register_android_os_BinderInternal函数中。 ``` [android_util_Binder.cpp-->int_register_android_os_BinderInternal()] static intint_register_android_os_BinderInternal(JNIEnv* env) {    jclassclazz;    // 根据BinderInternal的全路径名找到代表该类的jclass对象。全路径名为    //“com/android/internal/os/BinderInternal”    clazz =env->FindClass(kBinderInternalPathName);   //gBinderInternalOffsets也是一个静态对象,用来保存BinderInternal类的一些信息   gBinderInternalOffsets.mClass = (jclass) env->NewGlobalRef(clazz);    // 获取forceBinderGc的methodID   gBinderInternalOffsets.mForceGc                 = env->GetStaticMethodID(clazz, "forceBinderGc","()V");    // 注册BinderInternal类中native函数的实现    returnAndroidRuntime::registerNativeMethods(                          env,kBinderInternalPathName,                         gBinderInternalMethods, NELEM(gBinderInternalMethods)); } ``` int_register_android_os_BinderInternal的工作内容和int_register_android_os_Binder的工作内容类似: + 获取一些有用的methodID和fieldID。这表明JNI层一定会向上调用Java层的函数。 + 注册相关类中native函数的实现。 #### 3\. BinderProxy类的初始化 int_register_android_os_BinderProxy完成了BinderProxy类的初始化工作,代码稍显复杂,如下所示: ``` [android_util_Binder.cpp-->int_register_android_os_BinderProxy()] static intint_register_android_os_BinderProxy(JNIEnv* env) {     jclassclazz;     // **① gWeakReferenceOffsets用来和WeakReference类打交道**     clazz =env->FindClass("java/lang/ref/WeakReference");    gWeakReferenceOffsets.mClass = (jclass) env->NewGlobalRef(clazz);     // 获取WeakReference类get函数的MethodID    gWeakReferenceOffsets.mGet= env->GetMethodID(clazz, "get",                                    "()Ljava/lang/Object;");     // **② gErrorOffsets用来和Error类打交道**     clazz =env->FindClass("java/lang/Error");    gErrorOffsets.mClass = (jclass) env->NewGlobalRef(clazz);     // **③ gBinderProxyOffsets用来和BinderProxy类打交道**     clazz =env->FindClass(kBinderProxyPathName);    gBinderProxyOffsets.mClass = (jclass) env->NewGlobalRef(clazz);    gBinderProxyOffsets.mConstructor= env->GetMethodID(clazz,"<init>", "()V");     ......//获取BinderProxy的一些信息     // **④ gClassOffsets用来和Class类打交道**     clazz =env->FindClass("java/lang/Class");    gClassOffsets.mGetName =env->GetMethodID(clazz,                               "getName","()Ljava/lang/String;");     // 注册BinderProxy native函数的实现     returnAndroidRuntime::registerNativeMethods(env,          kBinderProxyPathName,gBinderProxyMethods,                                NELEM(gBinderProxyMethods)); } ``` 据上面代码可知,int_register_android_os_BinderProxy函数除了初始化BinderProxy类外,还获取了WeakReference类和Error类的一些信息。看来BinderProxy对象的生命周期会委托WeakReference来管理,难怪JNI层会获取该类get函数的MethodID。 至此,Java Binder几个重要成员的初始化已完成,同时在代码中定义了几个全局静态对象,分别是gBinderOffsets、gBinderInternalOffsets和gBinderProxyOffsets。 框架的初始化其实就是提前获取一些JNI层的使用信息,如类成员函数的MethodID,类成员变量的fieldID等。这项工作是必需的,因为它能节省每次使用时获取这些信息的时间。当Binder调用频繁时,这些时间累积起来还是不容小觑的。 另外,这个过程中所创建的几个全局静态对象为JNI层访问Java层的对象提供了依据。而在每个初始化函数中所执行的registerNativeMethods()方法则为Java层访问JNI层打通了道路。换句话说,Binder初始化的工作就是通过JNI建立起Native Binder与Java Binder之间互相通信的桥梁。 下面通过一个例子来分析Java Binder的工作流程。 ### 2.2.3 窥一斑,可见全豹乎 这个例子源自ActivityManagerService,我们试图通过它揭示Java层Binder的工作原理。先来描述一下该例子的分析步骤: + 首先分析AMS如何将自己注册到ServiceManager。 + 然后分析AMS如何响应客户端的Binder调用请求。 本例的起点是setSystemProcess,其代码如下所示: ``` [ActivityManagerService.java-->ActivityManagerService.setSystemProcess()] public static void setSystemProcess() {    try {       ActivityManagerService m = mSelf;        // 将ActivityManagerService服务注册到ServiceManager中       ServiceManager.addService("activity", m);......    } catch {... }    return; } ``` 上面所示代码行的目的是将ActivityManagerService服务(以后简称AMS)加到ServiceManager中。 在整个Android系统中有一个Native的ServiceManager(以后简称SM)进程,它统筹管理Android系统上的所有Service。成为一个Service的首要条件是先在SM中注册。下面来看Java层的Service是如何向SM注册的。 #### 1\. 向ServiceManager注册服务 ##### (1)创建ServiceManagerProxy 向SM注册服务的函数叫addService,其代码如下: ``` [ServiceManager.java-->ServiceManager.addService()] public static void addService(String name, IBinderservice) {     try {         //getIServiceManager返回什么        getIServiceManager().addService(name, service);     }     ...... } ``` 首先需要搞清楚getIServiceManager()方法返回的是一个什么对象呢?参考其实现: ``` [ServiceManager.java-->ServiceManager.getIServiceManager()] private static IServiceManagergetIServiceManager() {     ......     // 调用asInterface,传递的参数类型为IBinder           sServiceManager = ServiceManagerNative.asInterface(                        BinderInternal.getContextObject());     returnsServiceManager; } ``` asInterface()方法的参数为BinderInternal.getContextObject()的返回值。于是这个简短的方法中有两个内容值得讨论:BinderInternal.getContextObject()以及asInterface()。 BinderInternal.getContextObject()方法是一个native的函数,参考其实现: ``` [android_util_Binder.cpp-->android_os_BinderInternal_getContextObject()] static jobjectandroid_os_BinderInternal_getContextObject(JNIEnv* env, jobject clazz) {     /* 下面这句代码在卷I第6章详细分析过,它将返回一个BpProxy对象,其中       NULL(即0,用于标识目的端)指定Proxy通信的目的端是ServiceManager*/    sp<IBinder> b = ProcessState::self()->getContextObject(NULL);     // 由Native对象创建一个Java对象,下面分析该函数     returnjavaObjectForIBinder(env, b); } ``` 可见,Java层的ServiceManager需要在Native层获取指向Native进程中ServiceManager的BpProxy。这个BpProxy不能由Java层的ServiceManager直接使用,于是android_os_BinderInteral_getContextObject()函数通过javaObjectForIBinder()函数将创建一个封装了这个BpProxy的一个Java对象并返回给调用者。ServiceManager便可一通过这个Java对象实现对BpProxy的访问。参考这个Java对象的创建过程: ``` [android_util_Binder.cpp-->javaObjectForIBinder()] jobject javaObjectForIBinder(JNIEnv* env, constsp<IBinder>& val) {     //mProxyLock是一个全局的静态CMutex对象    AutoMutex _l(mProxyLock);     /* val对象实际类型是BpBinder,读者可自行分析BpBinder.cpp中的findObject函数。       事实上,在Native层的BpBinder中有一个ObjectManager,它用来管理在Native BpBinder       上创建的Java BpBinder对象。下面这个findObject用来判断gBinderProxyOffsets       是否已经保存在ObjectManager中。如果是,那就需要删除这个旧的object */     jobjectobject = (jobject)val->findObject(&gBinderProxyOffsets);     if(object != NULL) {        jobject res = env->CallObjectMethod(object,gWeakReferenceOffsets.mGet);        android_atomic_dec(&gNumProxyRefs);        val->detachObject(&gBinderProxyOffsets);        env->DeleteGlobalRef(object);     }     // **① 创建一个新的BinderProxy对象。**并将它注册到Native BpBinder对象的ObjectManager中     object =env->NewObject(gBinderProxyOffsets.mClass,                            gBinderProxyOffsets.mConstructor);     if(object != NULL) {         /* ② 把Native层的BpProxy的指针保存到BinderProxy对象的成员字段mObject中。           于是BinderProxy对象的Native方法可以通过mObject获取BpProxy对象的指针。           这个操作是将BinderProxy与BpProxy联系起来的纽带 */        env->SetIntField(object, gBinderProxyOffsets.mObject,(int)val.get());        val->incStrong(object);        jobject refObject = env->NewGlobalRef(                env->GetObjectField(object, gBinderProxyOffsets.mSelf));         /* 将这个新创建的BinderProxy对象注册(attach)到BpBinder的ObjectManager中,           同时注册一个回收函数proxy_cleanup。当BinderProxy对象撤销(detach)的时候,           该函数会被调用,以释放一些资源。读者可自行研究proxy_cleanup函数*/        val->attachObject(&gBinderProxyOffsets, refObject,                              jnienv_to_javavm(env), proxy_cleanup);         //DeathRecipientList保存了一个用于死亡通知的list        sp<DeathRecipientList> drl = new DeathRecipientList;        drl->incStrong((void*)javaObjectForIBinder);         //将死亡通知list和BinderProxy对象联系起来        env->SetIntField(object, gBinderProxyOffsets.mOrgue,                             reinterpret_cast<jint>(drl.get()));         // 增加该Proxy对象的引用计数        android_atomic_inc(&gNumProxyRefs);         /*下面这个函数用于垃圾回收。创建的Proxy对象一旦超过200个,该函数           将调用BinderInter类的ForceGc做一次垃圾回收 */        incRefsCreated(env);     }     returnobject; } ``` BinderInternal.getContextObject的代码有点多,简单整理一下,可知该函数完成了以下两个工作: + 创建了一个Java层的BinderProxy对象。 + 通过JNI,该BinderProxy对象和一个Native的BpProxy对象挂钩,而该BpProxy对象的通信目标就是ServiceManager。 接下来讨论asInterface()方法,大家还记得在Native层Binder中那个著名的interface_cast宏吗?在Java层中,虽然没有这样的宏,但是定义了一个类似的函数asInterface。下面来分析ServiceManagerNative类的asInterface函数,其代码如下: ``` [ServiceManagerNative.java-->ServiceManagerNative.asInterface()] static public IServiceManager asInterface(IBinderobj) {     ......// 以obj为参数,创建一个ServiceManagerProxy对象     returnnew ServiceManagerProxy(obj); } ``` 上面代码和Native层interface_cast非常类似,都是以一个BpProxy对象为参数构造一个和业务相关的Proxy对象,例如这里的ServiceManagerProxy对象。ServiceManagerProxy对象的各个业务函数会将相应请求打包后交给BpProxy对象,最终由BpProxy对象发送给Binder驱动以完成一次通信。 **说明** 实际上BpProxy也不会直接和Binder驱动交互,真正和Binder驱动交互的是IPCThreadState。 ##### (2)addService函数分析 现在来分析ServiceManagerProxy的addService函数,其代码如下: ``` [ServcieManagerNative.java-->ServiceManagerProxy.addService()] public void addService(String name, IBinderservice)                            throwsRemoteException {     Parceldata = Parcel.obtain();     Parcelreply = Parcel.obtain();    data.writeInterfaceToken(IServiceManager.descriptor);    data.writeString(name);     // 注意下面这个writeStrongBinder函数,后面我们会详细分析它    data.writeStrongBinder(service);     /*mRemote实际上就是BinderProxy对象,调用它的transact,将封装好的请求数据       发送出去 *    mRemote.transact(ADD_SERVICE_TRANSACTION, data, reply, 0);     reply.recycle();    data.recycle(); } ``` BinderProxy的transact,是一个native函数,其实现函数的代码如下所示: ``` [android_util_Binder.cpp-->android_os_BinderProxy_transact()] static jbooleanandroid_os_BinderProxy_transact(JNIEnv* env, jobject obj,                                            jint code, jobject dataObj,                                            jobject replyObj, jint flags) {     ......     // 从Java的Parcel对象中得到作为参数的Native的Parcel对象     Parcel*data = parcelForJavaObject(env, dataObj);     if (data== NULL) {        return JNI_FALSE;     }     // 得到一个用于接收回复的Parcel对象     Parcel*reply = parcelForJavaObject(env, replyObj);     if(reply == NULL && replyObj != NULL) {        return JNI_FALSE;     }     // 从Java的BinderProxy对象中得到之前已经创建好的那个Native的BpBinder对象     IBinder*target = (IBinder*)        env->GetIntField(obj, gBinderProxyOffsets.mObject);     ......     // 通过Native的BpBinder对象,将请求发送给ServiceManager     status_terr = target->transact(code, *data, reply, flags);     ......     signalExceptionForError(env,obj, err);     returnJNI_FALSE; } ``` 看了上面的代码会发现,Java层的Binder最终还是要借助Native的Binder进行通信的。 说明 从架构的角度看,在Java中搭建了一整套框架,如IBinder接口,Binder类和BinderProxy类。但是从通信角度看,不论架构的编写采用的是Native语言还是Java语言,只要把请求传递到Binder驱动就可以了,所以通信的目的是向binder发送请求和接收回复。在这个目的之上,考虑到软件的灵活性和可扩展性,于是编写了一个架构。反过来说,也可以不使用架构(即没有使用任何接口、派生之类的东西)而直接和binder交互,例如ServiceManager作为Binder的一个核心程序,就是直接读取/dev/binder设备,获取并处理请求。从这一点上看,Binder的目的虽是简单的(即打开binder设备,然后读请求和写回复),但是架构是复杂的(编写各种接口类和封装类等)。我们在研究源码时,一定要先搞清楚目的。实现只不过是达到该目的的一种手段和方式。脱离目的的实现,如缘木求鱼,很容易偏离事物本质。 在对addService进行分析时曾提示writeStrongBinder是一个特别的函数。那么它特别在哪里呢?下面将给出解释。 ##### (3)三人行之Binder、JavaBBinderHolder和JavaBBinder ActivityManagerService从ActivityManagerNative类派生,并实现了一些接口,其中和Binder的相关的只有这个ActivityManagerNative类,其原型如下: ``` [ActivityManagerNative.java-->ActivityManagerNative] public abstract class ActivityManagerNative                           extends Binder                           implementsIActivityManager ``` ActivityManagerNative从Binder派生,并实现了IActivityManager接口。下面来看ActivityManagerNative的构造函数: ``` [ActivityManagerNative.java-->ActivityManagerNative.ActivityManagerNative()] public ActivityManagerNative() {    attachInterface(this, descriptor);// 该函数很简单,读者可自行分析 } ``` 而ActivityManagerNative父类的构造函数则是Binder的构造函数: ``` [Binder.java-->Binder.Binder()] public Binder() {     init(); } ``` Binder构造函数中会调用native的init函数,其实现的代码如下: ``` [android_util_Binder.cpp-->android_os_Binder_init()] static void android_os_Binder_init(JNIEnv* env,jobject obj) {     // 创建一个JavaBBinderHolder对象    JavaBBinderHolder* jbh = new JavaBBinderHolder();    bh->incStrong((void*)android_os_Binder_init);     // 将这个JavaBBinderHolder对象保存到Java Binder对象的mObject成员中    env->SetIntField(obj, gBinderOffsets.mObject, (int)jbh); } ``` 从上面代码可知,Java的Binder对象将和一个Native的JavaBBinderHolder对象相关联。那么,JavaBBinderHolder是何方神圣呢?其定义如下: ``` [android_util_Binder.cpp-->JavaBBinderHolder] class JavaBBinderHolder : public RefBase { public:    sp<JavaBBinder> get(JNIEnv* env, jobject obj)     {        AutoMutex _l(mLock);        sp<JavaBBinder> b = mBinder.promote();         if(b == NULL) {            // 创建一个JavaBBinder,obj实际上是Java层中的Binder对象            b = new JavaBBinder(env, obj);            mBinder = b;         }        return b;     }     ...... private:    Mutex           mLock;    wp<JavaBBinder> mBinder; }; ``` 从派生关系上可以发现,JavaBBinderHolder仅从RefBase派生,所以它不属于Binder家族。Java层的Binder对象为什么会和Native层的一个与Binder家族无关的对象绑定呢?仔细观察JavaBBinderHolder的定义可知:JavaBBinderHolder类的get函数中创建了一个JavaBBinder对象,这个对象就是从BnBinder派生的。 那么,这个get函数是在哪里调用的?答案在下面这句代码中: ``` //其中,data是Parcel对象,service此时还是ActivityManagerService data.writeStrongBinder(service); ``` writeStrongBinder会做一个替换工作,下面是它的native代码实现: ``` [android_util_Binder.cpp-->android_os_Parcel_writeStrongBinder()] static voidandroid_os_Parcel_writeStrongBinder(JNIEnv* env,                                                jobject clazz, jobject object) {     /*parcel是一个Native的对象,writeStrongBinder的真正参数是      ibinderForJavaObject()的返回值*/     conststatus_t err = parcel->writeStrongBinder(                                    ibinderForJavaObject(env, object)); } [android_util_Binder.cpp-->ibinderForJavaObject()] sp<IBinder> ibinderForJavaObject(JNIEnv*env, jobject obj) {     /* 如果Java的obj是Binder类,则首先获得JavaBBinderHolder对象,然后调用       它的get()函数。而这个get将返回一个JavaBBinder  */     if(env->IsInstanceOf(obj, gBinderOffsets.mClass)) {     JavaBBinderHolder* jbh = (JavaBBinderHolder*)env->GetIntField(obj,                                      gBinderOffsets.mObject);        return jbh != NULL ? jbh->get(env, obj) : NULL;     }     // 如果obj是BinderProxy类,则返回Native的BpBinder对象     if(env->IsInstanceOf(obj, gBinderProxyOffsets.mClass)) {        return (IBinder*)            env->GetIntField(obj, gBinderProxyOffsets.mObject);     }    returnNULL; } ``` 根据上面的介绍会发现,addService实际添加到Parcel的并不是AMS本身,而是一个叫JavaBBinder的对象。正是将它最终传递到Binder驱动。 读者此时容易想到,Java层中所有的Binder对应的都是这个JavaBBinder。当然,不同的Binder对象对应不同的JavaBBinder对象。 图2-2展示了Java Binder、JavaBBinderHolder和JavaBBinder的关系。 ![](https://box.kancloud.cn/2016-03-01_56d567b1441a4.png) 图 2 - 2 Java Binder 、JavaBBinderHolder和JavaBBinder三者的关系 从图2-2可知: + Java层的Binder通过mObject指向一个Native层的JavaBBInderHolder对象。 + Native层的JavaBBinderHolder对象通过mBinder成员变量指向一个Native的JavaBBinder对象。 + Native的JavaBBinder对象又通过mObject变量指向一个Java层的Binder对象。 为什么不直接让Java层的Binder对象指向Native层的JavaBBinder对象呢?由于缺乏设计文档,这里不便妄加揣测,但从JavaBBinderHolder的实现上来分析,估计和垃圾回收(内存管理)有关,因为JavaBBinderHolder中的mBinder对象的类型被定义成弱引用wp了。 建议 对此有更好的解释的读者,不妨与大家分享一下。 #### 2\. ActivityManagerService响应请求 初见JavaBBinde时,多少有些吃惊。回想一下Native层的Binder架构:虽然在代码中调用的是Binder类提供的接口,但其对象却是一个实际的服务端对象,例如MediaPlayerService对象,AudioFlinger对象。 而在Java层的Binder架构中,JavaBBinder却是一个和业务完全无关的对象。那么,这个对象如何实现不同业务呢? 为回答此问题,我们必须看它的onTransact函数。当收到请求时,系统会调用这个函数。 说明 关于这个问题,建议读者阅读卷I第6章“深入理解Binder”。 ``` [android_util_Binder.cpp-->JavaBBinder::onTransact()] virtual status_t onTransact(        uint32_t code, const Parcel& data, Parcel* reply, uint32_t flags =0) {     JNIEnv*env = javavm_to_jnienv(mVM);    IPCThreadState* thread_state = IPCThreadState::self();     .......     // 调用Java层Binder对象的execTranscat函数     jbooleanres = env->CallBooleanMethod(mObject,                     gBinderOffsets.mExecTransact,code,                    (int32_t)&data, (int32_t)reply, flags);     ......     returnres != JNI_FALSE ? NO_ERROR : UNKNOWN_TRANSACTION; } ``` 就本例而言,上面代码中的mObject就是ActivityManagerService,现在调用它的execTransact()方法,该方法在Binder类中实现,具体代码如下: ``` [Binder.java-->Binder.execTransact()] private boolean execTransact(int code, intdataObj, int replyObj,int flags) {     Parceldata = Parcel.obtain(dataObj);     Parcelreply = Parcel.obtain(replyObj);     booleanres;     try {         //调用onTransact函数,派生类可以重新实现这个函数,以完成业务功能         res= onTransact(code, data, reply, flags);     } catch{ ... }    reply.recycle();    data.recycle();     returnres; } ``` ActivityManagerNative类实现了onTransact函数,代码如下: ``` [ActivityManagerNative.java-->ActivityManagerNative.onTransact()] public boolean onTransact(int code, Parcel data,Parcel reply, int flags)            throws RemoteException {     switch(code) {     caseSTART_ACTIVITY_TRANSACTION:     {        data.enforceInterface(IActivityManager.descriptor);        IBinder b = data.readStrongBinder();        ......         //再由ActivityManagerService实现业务函数startActivity         intresult = startActivity(app, intent, resolvedType,                    grantedUriPermissions, grantedMode, resultTo, resultWho,                    requestCode, onlyIfNeeded, debug, profileFile,                    profileFd, autoStopProfiler);        reply.writeNoException();        reply.writeInt(result);        return true;     }     .... // 处理其他请求的case     } } ``` 由此可以看出,JavaBBinder仅是一个传声筒,它本身不实现任何业务函数,其工作是: + 当它收到请求时,只是简单地调用它所绑定的Java层Binder对象的exeTransact。 + 该Binder对象的exeTransact调用其子类实现的onTransact函数。 + 子类的onTransact函数将业务又派发给其子类来完成。请读者务必注意其中的多层继承关系。 通过这种方式,来自客户端的请求就能传递到正确的Java Binder对象了。图2-3展示AMS响应请求的整个流程。 ![](https://box.kancloud.cn/2016-03-01_56d567b15363e.png) 图 2 - 3 AMS响应请求的流程 在图2-3中,右上角的大方框表示AMS这个对象,其间的虚线箭头表示调用子类重载的函数。 ### 2.2.4 理解AIDL 经过上一节的介绍,读者已经明白在Java层Binder的架构中,Bp端可以通过BinderProxy的transact()方法与Bn端发送请求,而Bn端通过继承Binder类并重写onTransact()接收并处理来自Bp端的请求。这个结构非常清晰而且简单,但是实现起来却颇为繁琐。于是Android提供了AIDL语言以及AIDL解释器自动生成一个服务的Bn端即Bp端的用于处理Binder通信的代码。 AIDL的语法与定义一个Java接口的语法非常相似。为了避免业务实现对分析的干扰,本节通过一个最简单的例子对AIDL的原理进行介绍: ``` [IMyServer.aidl] package com.understanding.samples; interface IMyServer {     intfoo(String str); } ``` IMyServer.aidl定义了一个名为IMyServer的Binder服务,并提供了一个可以跨Binder调用的接口foo()。可以通过aidl工具将其解析为一个实现了Bn端及Bp端通过Binder进行通信的Java源代码。具体命令如下: ``` aidl com/understanding/samples/IMyServer.aidl ``` 生成的IMyServer.java可以在com/understanding/samples/文件夹下找到。 建议 读者可以阅读aidl有关的文档了解此工具的详细功能。 ``` [IMyServer.java-->IMyServer] package com.understanding.samples; /* **① 首先,IMyServer.aidl被解析为一个Java接口IMyServer。**这个接口定义了AIDL文件中   所定义的接口foo() */ public interface IMyServer extendsandroid.os.IInterface {     /***② aidl工具生成了一个继承自IMyServer接口的抽象类IMyServer.Stub。**这个抽象类实现了       Bn端通过onTransact()方法接收来自Bp端的请求的代码。本例中的foo()方法在这个类中       会被定义成一个抽象方法。因为aidl工具根不知道foo()方法是做什么的,它只能在onTransact()       中得知Bp端希望对foo()方法进行调用,所以Stub类是抽象的。 */     publicstatic abstract class Stub extends android.os.Binder implements                                            com.understanding.samples.IMyServer{        ...... // Stub类的其他实现         /*onTransact()根据code的值选择调用IMyServer接口中的不同方法。本例中          TRANSACTION_foo意味着需要通过调用foo()方法完成请求 */        public boolean onTransact(int code, android.os.Parcel data,                android.os.Parcel reply, int flags)                throws android.os.RemoteException {            switch (code) {             ......            case TRANSACTION_foo: {                ...... // 从data中读取参数_arg0                // Stub类的子类需要实现foo()方法                 int _result = this.foo(_arg0);                ...... // 向reply中写入_result                return true;            }            }            return super.onTransact(code, data, reply, flags);         }         /* **③ aidl工具还生成了一个继承自IMyServer接口的类Proxy,它是Bp端的实现。**与Bn端的          Stub类不同,它实现了foo()函数。因为foo()函数在Bp端的实现是确定的,即将参数存储到          Parcel中然后执行transact()方法将请求发送给Bn端,然后从reply中读取返回值并返回           给调用者 */           private static class Proxy implements com.understanding.samples.IMyServer{             ...... // Proxy类的其他实现            public int foo(java.lang.String str)                    throws android.os.RemoteException {                android.os.Parcel _data = android.os.Parcel.obtain();                android.os.Parcel _reply = android.os.Parcel.obtain();                int _result;                try {                    ...... // 将参数str写入参数_data                    // mRemote就是指向IMyServer Bn端的BinderProxy                    mRemote.transact(Stub.TRANSACTION_foo, _data, _reply, 0);                    ......// 从_replay中读取返回值_result                } finally { ...... }                return _result;            }         }         // TRANSACTION_foo常量用于定义foo()方法的code           static final int TRANSACTION_foo =                              (android.os.IBinder.FIRST_CALL_TRANSACTION+ 0);     }     // 声明IMyServer所提供的接口     publicint foo(java.lang.String str) throws android.os.RemoteException; } ``` 可见一个AIDL文件被aidl工具解析之后会产生三个物件: + IMyServer接口。它仅仅用来在Java中声明IMyServer.aidl中所声明的接口。 + IMyServer.Stub类。这个继承自Binder类的抽象类实现了Bn端与Binder通信相关的代码。 + IMyServer.Stub.Proxy类。这个类实现了Bp端与Binder通信相关的代码。 在完成了aidl的解析之后,为了实现一个Bn端,开发者需要继承IMyServer.Stub类并实现其抽象方法。如下所示: ``` class MyServer extends IMyServer.Stub {     intfoo(String str) {         // 做点什么都可以         returnstr.length();     } } ``` 于是每一个MyServer类的实例,都具有了作为Bn端的能力。典型的做法是将MyServer类的实例通过ServiceManager.addService()将其注册为一个系统服务,或者在一个Android标准Service的onBind()方法中将其作为返回值使之可以被其他进程访问。另外,也可以通过Binder调用将其传递给另外一个进程,使之成为一个跨进程的回调对象。 那么Bp端将如何使用IMyServer.Proxy呢?在Bp端所在进程中,一旦获取了IMyServer的BinderProxy(通过ServiceManager.getService()、onServiceConnected()或者其他方式),就可以以如下方式获得一个IMyServer.Proxy: ``` // 其中binderProxy就是通过ServiceManager.getService()所获取 IMyServer remote = IMyServer.Stub.asInterface(binderProxy); remote.foo(“Hello AIDL!”); IMyServer.Stub.asInterface()的实现如下: [IMyServer.java-->IMyServer.Stub.asInterface()] public static com.understanding.samples.IMyServerasInterface(        android.os.IBinder obj) {     ......     // 创建一个IMyServer.Stub.Proxy。其中参数obj将会被保存为Proxy类的mRemote成员。     return new com.understanding.samples.IMyServer.Stub.Proxy(obj); } ``` 可见,AIDL使得构建一个Binder服务的工作大大地简化了。 ### 2.2.5 Java层Binder架构总结 图2-4展示了Java层的Binder架构。 ![](https://box.kancloud.cn/2016-03-01_56d567b16b889.png) 图 2 - 4 Java层Binder架构 根据图2-4可知: + 对于代表客户端的BinderProxy来说,Java层的BinderProxy在Native层对应一个BpBinder对象。凡是从Java层发出的请求,首先从Java层的BinderProxy传递到Native层的BpBinder,继而由BpBinder将请求发送到Binder驱动。 + 对于代表服务端的Service来说,Java层的Binder在Native层有一个JavaBBinder对象。前面介绍过,所有Java层的Binder在Native层都对应为JavaBBinder,而JavaBBinder仅起到中转作用,即把来自客户端的请求从Native层传递到Java层。 + 系统中依然只有一个Native的ServiceManager。 至此,Java层的Binder架构已介绍完毕。从前面的分析可以看出,Java层Binder非常依赖Native层的Binder。建议想进一步了解Binder的读者们,要深入了解这一问题,有必要阅读卷I的第6章“深入理解Binder”。 ## 2.3 心系两界的MessageQueue 卷I第5章介绍过,MessageQueue类封装了与消息队列有关的操作。在一个以消息驱动的系统中,最重要的两部分就是消息队列和消息处理循环。在Andrid 2.3以前,只有Java世界的居民有资格向MessageQueue中添加消息以驱动Java世界的正常运转,但从Android 2.3开始,MessageQueue的核心部分下移至Native层,让Native世界的居民也能利用消息循环来处理他们所在世界的事情。因此现在的MessageQueue心系Native和Java两个世界。 ### 2.3.1 MessageQueue的创建 现在来分析MessageQueue是如何跨界工作的,其代码如下: ``` [MessageQueue.java-->MessageQueue.MessageQueue()] MessageQueue() {     nativeInit();//构造函数调用nativeInit,该函数由Native层实现 } ``` nativeInit()方法的真正实现为android_os_MessageQueue_nativeInit()函数,其代码如下: ``` [android_os_MessageQueue.cpp-->android_os_MessageQueue_nativeInit()] static voidandroid_os_MessageQueue_nativeInit(JNIEnv* env, jobject obj) {     // NativeMessageQueue是MessageQueue在Native层的代表     NativeMessageQueue* nativeMessageQueue = newNativeMessageQueue();     ......     // 将这个NativeMessageQueue对象设置到Java层保存     android_os_MessageQueue_setNativeMessageQueue(env,obj,                                                          nativeMessageQueue); } ``` nativeInit函数在Native层创建了一个与MessageQueue对应的NativeMessageQueue对象,其构造函数如下: ``` [android_os_MessageQueue.cpp-->NativeMessageQueue::NativeMessageQueue()] NativeMessageQueue::NativeMessageQueue() {     /* 代表消息循环的Looper也在Native层中呈现身影了。根据消息驱动的知识,一个线程会有一个       Looper来循环处理消息队列中的消息。下面一行的调用就是取得保存在线程本地存储空间      (Thread Local Storage)中的Looper对象 */     mLooper= Looper::getForThread();     if (mLooper == NULL) {         /* 如为第一次进来,则该线程没有设置本地存储,所以须先创建一个Looper,然后再将其保存到           TLS中,这是很常见的一种以线程为单位的单例模式*/         mLooper = new Looper(false);         Looper::setForThread(mLooper);     } } ``` Native的Looper是Native世界中参与消息循环的一位重要角色。虽然它的类名和Java层的Looper类一样,但此二者其实并无任何关系。这一点以后还将详细分析。 ### 2.3.2 提取消息 当一切准备就绪后,Java层的消息循环处理,也就是Looper会在一个循环中提取并处理消息。消息的提取就是调用MessageQueue的next()方法。当消息队列为空时,next就会阻塞。MessageQueue同时支持Java层和Native层的事件,那么其next()方法该怎么实现呢?具体代码如下: ``` [MessagQueue.java-->MessageQueue.next()] final Message next() {     int pendingIdleHandlerCount = -1;     int nextPollTimeoutMillis = 0;     for (;;) {         ......         // mPtr保存了NativeMessageQueue的指针,调用nativePollOnce进行等待         nativePollOnce(mPtr,nextPollTimeoutMillis);         synchronized (this) {             final long now = SystemClock.uptimeMillis();             // mMessages用来存储消息,这里从其中取一个消息进行处理             final Message msg = mMessages;             if (msg != null) {                 final long when = msg.when;                 if (now >= when) {                     mBlocked = false;                     mMessages = msg.next;                     msg.next = null;                     msg.markInUse();                     return msg; // 返回一个Message给Looper进行派发和处理                } else {                     nextPollTimeoutMillis = (int) Math.min(when- now,                                                   Integer.MAX_VALUE);                 }             } else {                 nextPollTimeoutMillis = -1;             }             ......             /* 处理注册的IdleHandler,当MessageQueue中没有Message时,            Looper会调用IdleHandler做一些工作,例如做垃圾回收等  */            ......            pendingIdleHandlerCount = 0;             nextPollTimeoutMillis = 0;         }     } } ``` 看到这里,可能会有人觉得这个MessageQueue很简单,不就是从以前在Java层的wait变成现在Native层的wait了吗?但是事情本质比表象要复杂得多,来思考下面的情况: nativePollOnce()返回后,next()方法将从mMessages中提取一个消息。也就是说,要让nativePollOnce()返回,至少要添加一个消息到消息队列,否则nativePollOnce()不过是做了一次无用功罢了。 如果nativePollOnce()将在Native层等待,就表明Native层也可以投递Message,但是从Message类的实现代码上看,该类和Native层没有建立任何关系。那么nativePollOnce()在等待什么呢? 对于上面的问题,相信有些读者心中已有了答案:nativePollOnce()不仅在等待Java层来的Message,实际上还在Native还做了大量的工作。 下面我们来分析Java层投递Message并触发nativePollOnce工作的正常流程。 #### 1\. 在Java层投递Message MessageQueue的enqueueMessage函数完成将一个Message投递到MessageQueue中的工作,其代码如下: ``` [MesssageQueue.java-->MessageQueue.enqueueMessage()] final boolean enqueueMessage(Message msg, longwhen) {     ......     finalboolean needWake;    synchronized (this) {         if(mQuiting) {            return false;         }else if (msg.target == null) {            mQuiting = true;         }        msg.when = when;        Message p = mMessages;         if(p == null || when == 0 || when < p.when) {            /* 如果p为空,表明消息队列中没有消息,那么msg将是第一个消息,needWake              需要根据mBlocked的情况考虑是否触发 */             msg.next= p;            mMessages = msg;            needWake = mBlocked;         } else {            // 如果p不为空,表明消息队列中还有剩余消息,需要将新的msg加到消息尾            Message prev = null;            while (p != null && p.when <= when) {                prev = p;                p = p.next;            }            msg.next = prev.next;            prev.next = msg;            // 因为消息队列之前还剩余有消息,所以这里不用调用nativeWakeup            needWake = false;         }     }     if(needWake) {         // 调用nativeWake,以触发nativePollOnce函数结束等待        nativeWake(mPtr);     }     returntrue; } ``` 上面的代码比较简单,主要功能是: + 将message按执行时间排序,并加入消息队。 + 根据情况调用nativeWake函数,以触发nativePollOnce函数,结束等待。 建议 虽然代码简单,但是对于那些不熟悉多线程的读者,还是要细细品味一下mBlocked值的作用。我们常说细节体现美,代码也一样,这个小小的mBlocked正是如此。 #### 2\. nativeWake函数分析 nativeWake函数的代码如下所示: ``` [android_os_MessageQueue.cpp-->android_os_MessageQueue_nativeWake()] static voidandroid_os_MessageQueue_nativeWake(JNIEnv* env, jobject obj,                                                       jint ptr) {    NativeMessageQueue* nativeMessageQueue = // 取出NativeMessageQueue对象                       reinterpret_cast<NativeMessageQueue*>(ptr);     returnnativeMessageQueue->wake(); // 调用它的wake函数 } [android_os_MessageQueue.cpp-->NativeMessageQueue::wake()] void NativeMessageQueue::wake() {    mLooper->wake(); // 层层调用,现在转到mLooper的wake函数 } ``` Native Looper的wake函数代码如下: ``` [Looper.cpp-->Looper::wake()] void Looper::wake() {     ssize_tnWrite;     do {         // 向管道的写端写入一个字符        nWrite = write(mWakeWritePipeFd, "W", 1);     } while(nWrite == -1 && errno == EINTR); } ``` Wake()函数则更为简单,仅仅向管道的写端写入一个字符”W”,这样管道的读端就会因为有数据可读而从等待状态中醒来。 ### 2.3.3 nativePollOnce函数分析 nativePollOnce()的实现函数是android_os_MessageQueue_nativePollOnce,代码如下: ``` [android_os_MessageQueue.cpp-->android_os_MessageQueue_nativePollOnce()] static voidandroid_os_MessageQueue_nativePollOnce(JNIEnv* env, jobject obj,         jintptr, jint timeoutMillis)     NativeMessageQueue* nativeMessageQueue =                            reinterpret_cast<NativeMessageQueue*>(ptr);     // 取出NativeMessageQueue对象,并调用它的pollOnce    nativeMessageQueue->pollOnce(timeoutMillis); } ``` 分析pollOnce函数: ``` [android_os_MessageQueue.cpp-->NativeMessageQueue::pollOnece()] void NativeMessageQueue::pollOnce(inttimeoutMillis) {    mLooper->pollOnce(timeoutMillis); // 重任传递到Looper的pollOnce函数 } ``` Looper的pollOnce函数如下: ``` [Looper.cpp-->Looper::pollOnce()] inline int pollOnce(int timeoutMillis) {     returnpollOnce(timeoutMillis, NULL, NULL, NULL); } ``` 上面的函数将调用另外一个有4个参数的pollOnce函数,这个函数的原型如下: ``` int pollOnce(int timeoutMillis, int* outFd, int*outEvents, void** outData) ``` 其中: + timeOutMillis参数为超时等待时间。如果为-1,则表示无限等待,直到有事件发生为止。如果值为0,则无需等待立即返回。 + outFd用来存储发生事件的那个文件描述符 。 + outEvents用来存储在该文件描述符1上发生了哪些事件,目前支持可读、可写、错误和中断4个事件。这4个事件其实是从epoll事件转化而来。后面我们会介绍大名鼎鼎的epoll。 + outData用于存储上下文数据,这个上下文数据是由用户在添加监听句柄时传递的,它的作用和pthread_create函数最后一个参数param一样,用来传递用户自定义的数据。 另外,pollOnce函数的返回值也具有特殊的意义,具体如下: + 当返回值为ALOOPER_POLL_WAKE时,表示这次返回是由wake函数触发的,也就是管道写端的那次写事件触发的。 + 返回值为ALOOPER_POLL_TIMEOUT表示等待超时。 + 返回值为ALOOPER_POLL_ERROR,表示等待过程中发生错误。 + 返回值为ALOOPER_POLL_CALLBACK,表示某个被监听的句柄因某种原因被触发。这时,outFd参数用于存储发生事件的文件句柄,outEvents用于存储所发生的事件。 上面这些知识是和epoll息息相关的。 提示 查看Looper的代码会发现,Looper采用了编译选项(即#if和#else)来控制是否使用epoll作为I/O复用的控制中枢。鉴于现在大多数系统都支持epoll,这里仅讨论使用epoll的情况。 #### 1\. epoll基础知识介绍 epoll机制提供了Linux平台上最高效的I/O复用机制,因此有必要介绍一下它的基础知识。 从调用方法上看,epoll的用法和select/poll非常类似,其主要作用就是I/O复用,即在一个地方等待多个文件句柄的I/O事件。 下面通过一个简单例子来分析epoll的工作流程。 ``` /* **① 使用epoll前,需要先通过epoll_create函数创建一个epoll句柄。**   下面一行代码中的10表示该epoll句柄初次创建时候分配能容纳10个fd相关信息的缓存。   对于2.6.8版本以后的内核,该值没有实际作用,这里可以忽略。其实这个值的主要目的是   确定分配一块多大的缓存。现在的内核都支持动态拓展这块缓存,所以该值就没有意义了 */ int epollHandle = epoll_create(10); /* **② 得到epoll句柄后,下一步就是通过epoll_ctl把需要监听的文件句柄加入到epoll句柄中。**   除了指定文件句柄本身的fd值外,同时还需要指定在该fd上等待什么事件。epoll支持四类事件,   分别是EPOLLIN(句柄可读)、EPOLLOUT(句柄可写),EPOLLERR(句柄错误)、EPOLLHUP(句柄断)。   epoll定义了一个结构体struct epoll_event来表达监听句柄的诉求。   假设现在有一个监听端的socket句柄listener,要把它加入到epoll句柄中 */ struct epoll_event listenEvent; //先定义一个event /* EPOLLIN表示可读事件,EPOLLOUT表示可写事件,另外还有EPOLLERR,EPOLLHUP表示   系统默认会将EPOLLERR加入到事件集合中 */ listenEvent.events = EPOLLIN;// 指定该句柄的可读事件 // epoll_event中有一个联合体叫data,用来存储上下文数据,本例的上下文数据就是句柄自己 listenEvent.data.fd = listenEvent;   /* **③** EPOLL_CTL_ADD将监听fd和监听事件加入到epoll句柄的等待队列中;     EPOLL_CTL_DEL将监听fd从epoll句柄中移除;     EPOLL_CTL_MOD修改监听fd的监听事件,例如本来只等待可读事件,现在需要同时等待     可写事件,那么修改listenEvent.events 为EPOLLIN|EPOLLOUT后,再传给epoll句柄*/ epoll_ctl(epollHandle,EPOLL_CTL_ADD,listener,&listenEvent); /* 当把所有感兴趣的fd都加入到epoll句柄后,就可以开始坐等感兴趣的事情发生了。   为了接收所发生的事情,先定义一个epoll_event数组 */ struct epoll_event resultEvents[10]; int timeout = -1; while(1) {     /* **④ 调用epoll_wait用于等待事件。**其中timeout可以指定一个超时时间,      resultEvents用于接收发生的事件,10为该数组的大小。      epoll_wait函数的返回值有如下含义:       nfds大于0表示所监听的句柄上有事件发生;       nfds等于0表示等待超时;       nfds小于0表示等待过程中发生了错误*/     int nfds = epoll_wait(epollHandle,resultEvents, 10, timeout);     if(nfds == -1) {         // epoll_wait发生了错误     } else if(nfds == 0) {         //发生超时,期间没有发生任何事件     } else{         // ⑤resultEvents用于返回那些发生了事件的信息         for(int i = 0; i < nfds; i++) {             struct epoll_event & event =resultEvents[i];             if(event & EPOLLIN) {                 /* **⑥ 收到可读事件。**到底是哪个文件句柄发生该事件呢?可通过event.data这个联合                  体取得 前传递给epoll的上下文数据,该上下文信息可用于判断到底是谁发生了事件 */               ......             }             .......//其他处理          }     } } ``` epoll整体使用流程如上面代码所示,基本和select/poll类似,不过作为Linux平台最高效的I/O复用机制,这里有些内容供读者参考, epoll的效率为什么会比select高?其中一个原因是调用方法。每次调用select时,都需要把感兴趣的事件复制到内核中,而epoll只在epll_ctl进行加入的时候复制一次。另外,epoll内部用于保存事件的数据结构使用的是红黑树,查找速度很快。而select采用数组保存信息,不但一次能等待的句柄个数有限,并且查找起来速度很慢。当然,在只等待少量文件句柄时,select和epoll效率相差不是很多,但还是推荐使用epoll。 epoll等待的事件有两种触发条件,一个是水平触发(EPOLLLEVEL),另外一个是边缘触发(EPOLLET,ET为Edge Trigger之意),这两种触发条件的区别非常重要。读者可通过man epoll查阅系统提供的更为详细的epoll机制。 最后,关于pipe,还想提出一个小问题供读者思考讨论: 为什么Android中使用pipe作为线程间通讯的方式?对于pipe的写端写入的数据,读端都不感兴趣,只是为了简单的唤醒。POSIX不是也有线程间同步函数吗?为什么要用pipe呢? 关于这个问题的答案,可参见邓凡平的一篇博文“随笔之如何实现一个线程池”。 + http://www.cnblogs.com/innost/archive/2011/11/24/2261454.html #### 2\. pollOnce()函数分析 下面分析带4个参数的pollOnce()函数,代码如下: ``` [Looper.cpp-->Looper::pollOnce()] int Looper::pollOnce(int timeoutMillis, int*outFd, int* outEvents, void** outData) {     intresult = 0;     for(;;) { // 一个无限循环         // mResponses是一个Vector,这里首先需要处理response        while (mResponseIndex < mResponses.size()) {            const Response& response = mResponses.itemAt(mResponseIndex++);            ALooper_callbackFunc callback = response.request.callback;             if (!callback) {// 首先处理那些没有callback的Response                int ident = response.request.ident; // ident是这个Response的id                int fd = response.request.fd;                int events = response.events;                void* data = response.request.data;                ......                if (outFd != NULL) *outFd = fd;                if (outEvents != NULL) *outEvents = events;                if (outData != NULL) *outData = data;                /* 实际上,对于没有callback的Response,pollOnce只是返回它的                  ident,并没有实际做什么处理。因为没有callback,所以系统也不知道如何处理 */                return ident;            }         }         if(result != 0) {             if(outFd != NULL) *outFd = 0;            if (outEvents != NULL) *outEvents = NULL;             if (outData != NULL) *outData = NULL;            return result;         }         // 调用pollInner函数。注意,它在for循环内部        result = pollInner(timeoutMillis);     } } ``` 初看上面的代码,可能会让人有些丈二和尚摸不着头脑。但是把pollInner()函数分析完毕,大家就会明白很多。pollInner()函数非常长,把用于调试和统计的代码去掉,结果如下: ``` [Looper.cpp-->Looper::pollInner()] int Looper::pollInner(int timeoutMillis) {     if(timeoutMillis != 0 && mNextMessageUptime != LLONG_MAX) {        nsecs_t now = systemTime(SYSTEM_TIME_MONOTONIC);        ......//根据Native Message的信息计算此次需要等待的时间        timeoutMillis = messageTimeoutMillis;     }     intresult = ALOOPER_POLL_WAKE;    mResponses.clear();    mResponseIndex = 0; #ifdef LOOPER_USES_EPOLL  // 只讨论使用epoll进行I/O复用的方式     structepoll_event eventItems[EPOLL_MAX_EVENTS];     // 调用epoll_wait,等待感兴趣的事件或超时发生     inteventCount = epoll_wait(mEpollFd, eventItems, EPOLL_MAX_EVENTS,                                      timeoutMillis); #else     ......//使用别的方式进行I/O复用 #endif     //从epoll_wait返回,这时候一定发生了什么事情    mLock.lock();     if(eventCount < 0) { //返回值小于零,表示发生错误         if(errno == EINTR) {            goto Done;         }         //设置result为ALLOPER_POLL_ERROR,并跳转到Done        result = ALOOPER_POLL_ERROR;         gotoDone;     }    //eventCount为零,表示发生超时,因此直接跳转到Done     if(eventCount == 0) {       result = ALOOPER_POLL_TIMEOUT;         gotoDone;     } #ifdef LOOPER_USES_EPOLL     // 根据epoll的用法,此时的eventCount表示发生事件的个数     for (inti = 0; i < eventCount; i++) {         intfd = eventItems[i].data.fd;        uint32_t epollEvents = eventItems[i].events;         /* 之前通过pipe函数创建过两个fd,这里根据fd知道是管道读端有可读事件。          读者还记得对nativeWake函数的分析吗?在那里我们向管道写端写了一个”W”字符,这样          就能触发管道读端从epoll_wait函数返回了 */         if(fd == mWakeReadPipeFd) {            if (epollEvents & EPOLLIN) {                 // awoken函数直接读取并清空管道数据,读者可自行研究该函数                awoken();            }             ......         }else {           /* mRequests和前面的mResponse相对应,它也是一个KeyedVector,其中存储了            fd和对应的Request结构体,该结构体封装了和监控文件句柄相关的一些上下文信息,             例如回调函数等。我们在后面的小节会再次介绍该结构体 */            ssize_t requestIndex = mRequests.indexOfKey(fd);            if (requestIndex >= 0) {                int events = 0;                // 将epoll返回的事件转换成上层LOOPER使用的事件                if (epollEvents & EPOLLIN) events |= ALOOPER_EVENT_INPUT;                if (epollEvents & EPOLLOUT) events |= ALOOPER_EVENT_OUTPUT;                if (epollEvents & EPOLLERR) events |= ALOOPER_EVENT_ERROR;                if (epollEvents & EPOLLHUP) events |= ALOOPER_EVENT_HANGUP;                // 每处理一个Request,就相应构造一个Response                pushResponse(events, mRequests.valueAt(requestIndex));            }              ......         }     } Done: ; #else      ...... #endif     // 除了处理Request外,还处理Native的Message    mNextMessageUptime = LLONG_MAX;     while(mMessageEnvelopes.size() != 0) {        nsecs_t now = systemTime(SYSTEM_TIME_MONOTONIC);        const MessageEnvelope& messageEnvelope =mMessageEnvelopes.itemAt(0);         if(messageEnvelope.uptime <= now) {            {                sp<MessageHandler> handler = messageEnvelope.handler;                Message message = messageEnvelope.message;                mMessageEnvelopes.removeAt(0);                mSendingMessage = true;                mLock.unlock();                /* 调用Native的handler处理Native的Message                 从这里也可看出Native Message和Java层的Message没有什么关系 */                handler->handleMessage(message);            }            mLock.lock();            mSendingMessage = false;            result = ALOOPER_POLL_CALLBACK;         }else {             mNextMessageUptime = messageEnvelope.uptime;            break;         }     }    mLock.unlock();     // 处理那些带回调函数的Response     for (size_t i = 0; i < mResponses.size();i++) {        const Response& response = mResponses.itemAt(i);        ALooper_callbackFunc callback = response.request.callback;         if(callback) {// 有了回调函数,就能知道如何处理所发生的事情了            int fd = response.request.fd;            int events = response.events;            void* data = response.request.data;            // 调用回调函数处理所发生的事件            int callbackResult = callback(fd, events, data);            if (callbackResult == 0) {                // callback函数的返回值很重要,如果为0,表明不需要再次监视该文件句柄                 removeFd(fd);            }            result = ALOOPER_POLL_CALLBACK;         }     }     returnresult; } ``` 看完代码了,是否还有点模糊?那么,回顾一下pollInner函数的几个关键点: + 首先需要计算一下真正需要等待的时间。 + 调用epoll_wait函数等待。 + epoll_wait函数返回,这时候可能有三种情况: a)      发生错误,则跳转到Done处。 b)     超时,这时候也跳转到Done处。 c)      epoll_wait监测到某些文件句柄上有事件发生。 + 假设epoll_wait因为文件句柄有事件而返回,此时需要根据文件句柄来分别处理: a)      如果是管道读这一端有事情,则认为是控制命令,可以直接读取管道中的数据。 b)     如果是其他FD发生事件,则根据Request构造Response,并push到Response数组中。 + 真正开始处理事件是在有Done标志的位置。 a)      首先处理Native的Message。调用Native Handler的handleMessage处理该Message。 b)     处理Response数组中那些带有callback的事件。 上面的处理流程还是比较清晰的,但还是有个一个拦路虎,那就是mRequests,下面就来清剿这个拦路虎。 #### 3\. 添加监控请求 添加监控请求其实就是调用epoll_ctl增加文件句柄。下面通过从Native的Activity找到的一个例子来分析mRequests。 ``` [android_app_NativeActivity.cpp-->loadNativeCode_native()] static jint loadNativeCode_native(JNIEnv* env, jobject clazz,jstring path,                           jstringfuncName,jobject messageQueue,                           jstringinternalDataDir, jstring obbDir,                           jstringexternalDataDir, int sdkVersion,                           jobject jAssetMgr,jbyteArray savedState) {     ......     /* 调用Looper的addFd函数。第一个参数表示监听的fd;第二个参数0表示ident;       第三个参数表示需要监听的事件,这里为只监听可读事件;第四个参数为回调函数,当该fd发生       指定事件时,looper将回调该函数;第五个参数code为回调函数的参数 */     code->looper->addFd(code->mainWorkRead,0,                           ALOOPER_EVENT_INPUT,mainWorkCallback, code);   ...... } ``` Looper的addFd()代码如下所示: ``` [Looper.cpp-->Looper::addFd()] int Looper::addFd(int fd, int ident, int events,                       ALooper_callbackFunccallback, void* data) {     if (!callback) {          /* 判断该Looper是否支持不带回调函数的文件句柄添加。一般不支持,因为没有回调函数            Looper也不知道如何处理该文件句柄上发生的事情 */          if(! mAllowNonCallbacks) {            return -1;         }       ......     } #ifdef LOOPER_USES_EPOLL     intepollEvents = 0;     // 将用户的事件转换成epoll使用的值     if(events & ALOOPER_EVENT_INPUT) epollEvents |= EPOLLIN;     if(events & ALOOPER_EVENT_OUTPUT) epollEvents |= EPOLLOUT;     {        AutoMutex _l(mLock);        Request request; // 创建一个Request对象        request.fd = fd; // 保存fd        request.ident = ident; // 保存id        request.callback = callback; //保存callback        request.data = data;  // 保存用户自定义数据        struct epoll_event eventItem;        memset(& eventItem, 0, sizeof(epoll_event));        eventItem.events = epollEvents;        eventItem.data.fd = fd;         // 判断该Request是否已经存在,mRequests以fd作为key值        ssize_t requestIndex = mRequests.indexOfKey(fd);         if(requestIndex < 0) {            // 如果是新的文件句柄,则需要为epoll增加该fd            int epollResult = epoll_ctl(mEpollFd, EPOLL_CTL_ADD, fd, &eventItem);            ......            // 保存Request到mRequests键值数组            mRequests.add(fd, request);         }else {            // 如果之前加过,那么就修改该监听句柄的一些信息            int epollResult = epoll_ctl(mEpollFd, EPOLL_CTL_MOD, fd, &eventItem);           ......            mRequests.replaceValueAt(requestIndex, request);         }     } #else     ...... #endif     return1; } ``` #### 4\. 处理监控请求 我们发现在pollInner()函数中,当某个监控fd上发生事件后,就会把对应的Request取出来调用。 ``` pushResponse(events, mRequests.itemAt(i)); ``` 此函数如下: ``` [Looper.cpp-->Looper::pushResponse()] void Looper::pushResponse(int events, constRequest& request) {     Responseresponse;    response.events = events;    response.request = request; //其实很简单,就是保存所发生的事情和对应的Request     mResponses.push(response);//然后保存到mResponse数组 } ``` 根据前面的知识可知,并不是单独处理Request,而是需要先收集Request,等到Native Message消息处理完之后再做处理。这表明,在处理逻辑上,Native Message的优先级高于监控FD的优先级。 下面来了解如何添加Native的Message。 #### 5\. Native的sendMessage Android 2.2中只有Java层才可以通过sendMessage()往MessageQueue中添加消息,从4.0开始,Native层也支持sendMessage()了。sendMessage()的代码如下: ``` [Looper.cpp-->Looper::sendMessage()] void Looper::sendMessage(constsp<MessageHandler>& handler,                               constMessage& message) {     //Native的sendMessage函数必须同时传递一个Handler     nsecs_tnow = systemTime(SYSTEM_TIME_MONOTONIC);    sendMessageAtTime(now, handler, message); //调用sendMessageAtTime } [Looper.java-->Looper::sendMessageAtTime()] void Looper::sendMessageAtTime(nsecs_t uptime,                                      constsp<MessageHandler>& handler,                                      constMessage& message) {    size_t i= 0;     {        AutoMutex _l(mLock);        size_t messageCount = mMessageEnvelopes.size();         // 按时间排序,将消息插入到正确的位置上        while (i < messageCount &&                uptime >= mMessageEnvelopes.itemAt(i).uptime) {            i += 1;         }        MessageEnvelope messageEnvelope(uptime, handler, message);        mMessageEnvelopes.insertAt(messageEnvelope, i, 1);         // mSendingMessage和Java层中的那个mBlocked一样,是一个小小的优化措施         if(mSendingMessage) {            return;         }     }     // 唤醒epoll_wait,让它处理消息     if (i ==0) {        wake();     } } ``` ### 2.3.4 MessageQueue总结 想不到,一个小小的MessageQueue竟然有如此多的内容。在后面分析Android输入系统时,会再次在Native层和MessageQueue碰面,这里仅是为后面的相会打下一定的基础。 现在将站在一个比具体代码更高的层次来认识一下MessageQueue和它的伙伴们。 #### 1\. 消息处理的大家族合照 MessageQueue只是消息处理大家族的一员,该家族的成员合照如图2-5所示。 ![](https://box.kancloud.cn/2016-03-01_56d567b17d0da.png) 图 2 - 5 消息处理的家族合照 结合前述内容可从图2-5中得到: + Java层提供了Looper类和MessageQueue类,其中Looper类提供循环处理消息的机制,MessageQueue类提供一个消息队列,以及插入、删除和提取消息的函数接口。另外,Handler也是在Java层常用的与消息处理相关的类。 + MessageQueue内部通过mPtr变量保存一个Native层的NativeMessageQueue对象,mMessages保存来自Java层的Message消息。 + NativeMessageQueue保存一个native的Looper对象,该Looper从ALooper派生,提供pollOnce和addFd等函数。 + Java层有Message类和Handler类,而Native层对应也有Message类和MessageHandler抽象类。在编码时,一般使用的是MessageHandler的派生类WeakMessageHandler类。 注意 在include/media/stagfright/foundation目录下也定义了一个ALooper类,它是供stagefright使用的类似Java消息循环的一套基础类。这种同名类的产生,估计是两个事先未做交流的Group的人写的。 #### 2\. MessageQueue处理流程总结 + MessageQueue核心逻辑下移到Native层后,极大地拓展了消息处理的范围,总结一下有以下几点: + MessageQueue继续支持来自Java层的Message消息,也就是早期的Message加Handler的处理方式。 + MessageQueue在Native层的代表NativeMessageQueue支持来自Native层的Message,是通过Native的Message和MessageHandler来处理的。 + NativeMessageQueue还处理通过addFd添加的Request。在后面分析输入系统时,还会大量碰到这种方式。 + 从处理逻辑上看,先是Native的Message,然后是Native的Request,最后才是Java的Message。 ## 2.4 本章小结 本章先对Java层的Binder架构做了一次较为深入的分析。Java层的Binder架构和Native层Binder架构类似,但是Java的Binder在通信上还是依赖Native层的Binder。建议想进一步了解Native Binder工作原理的读者,阅读卷I第6章“深入理解Binder”。另外,本章还对MessageQueue进行了较为深入的分析。Android 2.2中那个功能简单的MessageQueue现在变得复杂了,原因是该类的核心逻辑下移到Native层,导致现在的MessageQueue除了支持Java层的Message派发外,还新增了支持Native Message派发以及处理来自所监控的文件句柄的事件。