在Vold代码中,使用NM模块的流程是:
- 调用Instance创建一个NM对象。
- 调用setBroadcaster设置CL对象。
- 调用start启动NM。
接下来,按这三个步骤来分析NM模块。
1. 创建NM
Vold调用Instance函数创建了一个NM对象。看到Instance这个函数,读者应能想到,这里可能是采用了单例模式。来看是否如此,代码如下所示。
**NetlinkManager.cpp**
~~~
NetlinkManager *NetlinkManager::Instance() {
if(!sInstance)
sInstance = new NetlinkManager();//果然是单例模式
returnsInstance;
}
~~~
NM的创建真是非常简单。再看第二个被调用的函数setBroadcaster。
2. setBroadcaster的分析
setBroadcaster就更简单了,它的实现在NetlinkManger类的声明中,如下所示:
**NetlinkManager.h**
~~~
void setBroadcaster(SocketListener *sl) {mBroadcaster = sl; }
~~~
setBroadcaster参数中的那个sl其实际类型为CommandListener。需要说明的是,虽然NM设置了CL对象,但Vold的NM并没有通过CL发送消息和接收命令,所以在图9-1中,NM模块和CL模块并没有连接线,这一点务请注意。
下面看最后一个函数start。
3. start的分析
前面说过,NM模块将使用Netlink和Kernel进行IPC通信,那么它是怎么做到的呢?来看代码,如下所示:
**NetlinkManager.cpp**
~~~
int NetlinkManager::start() {
//PF_NETLINK使用的socket地址结构是sockaddr_nl,而不是一般的sockaddr_in
structsockaddr_nl nladdr;
int sz= 64 * 1024;
memset(&nladdr, 0, sizeof(nladdr));
nladdr.nl_family = AF_NETLINK;
nladdr.nl_pid = getpid(); //设置自己的进程pid
nladdr.nl_groups = 0xffffffff;
/*
创建PF_NETLINK地址簇的socket,目前只支持SOCK_DGRAM类型,第三个参数
NETLINK_KOBJECT_UEVENT表示要接收内核的Uevent事件。
*/
if((mSock = socket(PF_NETLINK,
SOCK_DGRAM,NETLINK_KOBJECT_UEVENT)) < 0) {
......
return -1;
}
//设置Socket接收缓冲区大小
if(setsockopt(mSock, SOL_SOCKET, SO_RCVBUFFORCE, &sz, sizeof(sz)) < 0) {
......
return -1;
}
//必须对该socket执行bind操作
if(bind(mSock, (struct sockaddr *) &nladdr, sizeof(nladdr)) < 0) {
......
return -1;
}
//创建一个NetlinkHandler对象,并把创建好的Socket句柄传给它。
mHandler = new NetlinkHandler(mSock);
//调用NetlinkHandler对象的start
if(mHandler->start()) {
SLOGE("Unable to start NetlinkHandler: %s", strerror(errno));
return -1;
}
return0;
}
~~~
从代码上看,NM的start函数分为两个步骤:
- 创建地址簇为PF_NETLINK类型的socket并做一些设置,这样NM就能和Kernel通信了。关于Netlink的使用技巧网上有很多资料,读者可在Linux系统上通过man netlink命令来查询相关信息。
- 创建NetlinkHandler对象,并调用它的start。看来,后续工作都是由NetlinkHandler来完成的。
据上文分析可看出,NetlinkHandler才是真正的主角,下面就来分析它。为书写方便起见,NetlinkHandler简称为NLH。
4. NetlinkHandler的分析
(1)创建NLH
代码结构简单的Vold程序中,NetlinkHandler却有一个相对不简单的派生关系,如图9-2所示:
:-: ![](http://img.blog.csdn.net/20150802164431558?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
图9-2 NLH的派生关系图
直接看代码,来认识这个NLH:
**NetlinkHandler.cpp**
~~~
NetlinkHandler::NetlinkHandler(int listenerSocket):
NetlinkListener(listenerSocket) {
//调用基类NetlinkListener的构造函数。注意传入的参数是和Kernel通信的socket
//句柄。注意,文件描述符和句柄表示的是同一个东西,这里不再区分二者。
}
~~~
再看基类NetlinkListener的构造函数:
**NetlinkListener.cpp**
~~~
NetlinkListener::NetlinkListener(int socket) :
SocketListener(socket, false) {
//调用基类SocketListener的构造函数,第二个参数为false。
}
~~~
基类SocketListener的构造函数是:
**SocketListener.cpp**
~~~
SocketListener::SocketListener(int socketFd,bool listen) {
mListen = listen; //这个参数是false
mSocketName = NULL;
mSock = socketFd;//保存和Kernel通信的socket描述符
//初始化一个mutex,看来会有多个线程存在
pthread_mutex_init(&mClientsLock, NULL);
/*
SocketClientCollection的声明如下,它是一个列表容器。
typedef android::List<SocketClient *>SocketClientCollection
其中,SocketClient代表和Socket服务端通信的客户端。
*/
mClients = new SocketClientCollection();
}
~~~
NLH的创建分析完了。此过程中没有什么新鲜内容。下面看它的start函数。
本章内容会大量涉及Socket,所以读者应先了解与Socket有关的知识,如果需要深入研究,建议阅读《Unix NetworkingProgramming Volume I》[^write]一书。
(2)start的分析
在分析前面的代码时,曾看到NetlinkHandler会创建一个同步互斥对象,这表明NLH会在多线程环境中使用,那么这个线程会在哪里创建呢?来看start的代码,如下所示:
**NetlinkHandler.cpp**
~~~
int NetlinkHandler::start() {
returnthis->startListener();//startListener由SocketListener实现。
}
~~~
**SocketListener.cpp**
~~~
int SocketListener::startListener() {
if(!mSocketName && mSock == -1) {
errno = EINVAL;
return -1;
} elseif (mSocketName) {
if((mSock = android_get_control_socket(mSocketName)) < 0) {
return -1;
}
}
/*
还记得构造NLH时的参数嘛?mListen为false,这表明NLH不是监听端(listen)。
这里为了代码和操作的统一,用mSock做参数构造了一个SocketClient对象,
并加入到mClients列表中,但这个SocketClient并不是真实客户端的代表。
*/
if(mListen && listen(mSock, 4) < 0) {
......
return -1;
} else if (!mListen)//以mSock为参数构造SocketClient对象,并加入到对应列表中
mClients->push_back(new SocketClient(mSock));
/*
pipe系统调用将创建一个匿名管道,mCtrlPipe是一个int类型的二元数组。
其中mCtrlPipe[0]用于从管道读数据,mCtrlPipe[1]用于往管道写数据
*/
if(pipe(mCtrlPipe)) {
......
return -1;
}
//创建一个工作线程,线程函数是threadStart。
if(pthread_create(&mThread, NULL, SocketListener::threadStart, this)) {
......
return -1;
}
return0;
}
~~~
如果熟悉Socket编程,理解上面的代码就非常容易了。下面来看NLH的工作线程。
(3)工作线程的分析
工作线程的线程函数threadStart的代码如下所示:
**SocketListener.cpp**
~~~
void *SocketListener::threadStart(void *obj) {
SocketListener *me = reinterpret_cast<SocketListener *>(obj);
me->runListener();//调用runListener。
pthread_exit(NULL);
returnNULL;
}
//直接分析runListener
void SocketListener::runListener() {
while(1) {
SocketClientCollection::iterator it;
fd_set read_fds;
int rc = 0;
int max = 0;
FD_ZERO(&read_fds);
if(mListen) {//mListen为false,所以不走这个if分支
max = mSock;
FD_SET(mSock, &read_fds);
}
/*
计算max,为什么要有这个操作?这是由select函数决定的,它的第一个参数的取值
必须为它所监视的文件描述符集合中最大的文件描述符加1。
*/
FD_SET(mCtrlPipe[0], &read_fds);
if(mCtrlPipe[0] > max)
max = mCtrlPipe[0];
//还是计算fd值最大的那个
pthread_mutex_lock(&mClientsLock);
for (it = mClients->begin(); it != mClients->end(); ++it) {
FD_SET((*it)->getSocket(), &read_fds);
if ((*it)->getSocket() > max)
max = (*it)->getSocket();
}
pthread_mutex_unlock(&mClientsLock);
/*
注意select函数的第一个参数,为max+1。读者可以通过man select来查询
select的用法,注意,在Windows平台上的select对第一个参数没有要求。
*/
if((rc = select(max + 1, &read_fds, NULL, NULL, NULL)) < 0) {
sleep(1);
continue;
}else if (!rc)
continue;
//如果管道可读的话,表示需要退出工作线程。
if(FD_ISSET(mCtrlPipe[0], &read_fds))
break;
if(mListen && FD_ISSET(mSock, &read_fds)) {
//如果是listen端的话,mSock可读表示有客户端connect上
struct sockaddr addr;
socklen_t alen = sizeof(addr);
int c;
//调用accept接受客户端的连接,返回用于和客户端通信的Socket描述符
if ((c = accept(mSock, &addr, &alen)) < 0) {
SLOGE("accept failed (%s)", strerror(errno));
sleep(1);
continue;
}
pthread_mutex_lock(&mClientsLock);
//根据返回的客户端Socket描述符构造一个SocketClient对象,并加入到对应list
mClients->push_back(new SocketClient(c));
pthread_mutex_unlock(&mClientsLock);
}
do{
pthread_mutex_lock(&mClientsLock);
for (it = mClients->begin(); it !=mClients->end(); ++it) {
int fd = (*it)->getSocket();
if (FD_ISSET(fd, &read_fds)) {
pthread_mutex_unlock(&mClientsLock);
/*
有数据通过Socket发送过来,所以调用onDataAvailable进行处理。
如果在onDataAvailable返回false,表示需要关闭该连接。
*/
if (!onDataAvailable(*it)){
close(fd);
pthread_mutex_lock(&mClientsLock);
delete *it;
it =mClients->erase(it);
pthread_mutex_unlock(&mClientsLock);
}
FD_CLR(fd, &read_fds);
continue;
}
}
pthread_mutex_unlock(&mClientsLock);
}while (0);
}
}
~~~
从代码中可看到:
- 工作线程退出的条件是匿名管道可读,但在一般情况下不需要它退出,所以可以忽略此项内容。
- 不论是服务端还是客户端,收到数据后都会调用onDataAvailable进行处理。
下面就来看NLH的数据处理。
(4)数据处理
根据前面的分析,收到数据后首先调用onDataAvailable函数进行处理,这个函数由NLH的基类NetlinkListener实现。代码如下所示:
**NetlinkListener**
~~~
bool NetlinkListener::onDataAvailable(SocketClient*cli)
{
intsocket = cli->getSocket();
intcount;
/*
调用recev接收数据,如果接收错误,则返回false,这样这个socket在
上面的工作线程中就会被close。
*/
if((count = recv(socket, mBuffer, sizeof(mBuffer), 0)) < 0) {
SLOGE("recv failed (%s)", strerror(errno));
return false;
}
//new一个NetlinkEvent,并调用decode来解析接收到的Uevent数据
NetlinkEvent *evt = new NetlinkEvent();
if(!evt->decode(mBuffer, count)) {
goto out;
}
//调用onEvent,并传递NetlinkEvent对象。
onEvent(evt);
out:
deleteevt;
return true;
~~~
decode函数就是将收到的Uevent信息填充到一个NetlinkEvent对象中,例如Action是什么,SUBSYSTEM是什么等,以后处理Uevent时就不用再解析字符串了。
看onEvent函数,此函数是由NLH自己实现的,代码如下所示:
**NetlinkHandler.cpp**
~~~
void NetlinkHandler::onEvent(NetlinkEvent *evt){
VolumeManager *vm = VolumeManager::Instance();
constchar *subsys = evt->getSubsystem();
if(!subsys) {
return;
}
if (!strcmp(subsys, "block")) {
vm->handleBlockEvent(evt); //调用VM的handleBlockEvent
} elseif (!strcmp(subsys, "switch")) {
vm->handleSwitchEvent(evt);//调用VM的handleSwitchEvent
} else if (!strcmp(subsys, "battery")){
//这两个事件和外部存储系统没有关系,所以不处理
} elseif (!strcmp(subsys, "power_supply")) {
}
}
~~~
NLH的工作已介绍完,下面总结一下NM模块的工作。
5. NM模块的总结
NM模块的功能就是从Kernel接收Uevent消息,然后转换成一个NetlinkEvent对象,最后会调用VM的处理函数来处理这个NetlinkEvent对象。
[^write]: 该书中文版名为《UNIX网络编程第3版.第1卷,套接字联网API》,人民邮电出版社,2009年版。
- 前言
- 第1章 阅读前的准备工作
- 1.1 系统架构
- 1.1.1 Android系统架构
- 1.1.2 本书的架构
- 1.2 搭建开发环境
- 1.2.1 下载源码
- 1.2.2 编译源码
- 1.3 工具介绍
- 1.3.1 Source Insight介绍
- 1.3.2 Busybox的使用
- 1.4 本章小结
- 第2章 深入理解JNI
- 2.1 JNI概述
- 2.2 学习JNI的实例:MediaScanner
- 2.3 Java层的MediaScanner分析
- 2.3.1 加载JNI库
- 2.3.2 Java的native函数和总结
- 2.4 JNI层MediaScanner的分析
- 2.4.1 注册JNI函数
- 2.4.2 数据类型转换
- 2.4.3 JNIEnv介绍
- 2.4.4 通过JNIEnv操作jobject
- 2.4.5 jstring介绍
- 2.4.6 JNI类型签名介绍
- 2.4.7 垃圾回收
- 2.4.8 JNI中的异常处理
- 2.5 本章小结
- 第3章 深入理解init
- 3.1 概述
- 3.2 init分析
- 3.2.1 解析配置文件
- 3.2.2 解析service
- 3.2.3 init控制service
- 3.2.4 属性服务
- 3.3 本章小结
- 第4章 深入理解zygote
- 4.1 概述
- 4.2 zygote分析
- 4.2.1 AppRuntime分析
- 4.2.2 Welcome to Java World
- 4.2.3 关于zygote的总结
- 4.3 SystemServer分析
- 4.3.1 SystemServer的诞生
- 4.3.2 SystemServer的重要使命
- 4.3.3 关于 SystemServer的总结
- 4.4 zygote的分裂
- 4.4.1 ActivityManagerService发送请求
- 4.4.2 有求必应之响应请求
- 4.4.3 关于zygote分裂的总结
- 4.5 拓展思考
- 4.5.1 虚拟机heapsize的限制
- 4.5.2 开机速度优化
- 4.5.3 Watchdog分析
- 4.6 本章小结
- 第5章 深入理解常见类
- 5.1 概述
- 5.2 以“三板斧”揭秘RefBase、sp和wp
- 5.2.1 第一板斧--初识影子对象
- 5.2.2 第二板斧--由弱生强
- 5.2.3 第三板斧--破解生死魔咒
- 5.2.4 轻量级的引用计数控制类LightRefBase
- 5.2.5 题外话-三板斧的来历
- 5.3 Thread类及常用同步类分析
- 5.3.1 一个变量引发的思考
- 5.3.2 常用同步类
- 5.4 Looper和Handler类分析
- 5.4.1 Looper类分析
- 5.4.2 Handler分析
- 5.4.3 Looper和Handler的同步关系
- 5.4.4 HandlerThread介绍
- 5.5 本章小结
- 第6章 深入理解Binder
- 6.1 概述
- 6.2 庖丁解MediaServer
- 6.2.1 MediaServer的入口函数
- 6.2.2 独一无二的ProcessState
- 6.2.3 时空穿越魔术-defaultServiceManager
- 6.2.4 注册MediaPlayerService
- 6.2.5 秋风扫落叶-StartThread Pool和join Thread Pool分析
- 6.2.6 你彻底明白了吗
- 6.3 服务总管ServiceManager
- 6.3.1 ServiceManager的原理
- 6.3.2 服务的注册
- 6.3.3 ServiceManager存在的意义
- 6.4 MediaPlayerService和它的Client
- 6.4.1 查询ServiceManager
- 6.4.2 子承父业
- 6.5 拓展思考
- 6.5.1 Binder和线程的关系
- 6.5.2 有人情味的讣告
- 6.5.3 匿名Service
- 6.6 学以致用
- 6.6.1 纯Native的Service
- 6.6.2 扶得起的“阿斗”(aidl)
- 6.7 本章小结
- 第7章 深入理解Audio系统
- 7.1 概述
- 7.2 AudioTrack的破解
- 7.2.1 用例介绍
- 7.2.2 AudioTrack(Java空间)分析
- 7.2.3 AudioTrack(Native空间)分析
- 7.2.4 关于AudioTrack的总结
- 7.3 AudioFlinger的破解
- 7.3.1 AudioFlinger的诞生
- 7.3.2 通过流程分析AudioFlinger
- 7.3.3 audio_track_cblk_t分析
- 7.3.4 关于AudioFlinger的总结
- 7.4 AudioPolicyService的破解
- 7.4.1 AudioPolicyService的创建
- 7.4.2 重回AudioTrack
- 7.4.3 声音路由切换实例分析
- 7.4.4 关于AudioPolicy的总结
- 7.5 拓展思考
- 7.5.1 DuplicatingThread破解
- 7.5.2 题外话
- 7.6 本章小结
- 第8章 深入理解Surface系统
- 8.1 概述
- 8.2 一个Activity的显示
- 8.2.1 Activity的创建
- 8.2.2 Activity的UI绘制
- 8.2.3 关于Activity的总结
- 8.3 初识Surface
- 8.3.1 和Surface有关的流程总结
- 8.3.2 Surface之乾坤大挪移
- 8.3.3 乾坤大挪移的JNI层分析
- 8.3.4 Surface和画图
- 8.3.5 初识Surface小结
- 8.4 深入分析Surface
- 8.4.1 与Surface相关的基础知识介绍
- 8.4.2 SurfaceComposerClient分析
- 8.4.3 SurfaceControl分析
- 8.4.4 writeToParcel和Surface对象的创建
- 8.4.5 lockCanvas和unlockCanvasAndPost分析
- 8.4.6 GraphicBuffer介绍
- 8.4.7 深入分析Surface的总结
- 8.5 SurfaceFlinger分析
- 8.5.1 SurfaceFlinger的诞生
- 8.5.2 SF工作线程分析
- 8.5.3 Transaction分析
- 8.5.4 关于SurfaceFlinger的总结
- 8.6 拓展思考
- 8.6.1 Surface系统的CB对象分析
- 8.6.2 ViewRoot的你问我答
- 8.6.3 LayerBuffer分析
- 8.7 本章小结
- 第9章 深入理解Vold和Rild
- 9.1 概述
- 9.2 Vold的原理与机制分析
- 9.2.1 Netlink和Uevent介绍
- 9.2.2 初识Vold
- 9.2.3 NetlinkManager模块分析
- 9.2.4 VolumeManager模块分析
- 9.2.5 CommandListener模块分析
- 9.2.6 Vold实例分析
- 9.2.7 关于Vold的总结
- 9.3 Rild的原理与机制分析
- 9.3.1 初识Rild
- 9.3.2 RIL_startEventLoop分析
- 9.3.3 RIL_Init分析
- 9.3.4 RIL_register分析
- 9.3.5 关于Rild main函数的总结
- 9.3.6 Rild实例分析
- 9.3.7 关于Rild的总结
- 9.4 拓展思考
- 9.4.1 嵌入式系统的存储知识介绍
- 9.4.2 Rild和Phone的改进探讨
- 9.5 本章小结
- 第10章 深入理解MediaScanner
- 10.1 概述
- 10.2 android.process.media分析
- 10.2.1 MSR模块分析
- 10.2.2 MSS模块分析
- 10.2.3 android.process.media媒体扫描工作的流程总结
- 10.3 MediaScanner分析
- 10.3.1 Java层分析
- 10.3.2 JNI层分析
- 10.3.3 PVMediaScanner分析
- 10.3.4 关于MediaScanner的总结
- 10.4 拓展思考
- 10.4.1 MediaScannerConnection介绍
- 10.4.2 我问你答
- 10.5 本章小结