10.6：ARP缓存表 · LwIP应用开发实战指南

既然已经解释了ARP的用途，我们再来看看它是如何工作的。为了实现IP地址与网卡MAC地址的查询与转换，ARP协议引入了ARP缓存表的概念，每台主机或路由器在其内存中具有一个ARP缓存表（ARP table），这张表包含IP地址到MAC地址的映射关系，表中记录了对，他们是主机最近运行时获得关于其他主机的IP地址到物理地址的映射，当需要发送IP数据的时候，主机就会根据目标IP地址到ARP缓存表中进行查找对应的MAC地址，然后通过网卡将数据发送出去。ARP表也包含一个寿命（TTL）值，它指示了从表中删除每个映射的时间。从一个表项放置到某ARP表中开始，一个表项通常的过期时间是10分钟。我们电脑也是有自己的ARP缓存表的，可以在控制台中通过“arp -a”命令进行查看，具体见图 10‑2。 ![](https://box.kancloud.cn/9fb1f6f82bea09e078033d3cf56a8089_554x372.png) 从图中可以看到作者的电脑有很多这样子的缓存表，其中192.168.0.181是我电脑的IP地址，而192.168.0.xxx这些IP是公司的其他电脑与其对应的物理地址（MAC地址），比如IP地址为192.168.0.108的电脑MAC地址为dc-72-9b-cf-0c-e5，如果我想向该电脑发送一个数据包，那么我的电脑就会从已有的ARP缓存表中寻找这个IP地址对应的物理地址，然后直接将数据写入以太网数据帧中让网卡进行发送即可，而如果没有找到这个IP地址，那么这个数据就没法立即发送，电脑会先在局域网上广播一个ARP请求（目标MAC地址为FF-FF-FF-FF-FF-FF），广播的ARP请求发出后，处于同一局域网内的所有主机都会接收到这个请求，如果目标IP地址与主机自身IP地址吻合就会返回一个ARP应答，告诉请求者自身的MAC地址，当我的电脑收到这个ARP应答后，就去更新ARP缓存表，并且重新将数据发送出去。 ARP协议的核心就是对缓存表的操作，发送数据包的时候，查找ARP缓存表以得到对应的MAC地址，必要时进行ARP缓存表的更新，此外ARP还需要不断处理其他主机的ARP请求，在ARP缓存表中的TTL即将过期的时候更新缓存表以保证缓存表中的表项有效。其运作过程大致可以理解为： 1. 如果主机A想发送数据给主机B，主机A首先会检查自己的ARP缓存表，查看是否有主机B的IP地址和MAC地址的对应关系，如果有，则会将主机B的MAC地址作为源MAC地址封装到数据帧中。如果本地ARP缓存中没有对应关系，主机A就会向局域网中广播ARP请求（包括发送方的IP地址、MAC地址、接收方的IP地址），每台主机接收到ARP请求后都检查自己的IP地址是否与ARP请求中的接收方IP地址相同，若不相同则丢弃ARP请求包。 2. 当交换机接受到此数据帧之后，发现此数据帧是广播帧，因此，会将此数据帧从非接收的所有接口发送出去。 3. 当主机B接受到此数据帧后，会校对IP地址是否是自己的，并将主机A的IP地址和MAC地址的对应关系记录到自己的ARP缓存表中，同时会发送一个ARP响应，其中包括自己的MAC地址。 4. 主机A在收到这个回应的数据帧之后，在自己的ARP缓存表中记录主机B的IP地址和MAC地址的对应关系。而此时交换机已经学习到了主机A和主机B的MAC地址了。那么在LwIP中缓存表是如何实现的呢？下面我们就结合源码进行讲解。 ARP协议的核心是ARP缓存表，ARP的实质就是对缓存表的建立、更新、查询等操作，ARP缓存表的核心是表项（entry）。LwIP使用一个arp\_table数组描述ARP缓存表，数组的内容是表项的内容，具体见代码清单 10‑1。每个表项都必须记录一对IP地址与MAC地址的映射关系，此外还有一些基本的信息，如表项的状态、生命周期（生存时间）以及对应网卡的基本信息，LwIP使用一个etharp\_entry结构体对表项进行描述，具体见代码清单 10‑2。 ``` static struct etharp_entry arp_table[ARP_TABLE_SIZE]; ``` 编译器预先定义了缓存表的大小，ARP\_TABLE\_SIZE默认为10，也就是最大能存放10个表项，由于这个表很小，LwIP对表的操作直接采用遍历方式，遍历每个表项并且更改其中的内容。 ``` 1 struct etharp_entry 2 { 3 #if ARP_QUEUEING 4 /** 指向此ARP表项上挂起的数据包队列的指针。 */ 5 struct etharp_q_entry *q; (1)-① 6 #else 7 /** 指向此ARP表项上的单个挂起数据包的指针。 */ 8 struct pbuf *q; (1)-② 9 #endif 10 ip4_addr_t ipaddr; (2) 11 struct netif *netif; (3) 12 struct eth_addr ethaddr; (4) 13 u16_t ctime; (5) 14 u8_t state; (6) 15 }; ``` (1)：这里使用了一个宏定义进行预编译，默认配置该宏定义是不打开的，其实都是一样，q都是指向数据包，(1)-①中的etharp_q_entry指向的是数据包缓存队列，etharp_q_entry是一个结构体，具体见代码清单 10 3，如果将ARP_QUEUEING宏定义打开，系统会为etharp_q_entry结构体开辟一些MEMP_ARP_QUEUEING类型的内存池，以便快速申请内存。而(1)-②中的q直接指向单个数据包。具体见图 10-3与图 10-4。 ![](https://box.kancloud.cn/61df907fb1744e40fca8cfb958dab9a6_364x217.png) ![](https://box.kancloud.cn/508a7eca5cbb43b2fb5b87400e6a0750_732x213.png) ``` 1 struct etharp_q_entry 2 { 3 struct etharp_q_entry *next; 4 struct pbuf *p; 5 }; ``` (2)：记录目标IP地址。 (3)：对应网卡信息。 (4)：记录与目标IP地址对应的MAC地址。 (5)：生存时间。 (6)：表项的状态，LwIP中用枚举类型定义了不同的状态，具体见： ``` 1 /** ARP states */ 2 enum etharp_state 3 { 4 ETHARP_STATE_EMPTY = 0, 5 ETHARP_STATE_PENDING, 6 ETHARP_STATE_STABLE, 7 ETHARP_STATE_STABLE_REREQUESTING_1, 8 ETHARP_STATE_STABLE_REREQUESTING_2 9 #if ETHARP_SUPPORT_STATIC_ENTRIES 10 , ETHARP_STATE_STATIC 11 #endif /* ETHARP_SUPPORT_STATIC_ENTRIES */ 12 }; ``` ARP缓存表在初始化的时候，所有的表项都会被初始化为ETHARP\_STATE\_EMPTY，也就是空状态，表示这些表项能被使用，在需要添加表项的时候，LwIP内核就会遍历ARP缓存表，找到合适的表项，进行添加。如果ARP表项处于ETHARP\_STATE\_PENDING状态，表示ARP已经发出了一个ARP请求包，但是还未收到目标IP地址主机的应答，处于这个状态的缓存表项是有等待时间的，它通过宏定义ARP\_MAXPENDING指定，默认为5秒钟，如果从发出ARP请求包后的5秒内还没收到应答，那么该表项又会被删除；而如果收到应答后，ARP就会更新缓存表的信息，记录目标IP地址与目标MAC地址的映射关系并且开始记录表项的生存时间，同时该表项的状态会变成ETHARP\_STATE\_STABLE状态。当要发送数据包的时候，而此时表项为ETHARP\_STATE\_PENDING状态，那么这些数据包就会暂时被挂载到表项的数据包缓冲队列上，直到表项的状态为ETHARP\_STATE\_STABLE，才进行发送数据包。对于状态为ETHARP\_STATE\_STABLE的表项，这些表项代表着ARP记录了IP地址与MAC地址的映射关系，能随意通过IP地址进行数据的发送，但是这些表项是具有生存时间的，通过宏定义ARP\_MAXAGE指定，默认为5分钟，在这些时间，LwIP会不断维护这些缓存表以保持缓存表的有效。当表项是ETHARP\_STATE\_STABLE的时候又发送一个ARP请求包，那么表项状态会暂时被设置为ETHARP\_STATE\_STABLE\_REREQUESTING\_1，然后被设置为ETHARP\_STATE\_STABLE\_REREQUESTING\_2状态，这些是一个过渡状态，当收到ARP应答后，表项又会被设置为ETHARP\_STATE\_STABLE，这样子能保持表项的有效。所以ARP缓存表是一个动态更新的过程，为什么要动态更新呢？因为以太网的物理性质并不能保证数据传输的是可靠的。以太网发送数据并不会知道对方是否已经介绍成功，而两台主机的物理线路不可能一直保持有效畅通，那么如果不是动态更新的话，主机就不会知道另一台主机是否在工作中，这样子发出去的数据是没有意义的。比如两台主机A和B，一开始两台主机都是处于连接状态，能正常进行通信，但是某个时刻主机B断开了，但是主机A不会知道主机B是否正常运行，因为以太网不会提示主机B已经断开，那么主机A会一直按照MAC地址发送数据，而此时在物理链路层就已经是不通的，那么这些数据是没有意义的，而如果ARP动态更新的话，主机A就会发出ARP请求包，如果得不到主机B的回应，则说明无法与主机B进行通信，那么就会删除ARP表项，就无法进行通信。