💎一站式轻松地调用各大LLM模型接口,支持GPT4、智谱、星火、月之暗面及文生图 广告
既然已经解释了ARP的用途,我们再来看看它是如何工作的。为了实现IP地址与网卡MAC地址的查询与转换,ARP协议引入了ARP缓存表的概念,每台主机或路由器在其内存中具有一个ARP缓存表(ARP table),这张表包含IP地址到MAC地址的映射关系,表中记录了对,他们是主机最近运行时获得关于其他主机的IP地址到物理地址的映射,当需要发送IP数据的时候,主机就会根据目标IP地址到ARP缓存表中进行查找对应的MAC地址,然后通过网卡将数据发送出去。ARP表也包含一个寿命(TTL)值,它指示了从表中删除每个映射的时间。从一个表项放置到某ARP表中开始,一个表项通常的过期时间是10分钟。 我们电脑也是有自己的ARP缓存表的,可以在控制台中通过“arp -a”命令进行查看,具体见图 10‑2。 ![](https://box.kancloud.cn/9fb1f6f82bea09e078033d3cf56a8089_554x372.png) 从图中可以看到作者的电脑有很多这样子的缓存表,其中192.168.0.181是我电脑的IP地址,而192.168.0.xxx这些IP是公司的其他电脑与其对应的物理地址(MAC地址),比如IP地址为192.168.0.108的电脑MAC地址为dc-72-9b-cf-0c-e5,如果我想向该电脑发送一个数据包,那么我的电脑就会从已有的ARP缓存表中寻找这个IP地址对应的物理地址,然后直接将数据写入以太网数据帧中让网卡进行发送即可,而如果没有找到这个IP地址,那么这个数据就没法立即发送,电脑会先在局域网上广播一个ARP请求(目标MAC地址为FF-FF-FF-FF-FF-FF),广播的ARP请求发出后,处于同一局域网内的所有主机都会接收到这个请求,如果目标IP地址与主机自身IP地址吻合就会返回一个ARP应答,告诉请求者自身的MAC地址,当我的电脑收到这个ARP应答后,就去更新ARP缓存表,并且重新将数据发送出去。 ARP协议的核心就是对缓存表的操作,发送数据包的时候,查找ARP缓存表以得到对应的MAC地址,必要时进行ARP缓存表的更新,此外ARP还需要不断处理其他主机的ARP请求,在ARP缓存表中的TTL即将过期的时候更新缓存表以保证缓存表中的表项有效。 其运作过程大致可以理解为: 1. 如果主机A想发送数据给主机B,主机A首先会检查自己的ARP缓存表,查看是否有主机B的IP地址和MAC地址的对应关系,如果有,则会将主机B的MAC地址作为源MAC地址封装到数据帧中。如果本地ARP缓存中没有对应关系,主机A就会向局域网中广播ARP请求(包括发送方的IP地址、MAC地址、接收方的IP地址),每台主机接收到ARP请求后都检查自己的IP地址是否与ARP请求中的接收方IP地址相同,若不相同则丢弃ARP请求包。 2. 当交换机接受到此数据帧之后,发现此数据帧是广播帧,因此,会将此数据帧从非接收的所有接口发送出去。 3. 当主机B接受到此数据帧后,会校对IP地址是否是自己的,并将主机A的IP地址和MAC地址的对应关系记录到自己的ARP缓存表中,同时会发送一个ARP响应,其中包括自己的MAC地址。 4. 主机A在收到这个回应的数据帧之后,在自己的ARP缓存表中记录主机B的IP地址和MAC地址的对应关系。而此时交换机已经学习到了主机A和主机B的MAC地址了。 那么在LwIP中缓存表是如何实现的呢?下面我们就结合源码进行讲解。 ARP协议的核心是ARP缓存表,ARP的实质就是对缓存表的建立、更新、查询等操作,ARP缓存表的核心是表项(entry)。LwIP使用一个arp\_table数组描述ARP缓存表,数组的内容是表项的内容,具体见代码清单 10‑1。每个表项都必须记录一对IP地址与MAC地址的映射关系,此外还有一些基本的信息,如表项的状态、生命周期(生存时间)以及对应网卡的基本信息,LwIP使用一个etharp\_entry结构体对表项进行描述,具体见代码清单 10‑2。 ``` static struct etharp_entry arp_table[ARP_TABLE_SIZE]; ``` 编译器预先定义了缓存表的大小,ARP\_TABLE\_SIZE默认为10,也就是最大能存放10个表项,由于这个表很小,LwIP对表的操作直接采用遍历方式,遍历每个表项并且更改其中的内容。 ``` 1 struct etharp_entry 2 { 3 #if ARP_QUEUEING 4 /** 指向此ARP表项上挂起的数据包队列的指针。 */ 5 struct etharp_q_entry *q; (1)-① 6 #else 7 /** 指向此ARP表项上的单个挂起数据包的指针。 */ 8 struct pbuf *q; (1)-② 9 #endif 10 ip4_addr_t ipaddr; (2) 11 struct netif *netif; (3) 12 struct eth_addr ethaddr; (4) 13 u16_t ctime; (5) 14 u8_t state; (6) 15 }; ``` (1):这里使用了一个宏定义进行预编译,默认配置该宏定义是不打开的,其实都是一样,q都是指向数据包,(1)-①中的etharp_q_entry指向的是数据包缓存队列,etharp_q_entry是一个结构体,具体见代码清单 10 3,如果将ARP_QUEUEING宏定义打开,系统会为etharp_q_entry结构体开辟一些MEMP_ARP_QUEUEING类型的内存池,以便快速申请内存。而(1)-②中的q直接指向单个数据包。具体见图 10-3与图 10-4。 ![](https://box.kancloud.cn/61df907fb1744e40fca8cfb958dab9a6_364x217.png) ![](https://box.kancloud.cn/508a7eca5cbb43b2fb5b87400e6a0750_732x213.png) ``` 1 struct etharp_q_entry 2 { 3 struct etharp_q_entry *next; 4 struct pbuf *p; 5 }; ``` (2):记录目标IP地址。 (3): 对应网卡信息。 (4):记录与目标IP地址对应的MAC地址。 (5):生存时间。 (6):表项的状态,LwIP中用枚举类型定义了不同的状态,具体见: ``` 1 /** ARP states */ 2 enum etharp_state 3 { 4 ETHARP_STATE_EMPTY = 0, 5 ETHARP_STATE_PENDING, 6 ETHARP_STATE_STABLE, 7 ETHARP_STATE_STABLE_REREQUESTING_1, 8 ETHARP_STATE_STABLE_REREQUESTING_2 9 #if ETHARP_SUPPORT_STATIC_ENTRIES 10 , ETHARP_STATE_STATIC 11 #endif /* ETHARP_SUPPORT_STATIC_ENTRIES */ 12 }; ``` ARP缓存表在初始化的时候,所有的表项都会被初始化为ETHARP\_STATE\_EMPTY,也就是空状态,表示这些表项能被使用,在需要添加表项的时候,LwIP内核就会遍历ARP缓存表,找到合适的表项,进行添加。如果ARP表项处于ETHARP\_STATE\_PENDING状态,表示ARP已经发出了一个ARP请求包,但是还未收到目标IP地址主机的应答,处于这个状态的缓存表项是有等待时间的,它通过宏定义ARP\_MAXPENDING指定,默认为5秒钟,如果从发出ARP请求包后的5秒内还没收到应答,那么该表项又会被删除;而如果收到应答后,ARP就会更新缓存表的信息,记录目标IP地址与目标MAC地址的映射关系并且开始记录表项的生存时间,同时该表项的状态会变成ETHARP\_STATE\_STABLE状态。当要发送数据包的时候,而此时表项为ETHARP\_STATE\_PENDING状态,那么这些数据包就会暂时被挂载到表项的数据包缓冲队列上,直到表项的状态为ETHARP\_STATE\_STABLE,才进行发送数据包。对于状态为ETHARP\_STATE\_STABLE的表项,这些表项代表着ARP记录了IP地址与MAC地址的映射关系,能随意通过IP地址进行数据的发送,但是这些表项是具有生存时间的,通过宏定义ARP\_MAXAGE指定,默认为5分钟,在这些时间,LwIP会不断维护这些缓存表以保持缓存表的有效。当表项是ETHARP\_STATE\_STABLE的时候又发送一个ARP请求包,那么表项状态会暂时被设置为ETHARP\_STATE\_STABLE\_REREQUESTING\_1,然后被设置为ETHARP\_STATE\_STABLE\_REREQUESTING\_2状态,这些是一个过渡状态,当收到ARP应答后,表项又会被设置为ETHARP\_STATE\_STABLE,这样子能保持表项的有效。 所以ARP缓存表是一个动态更新的过程,为什么要动态更新呢?因为以太网的物理性质并不能保证数据传输的是可靠的。以太网发送数据并不会知道对方是否已经介绍成功,而两台主机的物理线路不可能一直保持有效畅通,那么如果不是动态更新的话,主机就不会知道另一台主机是否在工作中,这样子发出去的数据是没有意义的。比如两台主机A和B,一开始两台主机都是处于连接状态,能正常进行通信,但是某个时刻主机B断开了,但是主机A不会知道主机B是否正常运行,因为以太网不会提示主机B已经断开,那么主机A会一直按照MAC地址发送数据,而此时在物理链路层就已经是不通的,那么这些数据是没有意义的,而如果ARP动态更新的话,主机A就会发出ARP请求包,如果得不到主机B的回应,则说明无法与主机B进行通信,那么就会删除ARP表项,就无法进行通信。