ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
# 内存,第 1 部分:堆内存简介 > 原文:<https://github.com/angrave/SystemProgramming/wiki/Memory%2C-Part-1%3A-Heap-Memory-Introduction> ## C 动态内存分配 ## 当我打电话给 malloc 时会发生什么? 函数`malloc`是 C 库调用,用于保留连续的内存块。与栈内存不同,内存保持分配状态,直到使用相同的指针调用`free`。还有`calloc`和`realloc`,将在下面讨论。 ## malloc 可以失败吗? 如果`malloc`无法再保留更多内存,则返回`NULL`。强大的程序应该检查返回值。如果您的代码假定`malloc`成功但它没有,那么当您尝试写入地址 0 时,您的程序可能会崩溃(segfault)。 ## 堆在哪里,它有多大? 堆是进程内存的一部分,它没有固定的大小。当您调用`malloc`(`calloc`,`realloc`)和`free`时,堆存储器分配由 C 库执行。 首先快速回顾一下进程内存:进程是程序的运行实例。每个进程都有自己的地址空间。例如,在 32 位机器上,您的进程可以获得大约 40 亿个地址,但并非所有这些地址都有效,甚至映射到实际物理内存(RAM)。在进程内存中,您将找到可执行代码,栈空间,环境变量,全局(静态)变量和堆。 通过调用`sbrk`,C 库可以增加堆的大小,因为程序需要更多的堆内存。由于堆和栈(每个线程一个)需要增长,我们将它们放在地址空间的两端。因此,对于典型的体系结构,堆将向上生长并且栈向下增长。 真实性:现代操作系统内存分配器不再需要`sbrk` - 相反,它们可以请求虚拟内存的独立区域并维护多个内存区域。例如,可以将千兆字节请求放置在与小分配请求不同的存储器区域中。然而,这个细节是一个不必要的复杂性:碎片化和有效分配内存的问题仍然适用,因此我们将在这里忽略这种实现,并将写入就像堆是单个区域一样。 如果我们编写一个多线程程序(稍后会详细介绍),我们将需要多个栈(每个线程一个),但只有一个堆。 在典型的体系结构中,堆是`Data segment`的一部分,并从代码和全局变量的上方开始。 ## 程序需要调用 brk 或 sbrk 吗? 通常不会(虽然调用`sbrk(0)`会很有趣,因为它会告诉您堆当前的结束位置)。而程序使用`malloc,calloc,realloc`和`free`,它们是 C 库的一部分。当需要额外的堆内存时,这些函数的内部实现将调用`sbrk`。 ```c void *top_of_heap = sbrk(0); malloc(16384); void *top_of_heap2 = sbrk(0); printf("The top of heap went from %p to %p \n", top_of_heap, top_of_heap2); ``` 输出示例:`The top of heap went from 0x4000 to 0xa000` ## 什么是 calloc? 与`malloc`不同,`calloc`将内存内容初始化为零,并且还采用两个参数(项目数和每个项目的字节大小)。 `calloc`的简单但可读的实现如下所示: ```c void *calloc(size_t n, size_t size) { size_t total = n * size; // Does not check for overflow! void *result = malloc(total); if (!result) return NULL; // If we're using new memory pages // just allocated from the system by calling sbrk // then they will be zero so zero-ing out is unnecessary, memset(result, 0, total); return result; } ``` 这些局限性的高级讨论是 [](http://locklessinc.com/articles/calloc/) 。 程序员经常使用`calloc`而不是在`malloc`之后显式调用`memset`,将存储器内容设置为零。注意`calloc(x,y)`与`calloc(y,x)`相同,但您应遵循本手册的惯例。 ```c // Ensure our memory is initialized to zero link_t *link = malloc(256); memset(link, 0, 256); // Assumes malloc returned a valid address! link_t *link = calloc(1, 256); // safer: calloc(1, sizeof(link_t)); ``` ## 为什么 sbrk 首先返回的内存初始化为零? 如果操作系统没有将物理 RAM 的内容清零,则一个进程可能会了解先前使用过该内存的另一个进程的内存。这将是一个安全漏洞。 不幸的是,这意味着对于在释放任何内存之前的`malloc`请求和简单程序(最终使用系统中新保留的内存),内存 _ 通常为 _ 为零。然后程序员错误地写 C 程序,假设 malloc 的内存 _ 总是 _ 为零。 ```c char* ptr = malloc(300); // contents is probably zero because we get brand new memory // so beginner programs appear to work! // strcpy(ptr, "Some data"); // work with the data free(ptr); // later char *ptr2 = malloc(308); // Contents might now contain existing data and is probably not zero ``` ## 为什么 malloc 总是将内存初始化为零? 性能!我们希望 malloc 尽可能快。将内存清零可能是不必要的。 ## 什么是 realloc 以及何时使用它? `realloc`允许您调整先前在堆上分配的现有内存分配(通过 malloc,calloc 或 realloc)。 realloc 最常见的用途是调整用于保存值数组的内存。下面提出了一个简单但可读的 realloc 版本 ```c void * realloc(void * ptr, size_t newsize) { // Simple implementation always reserves more memory // and has no error checking void *result = malloc(newsize); size_t oldsize = ... //(depends on allocator's internal data structure) if (ptr) memcpy(result, ptr, newsize < oldsize ? newsize : oldsize); free(ptr); return result; } ``` INCORRECT 使用 realloc 如下所示: ```c int *array = malloc(sizeof(int) * 2); array[0] = 10; array[1] = 20; // Ooops need a bigger array - so use realloc.. realloc (array, 3); // ERRORS! array[2] = 30; ``` 上面的代码包含两个错误。首先,我们需要 3 * sizeof(int)字节而不是 3 字节。其次,realloc 可能需要将存储器的现有内容移动到新位置。例如,可能没有足够的空间,因为已经分配了相邻的字节。正确使用 realloc 如下所示。 ```c array = realloc(array, 3 * sizeof(int)); // If array is copied to a new location then old allocation will be freed. ``` 强大的版本也会检查`NULL`返回值。注意`realloc`可用于增长和缩小分配。 ## 我在哪里可以阅读更多? 请参见[手册页](http://man7.org/linux/man-pages/man3/malloc.3.html)! ## 内存分配快速有多重要? 非常!在大多数应用程序中,分配和取消分配堆内存是一种常见操作。 ## 分配简介 ## 什么是最愚蠢的 malloc 和免费实现以及它有什么问题? ```c void* malloc(size_t size) // Ask the system for more bytes by extending the heap space. // sbrk Returns -1 on failure void *p = sbrk(size); if(p == (void *) -1) return NULL; // No space left return p; } void free() {/* Do nothing */} ``` 上述实现存在两个主要缺点: * 系统调用很慢(与库调用相比)。我们应该保留大量的内存,只是偶尔要求系统提供更多内存。 * 没有重用已释放的内存。我们的程序永远不会重用堆内存 - 它只是不断要求更大的堆。 如果在典型程序中使用此分配器,则该过程将很快耗尽所有可用内存。相反,我们需要一个可以有效使用堆空间的分配器,并且只在必要时请求更多内存。 ## 什么是贴装策略? 在程序执行期间,内存被分配和解除分配(释放),因此堆内存中的间隙(空洞)可以重新用于将来的内存请求。内存分配器需要跟踪当前分配的堆的哪些部分以及哪些部分可用。 假设我们当前的堆大小是 64K,但并非所有的大小都在使用中,因为一些早期的 malloc 内存已被程序释放: | 16KB 免费 | 分配 10KB | 1KB 免费 | 分配 1KB | 30KB 免费 | 分配 4KB | 2KB 免费 | | --- | --- | --- | --- | --- | --- | --- | 如果执行了 2KB 的新 malloc 请求(`malloc(2048)`),`malloc`应该在哪里保留内存?它可以使用最后 2KB 的孔(恰好是完美的尺寸!)或者它可以分开另外两个自由孔中的一个。这些选择代表不同的放置策略。 无论选择哪个孔,分配器都需要将孔分成两个:新分配的空间(将返回到程序中)和一个较小的孔(如果有剩余空间)。 完美贴合策略找到足够大小(至少 2KB)的最小孔: | 16KB free | 10KB allocated | 1KB free | 1KB allocated | 30KB free | 4KB allocated | `2KB HERE!` | | --- | --- | --- | --- | --- | --- | --- | 最差的策略是找到足够大的最大孔(所以将 30KB 的孔分成两个): | 16KB free | 10KB allocated | 1KB free | 1KB allocated | `2KB HERE!` | `28KB free` | 4KB allocated | 2KB free | | --- | --- | --- | --- | --- | --- | --- | --- | 第一个拟合策略找到第一个足够大小的可用孔(将 16KB 孔分成两个): | `2KB HERE!` | `14KB free` | 10KB allocated | 1KB free | 1KB allocated | 30KB free | 4KB allocated | 2KB free | | --- | --- | --- | --- | --- | --- | --- | --- | ## 什么是外部碎片? 在下面的例子中,64KB 的堆内存中,分配了 17KB,47KB 是免费的。但是,最大的可用块只有 30KB,因为我们可用的未分配堆内存被分段为更小的块。 | `16KB free` | 10KB allocated | 1KB free | 1KB allocated | 30KB free | 4KB allocated | 2KB free | | --- | --- | --- | --- | --- | --- | --- | ## 放置策略对外部碎片和性能有何影响? 不同的策略以非显而易见的方式影响堆内存的碎片,这只能通过数学分析或在真实条件下仔细模拟(例如模拟数据库或 Web 服务器的内存分配请求)来发现。例如,乍一看最合适似乎是一个很好的策略,但是,如果我们找不到一个尺寸合适的孔,那么这个位置会产生许多微小的不可用孔,导致高度碎裂。它还需要扫描所有可能的孔。 首次合身的优势在于它不会评估所有可能的展示位置,因此速度更快。 由于 Worst-fit 以最大的未分配空间为目标,因此如果需要大量分配,则选择较差。 在实践中,首次适合和下一次适合(这里未讨论)通常是常见的放置策略。存在混合方法和许多其他替代方案(请参阅实现内存分配器页面)。 ## 编写堆分配器有哪些挑战? 主要挑战是, * 需要最小化碎片(即最大化内存利用率) * 需要高性能 * 繁琐的实现(使用链表和指针算法的大量指针操作) 一些额外的评论: 碎片和性能都取决于应用程序分配配置文件,可以对其进行评估但不能预测,并且在实践中,特定用途条件不足,专用分配器通常可以超出通用实现。 分配器事先不知道程序的内存分配请求。即使我们这样做,这就是[背包问题](http://en.wikipedia.org/wiki/Knapsack_problem),它已知是 NP 难! ## 你如何实现内存分配器? 好问题。 [实现内存分配器](https://github.com/angrave/SystemProgramming/wiki/Memory%2C-Part-2%3A-Implementing-a-Memory-Allocator)