为什么 Go 对于长度为 100k 的切片使用的内存比长度为 100k 的数组要少?

问题描述 投票:0回答:1

考虑以下代码,我分配了 4000 个数组,每个数组长度为 100k:

    parentMap := make(map[int][100_000]int)
    for i := 0; i < 4000; i++ {
        parentMap[i] = [100_000]int{}
        time.Sleep(3 * time.Millisecond)
    }

如果我在本地运行它并分析其内存使用情况,它开始使用 >2GB 的内存。

现在,如果我们稍微更改一下代码以使用数组切片(但长度也为 100k),如下所示:

    parentMap := make(map[int][]int)
    for i := 0; i < 4000; i++ {
        parentMap[i] = make([]int, 100_000)
        time.Sleep(3 * time.Millisecond)
    }

在我的机器上,内存峰值约为 73MB。 这是为什么?

我认为这两个片段将使用大致相同的内存,原因如下:

  • 在这两种情况下,Golang 运行时都会在堆上分配
    parentMap
    的值。 Golang 这样做是因为如果它在堆栈上分配这些值,那么一旦当前函数超出范围,
    parentMap
    的值就会全部清除。
  • 因此第一个片段直接在堆上分配 4k 数组。
  • 并且,第二个片段在堆上分配 4k 切片标头。每个切片头都有一个指向大小为 100k 的唯一数组(也在堆上)的指针。
  • 在这两种情况下,大小为 100k 的堆上都有 4k 数组。因此,在任何一种情况下都应使用大致相等的内存量。

我读到:https://go.dev/blog/slices-intro。但找不到解释这一点的实现细节。

arrays go heap-memory stack-memory
1个回答
0
投票

带有切片的版本可能受益于延迟分配。没有任何东西会尝试写入这些片之一的数据缓冲区,因此操作系统可以自由地不为这些缓冲区实际分配内存,直到确实尝试写入。 (缓冲区的零初始化也可以延迟发生,因此不会强制分配。)

同时,带有数组的版本需要将数组实际复制到映射中,这意味着实际执行写入。即使写入的值全为零,它们仍然是写入,因此操作系统必须实际为要写入的数据分配内存。

尝试将数据写入这些切片,切片版本也应该占用千兆字节的内存。 (每页内存一个值应该足够了,但用

1
填充切片可能更容易。)

© www.soinside.com 2019 - 2024. All rights reserved.