Go内存架构，一个有趣的问题

2022-04-16

在学习Go语言内存管理部分过程中，发现了一个很有意思的问题，今天就借助这篇文章：

1.把这个问题也抛给大家，建议大家看见这个问题后，可以先自己思考一番🤔之后再读下文。
2.进一步强化大家对Go内存架构的理解

开始本篇文章之前，我们快速回顾下「Go内存架构」相关的核心知识点，温故知新。

快速回顾「TCMalloc内存管理架构」

先来简单回顾下「TCMalloc内存管理架构」。详细讲解可查看之前的文章《18张图解密新时代内存分配器TCMalloc》

痛点

多线程时代 ---> 线程共享内存 ---> 线程申请内存会产生竞争 ---> 竞争加锁 ---> 加锁影响性能。

解法

每个线程上增加内存缓存。

简易架构图如下：

快速回顾「Go内存管理架构」

接着简单回顾下「Go内存管理架构」。详细讲解可查看之前的文章《浅析Go内存管理架构》

痛点

同上。

解法

同上，基于「TCMalloc」实现。

简易架构图如下：

有趣的问题

关于这个有趣的问题，细心的朋友可能已经发现了，不卖关子了问题如下：

为什么Go的内存管理器的线程缓存是mcache被逻辑处理器p持有，而并不是被真正的系统线程m持有?

个人思考时间

是不是很有意思，关于这个问题。对面的你不妨先停下来思考几分钟：

为什么？

解密

按照原TCMalloc的设计思想，线程缓存mcache确实应该被绑定到系统线程M上。

那么我们就假设：按照原TCMalloc的思想，把mcache绑定系统线程M上。接着我们只需要看看这个假设有什么问题即可。

要论证这个假设需要先来简单看看「Go的调度模型GMP」。

Go的调度模型`GMP`

直接上入门级「Go的调度模型GMP」架构图：

关于「Go的调度模型GMP」的原理，大家应该看了无数文章，我这里就不细说了，如果还有不熟悉可以自行搜索哈。

这里简单提下关于GMP的入门级知识哈，其实GMP对应的只是Go语言自身的逻辑结构而已，含义如下：

M：代表结构体m，全称Machine，这个结构体的核心是会和真正的系统线程thread绑定。
G：代表结构体g，全称Goroutine，这个结构体就是大家熟知的协程，简单理解其实就是这个结构体绑定了一个有着被并发执行需求的函数。
P：代表结构体p，全称Processor，这个结构体表示逻辑处理器，通过这个结构体和计算机的逻辑处理器建立对应关系，P的数量通常和计算机的逻辑处理器数量一致通过runtime.GOMAXPROCS(runtime.NumCPU())设置。

三者的简单职责以及关系：

P
- 和一个M互相绑定
- 维护了一个可执行G的队列
M
- 和一个P互相绑定
- 负责执行G的调度，通过调度当前M绑定的P的G队列、以及全局G队列，达到G可被并发执行的目的。
- 负责执行P调度过来的当前G

此阶段结论：以上的调度过程P的数量和M的数量是一一对应的，所以把mcache绑定系统线程M上和P看起来都可以。所以我们上面的假设「按照原TCMalloc的思想，把mcache绑定系统线程M上」目前看起来确实也没啥问题。

我们继续往下看，一种特殊的场景M会和P解绑。

I/O操作的系统调用

当G执行一个I/O操作的系统调用时，比如read、write，因为系统调用过程中的阻塞(原因：内核往用户态拷贝数据的过程产生的阻塞，不在本文范畴，后续文章详解)问题，会发生如下操作：

当前G(我们命名为g1)的M(我们命名为m1)和当前的P(我们命名为p1)解绑
上面的p1会绑定一个其他的M(m2)
m1执行完成系统调用之后会被放到闲置M链表里

由于m1会被放进闲置链表，这是不是就意味着m1上的mcache当前就不能被复用，所以这样看起来是不是mcache绑定到p1上更合适。

结论： 由于M可能因为执行一个I/O操作的系统调用被阻塞(原因：内核往用户态拷贝数据的过程产生的阻塞），M会和当前P解绑，当前P绑定其他闲置或者新的M，之前的M结束系统调用会被放进闲置M链表。之前的M的mcache就不会得到有效的复用，反而mcache绑定到P上就不存在这个问题，所以mcache绑定到P上更合适。