Linux 内核select、poll 和 eventpoll 的实现

Linux 内核仓库 https://github.com/torvalds/linux

Linux 内核文档： https://www.kernel.org/doc/html/latest/index.html（中文）

开发工具参考： https://www.kernel.org/doc/html/latest/dev-tools/index.html

也可以使用 VSCode + 插件C/C++ GNU Global

通过前面三个博客可以得知 select，** poll， eventpoll** 的详细实现，现在来总结对比下它们之间的不同:

select 流程图
poll 流程图
eventpoll 流程图
优缺点总结 <1> 监控文件最大数不同：select和poll都是以数组形式传入药监控的文件句柄，而这个数组是有大小限制的1024个左右(不是很清楚).而epoll则是每add一个文件句柄会new一个新epi出来，挂载在ep的红黑树中，监控的文件个数没有明确限制(可能会受限于系统最大打开文件句柄数)从这点上看，epoll是优于select和poll. <2> copy参数次数不同：无论是select/poll/epoll都是有对应的系统调用，其参数都会从userspace拷贝到kernelspace,如果监控的文件句柄数很大，select/poll在这方面的耗时会明显多于epoll,因为每次调用select/poll都要重新拷贝一次所有的监控句柄，而epoll则在sys_epoll_ctrl的时候添加一次存储在内核数据结构中，后续的sys_epoll_wait会通过内核数据找到监控的文件句柄对应的file和监控得到的event. <3> 轮询方式的差异：select 会传入监控句柄的最大句柄，从而监控查询0 ~~ max_fd之间的所有file的驱动状态来获取想要的文件句柄中想要的event，而poll则只会轮询用户传入的文件句柄集，相比select会少轮询很多file的状态，这点上poll明显优于select.而epoll则是完全异步的方式，哪个有更新会添加到ep->rdlist中,epoll_wait来取走.当连接数不是很多且每个client都非常活跃的情况下,poll > select > epoll,而当连接数巨大且大多数client都是潜水状态的情况下，epoll > poll > select。

本文摘自： https://blog.csdn.net/weixin_38537730/article/details/104100468

By admin

缓存池 bytebufferpool 库实现原理

上一节《Runtime: Golang 之 sync.Pool 源码分析》我们介绍了sync.Pool 的源码分析，本节介绍一个 fasthttp 中引用的一缓存池库 [bytebufferpool](https://github.com/valyala/bytebufferpool)，这两个库是同一个开发者。对于这个缓存池库与同类型的几个库的对比，可以参考 https://omgnull.github.io/go-benchmark/buffer/。

建议大家了解一下[fasthttp](https://github.com/valyala/fasthttp) 这个库，性能要比直接使用内置的 net/http 高出很多，其主要原因是大量的用到了缓存池 sync.Pool 进行性能提升。

用法

// https://github.com/valyala/bytebufferpool/blob/18533face0/bytebuffer_example_test.go
package bytebufferpool_test

import (
	"fmt"

	"github.com/valyala/bytebufferpool"
)

func ExampleByteBuffer() {
	// 从缓存池取 Get()
	bb := bytebufferpool.Get()

	// 用法
	bb.WriteString("first linen")
	bb.Write([]byte("second linen"))
	bb.B = append(bb.B, "third linen"...)

	fmt.Printf("bytebuffer contents=%q", bb.B)

	// 使用完毕，放回缓存池 Put()
	// It is safe to release byte buffer now, since it is no longer used.
	bytebufferpool.Put(bb)
}

全局变量

我们先看一下与其相关的一些常量

By admin

初识kubernetes 组件

对于一个刚刚接触 kubernetes(k8s)的新手来说，想好更好的学习它，首先就要对它有一个大概的认知，所以本文我们先以全局观来介绍一个 kubernetes。

kubernetes 架构 kubernetes 架构图

kubernets 整体可以分为两大部分，分别为 Master 和 Node ，我们一般称其为节点，这两种角色分别对应着控制节点和计算节点，根据我们的经验可以清楚的知道 Master 是控制节点。

Master 节点

控制节点 Master 节点由三部分组成，分别为 Controller Manager 、 API Server 和 Scheduler ，它们相互紧密协作，每个部分负责不同的工作职责。

controller-manager 全称为 kube-controler-manager 组件，主要用来负责容器编排。如一个容器(实际上是 pod，pod 是最基本的调度单元。一般一个 pod 里会部署一个容器服务)服务可以指定副本数量，如果实际运行的副本数据与期望的不一致，则会自动再启动几个容器副本，最终实现期望的数量。这个组件，就是一系列控制器的集合。我们可以查看一下 Kubernetes 项目的 pkg/controller 目录, 伪代码如下：

for {
  实际状态 := 获取集群中对象X的实际状态（Actual State）
  期望状态 := 获取集群中对象X的期望状态（Desired State）
  if 实际状态 == 期望状态{
    什么都不做
  } else {
    执行编排动作，将实际状态调整为期望状态
  }
}

api server 对外提供 api 服务，用来接收命令进行集群管理。对内负责与 etcd 注册中心进行通讯，进行一些配置信息的存储与读取
scheduler 负责调度。如一个容器存放到 k8s 集群中的哪个 node 节点最为合适

实际上这三个组件的功能远远多于我们这里描述的。

By admin

docker如何利用cgroup对容器资源进行限制

在容器里有两个非常重要的概念，一个是 namespace 用来实现对容器里所有进程进行隔离；另一个就是 cgroup，用来对容器进程内使用资源进行限制。那 cgroup 又是如何实现对资源进行限制的呢，今天我们来了解一下它的实现原理。

什么是cgroup

cgroup 是 Control Groups 的缩写，是 Linux 内核提供的一种可以限制、记录、隔离进程组所使用的物理资源(如 cpu、memory、磁盘IO等等) 的机制，被 LXC、docker 等很多项目用于实现进程资源控制。cgroup 是将任意进程进行分组化管理的 Linux 内核功能。 cgroup 本身是提供将进程进行分组化管理的功能和接口的基础结构，I/O 或内存的分配控制等具体的资源管理功能是通过这个功能来实现的。一定要切记，这里的限制单元为 进程组，而不是进程。

子系统

上面提到的具体的资源管理功能统称为 cgroup 子系统，所有子系统列表可以通过 cat /proc/cgroups 命令查看，主要有以下几大子系统：

# cat /proc/cgroups
#subsys_name	hierarchy	num_cgroups	enabled
cpuset	        4	        7	        1
cpu	        2	        89	        1
cpuacct	        2	        89	        1
blkio	        3	        86	        1
memory	        7	        150	        1
devices	        6	        84	        1
freezer	        5	        7	        1
net_cls	        10	        7	        1
perf_event	    12	        7	        1
net_prio	    10	        7	        1
hugetlb	        8	        7	        1
pids	        9	        94      	1
rdma	        11	        1	        1

cpuset：如果是多核心的CPU, 这个子系统会为 cgroup 任务分配单独的CPU和内存。
cpu：使用调度程序为cgroup任务提供CPU的访问。
cpuacct：产生cgroup 任务的CPU资源报告
blkio：设置限制每一个块设备的输入输出控制。例如:磁盘，光盘以及usb 等等。
memory: 设置每一个cgroup 的内存限制以及产生内存资源报告。
devices：容许或拒绝cgroup任务对设备的访问。
freezer：暂停和恢复cgroup任务。
net_cls: 标记每一个网络包以供cgroup 方便使用。
ns：命名空间子系统,能够设置一个子系统的上限配额。
perf_event: 增加了对每一个group 的监测跟踪的能力，能够监测属于某个特定的group 的全部线程以及运行在特定,监控能力超出限制则进行终止。
net_prio 设置cgroup中进程产生的网络流量的优先级
hugetlb 限制使用的内存页数量
pids 限制任务的数量

目前 docker 只是用了其中一部分子系统，实现对资源配额和使用的控制。如可以使用 `freezer` 子系统对 `进行组` 进行挂起和恢复。

By admin

Golang 内存组件之mspan、mcache、mcentral 和 mheap 数据结构

Golang中的内存组件关系如下图所示 components of memory allocation golang 内存分配组件

在学习golang 内存时，经常会涉及几个重要的数据结构，如果不熟悉它们的情况下，理解起来就显得格外的吃力，所以本篇主要对相关的几个内存组件做下数据结构的介绍。

在 Golang 中，mcache、mspan、mcentral 和 mheap 是内存管理的四大组件，mcache 管理线程在本地缓存的 mspan，而 mcentral 管理着全局的 mspan 为所有 mcache 提供所有线程。

根据分配对象的大小，内部会使用不同的内存分配机制，详细参考函数 mallocgo() ，所于内存分配与回收，参考文件介绍 malloc.go

<16KB 会使用微小对象内存分配器从 P 中的 mcache 分配，主要使用 mcache.tinyXXX 这类的字段
16-32KB 从 P 中的 mcache 中分配
>32KB 直接从 mheap 中分配

对于golang中的内存申请流程，大家应该都非常熟悉了，这里不再进行详细描述。Golang 内存组件关系

mcache

在GPM关系中，会在每个 P 下都有一个 mcache 字段，用来表示内存信息。

在 Go 1.2 版本以前调度器使用的是 GM 模型，将 mcache 放在了 M 里，但发现存在诸多问题，其中对于内存这一块存在着巨大的浪费。每个 M 都持有 mcache 和 stack alloc，但只有在 M 运行 Go 代码时才需要使用内存(每个 mcache 可以高达2mb)，当 M 在处于 syscall 或 网络请求 的时候是不需要内存的，再加上 M 又是允许创建多个的，这就造成了内存的很大浪费。所以从go 1.3版本开始使用了GPM模型，这样在高并发状态下，每个G只有在运行的时候才会使用到内存，而每个 G 会绑定一个P，所以它们在运行时只占用一份 mcache，对于 mcache 的数量就是P 的数量，同时并发访问时也不会产生锁。

By admin

工作池gcWork

工作缓存池（work pool）实现了生产者和消费者模型，用于指向灰色对象。一个灰色对象在工作队列中被扫描标记，一个黑色对象表示已被标记不在队列中。

写屏障、根发现、栈扫描和对象扫描都会生成一个指向灰色对象的指针。扫描消费时会指向这个灰色对象，从而将先其变为黑色，再扫描它们，此时可能会产生一个新的指针指向灰色对象。这个就是三色标记法的基本知识点，应该很好理解。

gcWork 是为垃圾回收器提供的一个生产和消费工作接口。

它可以用在stack上，如

(preemption must be disabled)
gcw := &getg().m.p.ptr().gcw
.. call gcw.put() to produce and gcw.tryGet() to consume ..

在标记阶段使用gcWork可以防止垃圾收集器转换到标记终止，这一点很重要，因为gcWork可能在本地持有GC工作缓冲区。可以通过禁用抢占（systemstack 或 acquirem）来实现。

数据结构

type gcWork struct {
	wbuf1, wbuf2 *workbuf

	bytesMarked uint64
	scanWork int64
	flushedWork bool
}

wbuf1,wbuf2：这里 wbuf1 是主工作缓存区; wbuf2为次工作缓存区，两者要么都是nil,要么都不是。这可以看作是两个工作缓冲区指针串联的堆栈。当我们弹出最后一个指针的时候，我们可以引入新的缓存区，并将指针向上移动一个空缓存区，从而丢失掉的缓存区；当我们填充两个缓存区的时，可以通过引入一个新的空缓冲区并丢弃一个满的缓冲区，同时将堆栈向下移动一个工作缓冲区。
bytesMarked 标记为黑色对象的累计大小
scanWork 扫描统计
flushedWork 表示自上次 gcMarkDone 终止检查以来，已将非空工作缓存区刷新到全局工作队列。表示是否gcWork可能传递给了另一个gcWork

wbuf1 和 wbuf2 为 workbuf 数据类型，其数据结构

type workbuf struct {
	workbufhdr
	// account for the above fields
	obj [(_WorkbufSize - unsafe.Sizeof(workbufhdr{})) / sys.PtrSize]uintptr
}

type workbufhdr struct {
	node lfnode // must be first
	nobj int
}

// Lock-free stack node.
// Also known to export_test.go.
type lfnode struct {
	next    uint64
	pushcnt uintptr
}

工作原理

GC 期间 gcBgMarkWorker() 函数会根据GC的模式(gcMarkWorkerMode、gcMarkWorkerDedicatedMode、gcMarkWorkerFractionalMode 和 gcMarkWorkerIdleMode) 调用 gcDrain() 函数采用不同的策略来实现扫描来实现将灰色对象变为黑色。

By admin

Runtime: Golang GC源码分析

在阅读此文前，需要先了解一下三色标记法以及混合写屏障这些概念。

源文件 [src/runtime/mgc.go](https://github.com/golang/go/blob/go1.16/src/runtime/mgc.go) 版本 1.16.2。

基本知识

在介绍GC之前，我们需要认识有些与GC相关的基本信息，如GC的状态、模式、统计信息等。

三种状态

共有三种状态

const (
	_GCoff             = iota // GC not running; sweeping in background, write barrier disabled
	_GCmark                   // GC marking roots and workbufs: allocate black, write barrier ENABLED
	_GCmarktermination        // GC mark termination: allocate black, P's help GC, write barrier ENABLED
)

_GCoff GC未运行
_GCmark 标记中，启用写屏障
_GCmarktermination 标记终止，启用写屏障

三种模式

支持三种模式：

const (
    gcBackgroundMode gcMode = iota // concurrent GC and sweep
    gcForceMode                    // stop-the-world GC now, concurrent sweep
    gcForceBlockMode               // stop-the-world GC now and STW sweep (forced by user)
)

gcBackgroundMode 默认模式，标记与清扫过程都是并发执行的
gcForceMode 只在清扫阶段支持并发；
gcForceBlockMode GC全程需要STW。

针对每种模式，在标记阶段会采用不同的标记策略，详细见 [gcBgMarkWorker()](https://github.com/golang/go/blob/go1.16.2/src/runtime/mgc.go#L1877-L2048)

By admin

Golang中的切片与GC

今天再看 timer 源码的时候，在函数 [clearDeletedTimers()](https://github.com/golang/go/blob/go1.16.2/src/runtime/time.go#L904-L992) 里看到一段对切片的处理代码，实现目的就是对一个切片内容进行缩容。

// src/runtime/time.go

// The caller must have locked the timers for pp.
func clearDeletedTimers(pp *p) {
	timers := pp.timers
	......
	// 对无用的切片元素赋值 nil
	for i := to; i < len(timers); i++ {
		timers[i] = nil
	}

	atomic.Xadd(&pp.deletedTimers, -cdel)
	atomic.Xadd(&pp.numTimers, -cdel)
	atomic.Xadd(&pp.adjustTimers, -cearlier)

	timers = timers[:to]
	pp.timers = timers
	updateTimer0When(pp)

	......
}

变量 to 指新切片的长度， len(timers)指原来切片的长度。

这里在其进行 timers = timers[:to] 操作前，先是将 to 数组索引后的值进行了赋值 nil。按照我们平常的用法，赋 nil 值是没有必要执行这一步的，那为什么这里要加这一步呢？主要还是与GC 有关。

By admin

Runtime: Golang 定时器实现原理及源码解析

定时器作为开发经常使用的一种数据类型，是每个开发者需要掌握的，对于一个高级开发很有必要了解它的实现原理，今天我们runtime源码来学习一下它的底层实现。

定时器分两种，分别为 Timer 和 Ticker，两者差不多，这里重点以Timer为例。

源文件位于 [src/time/sleep.go](https://github.com/golang/go/blob/go1.16.2/src/time/sleep.go) 和 [src/time/tick.go](https://github.com/golang/go/blob/go1.16.2/src/time/tick.go) 。 go version 1.16.2

数据结构

Timer 数据结构

// src/runtime/sleep.go

// The Timer type represents a single event.
// When the Timer expires, the current time will be sent on C,
// unless the Timer was created by AfterFunc.
// A Timer must be created with NewTimer or AfterFunc.
type Timer struct {
	C <-chan Time
	r runtimeTimer
}

Timer 数据类型是表示单个事件。当计时器过期时，当前的时候将会发送到 Timer.C 通道，如果用 AfterFunc 创建计时器的话，则例外。

By admin

Golang中的CAS原子操作和锁

在高并发编程中，经常会出现对同一个资源并发访问修改的情况，为了保证最终结果的正确性，一般会使用 锁 和 CAS原子操作 来实现。

如要对一个变量进行计数统计，两种实现方式分别为

package main

import (
	"fmt"
	"sync"
)

// 锁实现方式
func main() {
	var count int64
	var wg sync.WaitGroup
	var mu sync.Mutex

	for i := 0; i < 10000; i++ {
		wg.Add(1)
		go func(wg *sync.WaitGroup) {
			defer wg.Done()
			mu.Lock()
			count = count + 1
			mu.Unlock()
		}(&wg)
	}
	wg.Wait()

	// count = 10000
	fmt.Println("count = ", count)
}

与

package main

import (
	"fmt"
	"sync"

	"sync/atomic"
)

// atomic CAS 原子操作
func main() {
	var count int64
	var wg sync.WaitGroup

	for i := 0; i < 10000; i++ {
		wg.Add(1)
		go func(wg *sync.WaitGroup) {
			defer wg.Done()
			// 失败一直重试
			for {
				old := atomic.LoadInt64(&count)
				if atomic.CompareAndSwapInt64(&count, old, old+1) {
					break
				}
			}

		}(&wg)
	}
	wg.Wait()

	// count = 10000
	fmt.Println("count = ", count)
}

可以看到两种用法的执行结果是一样的，我们再看一下两者的性能区别。

By admin

Golang并发同步原语之-信号量Semaphore

信号量是并发编程中比较常见的一种同步机制，它会保持资源计数器一直在0-N（N表示权重值大小，在用户初始化时指定）之间。当用户获取的时候会减少一点，使用完毕后再恢复过来。当遇到请求时资源不够的情况下，将会进入休眠状态以等待其它进程释放资源。

在 Golang 官方扩展库中为我们提供了一个基于权重的信号量 [semaphore](https://github.com/golang/sync/blob/master/semaphore/semaphore.go) 并发原语。

你可以将下面的参数 n 理解为资源权重总和，表示每次获取时的权重；也可以理解为资源数量，表示每次获取时必须一次性获取的资源数量。为了理解方便，这里直接将其理解为资源数量。

数据结构

[semaphoreWeighted](https://github.com/golang/sync/blob/master/semaphore/semaphore.go#L19-L33) 结构体

type waiter struct {
	n     int64
	ready chan<- struct{} // Closed when semaphore acquired.
}

// NewWeighted creates a new weighted semaphore with the given
// maximum combined weight for concurrent access.
func NewWeighted(n int64) *Weighted {
	w := &Weighted{size: n}
	return w
}

// Weighted provides a way to bound concurrent access to a resource.
// The callers can request access with a given weight.
type Weighted struct {
	size    int64
	cur     int64
	mu      sync.Mutex
	waiters list.List
}

一个 watier 就表示一个请求，其中n表示这次请求的资源数量（权重）。

By admin

学习Golang GC 必知的几个知识点

对于gc的介绍主要位于 [src/runtime/mgc.go](https://github.com/golang/go/blob/go1.16.2/src/runtime/mgc.go)，以下内容是对注释的翻译。

GC 四个阶段

通过源文件注释得知GC共分四个阶段：

GC 清理终止 (GC performs sweep termination） a. Stop the world, 每个P 进入GC safepoint（安全点），从此刻开始，万物静止。 b. 清理未被清理的span，如果GC被强制执行时才会出现这些未清理的span
GC 标记阶段（GC performs the mark phase） a. 将gc标记从 _GCoff 修改为 _GCmark，开启写屏障（write barries）和协助助手（mutator assists），将根对象放入队列。在STW期间，在所有P都启用写屏障之前不会有什么对象被扫描。 b. Start the world（恢复STW）。标记工作线程和协助助手并发的执行。对于任何指针的写操作和指针值，都会被写屏障覆盖，使新分配的对象标记为黑色。 c. GC 执行根标记工作。包括扫描所有的栈，全局对象和不在堆数据结构中的堆指针。每扫描一个栈就会导致goroutine停止，把在栈上找到的所有指针置灰色，然后再恢复goroutine运行。 d. GC 遍历队列中的每个灰色对象，扫描完以后将灰色对象标记为黑色，并将其指向的对象标记为灰色。 e. 由于GC工作在分布本地缓存中，采用了一种 “分布式终止算法（distributed termination algorithm）” 来检测什么时候没有根对象或灰色对象。在这个时机GC会转为标记中止（mark termination）。
标记终止（GC performs mark termination） a. Stop the world，从此刻开始，万物静止 b. 设置阶段为 _GCmarktermination，并禁用工作线程worker和协助助手 c. 执行清理，flush cache
清理阶段（GC performs the sweep phase） a. 设置清理阶段标记为 _GCoff，设置清理状态禁用写屏障 b. Start the world（恢复STW），从现在开始，新分配的对象是白色的。如有必要，请在请在使用前扫描清理 c. GC在后台执行并发扫描，并响应分配

整个GC共四个阶段，每次开始时从上到下执行。第一步是清理上次未清理完的span，而不是直接标记阶段。具体的流程可以参考 runtime.GC() 函数

By admin

Runtime: Golang 之 sync.Pool 源码分析

Pool 指一组可以单独保存和恢复的 临时对象。Pool 中的对象随时都有可能在没有收到任何通知的情况下被GC自动销毁移除。

多个goroutine同时操作Pool是并发安全的。

源文件为 [src/sync/pool.go](https://github.com/golang/go/blob/master/src/sync/pool.go) go version: 1.16.2

为什么使用Pool

在开发高性能应用时，经常会有一些完全相同的对象需要频繁的创建和销毁，每次创建都需要在堆中分配对象，等使用完毕后，这些对象需要等待GC回收。我们知道在Golang中使用三色标记法进行垃圾回收的，在回收期间会有一个短暂STW（stop the world)的时间段，这样就会导致程序性能下降。

那么能否实现类似数据库连接池这种效果，用来避免对象的频繁创建和销毁，达到尽可能的资源复用呢？为了实现这种需求，标准库中有了sync.Pool 这个数据结构。看名字很知道它是一个池。但是它和我们想象中的数据库连接池还是有些差别的。对于数据库连接池这种资源只要不手动释放就可以一直利用，但对于 sync.Pool 则不一样，主要是因为Pool里的对象是随时都有可能被销毁，即这些都 临时对象。只要进行了GC，就会出现对象销毁的情况。所以不用使用Pool当作数据库连接池。

总之记住一点：sync.Pool中的资源随时都有可能被销毁而消失，这是与我们日常所说的池最大的区别，切勿乱用。

sync.Pool 基本信息

与 Pool 相关的主要有三个常量，其中 allPoolsMu 是一个全局锁；对于 allPoos 和 oldPools 则是一个 *Pool 数组，主要用在当P数量发生变化（增加）时会导致一些P找不到自己对应的 localPool，会将当前 Pool 放入 allPools，这样便于当GC发生时对其进行清理。

var (
	allPoolsMu Mutex

	// allPools is the set of pools that have non-empty primary
	// caches. Protected by either 1) allPoolsMu and pinning or 2)
	// STW.
	allPools []*Pool

	// oldPools is the set of pools that may have non-empty victim
	// caches. Protected by STW.
	oldPools []*Pool
)

Pool 数据结构

// A Pool must not be copied after first use.
type Pool struct {
	// 不允许复制
	noCopy noCopy

	// 池的固定大小, local 对应类似 poolLocal，是一个数组
	local     unsafe.Pointer // local fixed-size per-P pool, actual type is [P]poolLocal
	localSize uintptr        // size of the local array

	victim     unsafe.Pointer // local from previous cycle
	victimSize uintptr        // size of victims array

	// New optionally specifies a function to generate
	// a value when Get would otherwise return nil.
	// It may not be changed concurrently with calls to Get.
	// 可选项，当使用Get获取对象时调用此函数，返回值是一个接口，意味着可以返回任意内容。如果不指定此函数将返回nil。
	// 不能在调用Get() 时修改此函数
	New func() interface{}
}

一旦 Pool 被初始化后,后续将不可以被复制使用，这一点与 sync.Mutex 同步原语相同。注意这里有一个 noCopy 这字段，主要是用在一些go工具检测对象是否存在复制的问题。

By admin

Runtime: Golang同步原语Mutex源码分析

在 sync 包里提供了最基本的同步原语，如互斥锁 Mutex。除 Once 和 WaitGroup 类型外，大部分是由低级库提供的，更高级别的同步最好是通过 channel 通讯来实现。

Mutex 类型的变量默认值是未加锁状态，在第一次使用后，此值将不得复制，这点切记！！！

本文基于go version: 1.16.2

Mutex 锁实现了 Locker 接口。

// A Locker represents an object that can be locked and unlocked.
type Locker interface {
	Lock()
	Unlock()
}

锁的模式

为了互斥公平性，Mutex 分为 正常模式 和 饥饿模式 两种。

正常模式

在正常模式下，等待者 waiter 会进入到一个FIFO队列，在获取锁时waiter会按照先进先出的顺序获取。当唤醒一个waiter 时它被并不会立即获取锁，而是要与新来的goroutine竞争，这种情况下新来的goroutine比较有优势，主要是因为它已经运行在CPU，可能它的数量还不少，所以waiter大概率下获取不到锁。在这种waiter获取不到锁的情况下，waiter会被添加到队列的前面。如果waiter获取不到锁的时间超出了1毫秒，它将被切换为饥饿模式。

这里的 waiter 是指新来一个goroutine 时会尝试一次获取锁，如果获取不到我们就视其为watier，并将其添加到FIFO队列里。

饥饿模式

在正常模式下，每次新来的goroutine都会抢走锁，就这会导致一些 waiter 永远也获取不到锁，产生饥饿问题。所以为了应对高并发抢锁场景下的公平性，官方引入了饥饿模式。

在饥饿模式下，锁将直接交给队列最前面的waiter。新来的goroutine即使在锁未被持有情况下也不会参与竞争锁，同时也不会进行自旋，而直接将其添加到队列的尾部。

如果拥有锁的waiter发现有以下两种情况，它将切换回正常模式：

它是队列里的最后一个waiter，再也没有其它waiter
等待时间小于1毫秒

模式区别

正常模式 拥有更好的性能，因为即使等待队列里有抢锁的 waiter，由于新来的goroutine 正在CPU中运行，所以优先获取到锁。 饥饿模式 是对公平性和性能的一种平衡，它避免了某些 goroutine 长时间的等待锁。在饥饿模式下，优先处理的是那些一直在等待的 waiter。饥饿模式在一定机时会切换回正常模式。

By admin

Golang什么时候会触发GC

Golang采用了三色标记法来进行垃圾回收，那么在什么场景下会触发这个GC动作呢？

源码主要位于文件 [src/runtime/mgc.go](https://github.com/golang/go/blob/go1.16/src/runtime/mgc.go) go version 1.16

触发条件从大方面来说，分为 手动触发 和 系统触发 两种方式。手动触发一般很少用，主要通过开发者调用 runtime.GC() 函数来实现，而对于系统自动触发是 运行时 根据一些条件自行维护的，这也正是本文要介绍的内容。

不管哪种触发方式，底层回收机制是一样的，所以我们先看一下手动触发，看看能否根据它来找GC触发所需的条件。

// src/runtime/mgc.go

// GC runs a garbage collection and blocks the caller until the
// garbage collection is complete. It may also block the entire
// program.
func GC() {
	n := atomic.Load(&work.cycles)

	// 等待上一轮的标记终止
	gcWaitOnMark(n)

	// We're now in sweep N or later. Trigger GC cycle N+1, which
	// will first finish sweep N if necessary and then enter sweep
	// termination N+1.
	// 触发GC
	gcStart(gcTrigger{kind: gcTriggerCycle, n: n + 1})

	// Wait for mark termination N+1 to complete.
	// 等待本轮 标记终止
	gcWaitOnMark(n + 1)

	......
}

可以看到开始执行GC的是 [gcStart()](https://github.com/golang/go/blob/go1.16/src/runtime/mgc.go#L1286-L1463) 函数，它有一个 gcTrigger 参数，是一个触发条件结构体，它的结构体也很简单。

By admin

学习笔记

Linux 内核select、poll 和 eventpoll 的实现

缓存池 bytebufferpool 库实现原理

用法

全局变量

初识kubernetes 组件

kubernetes 架构 kubernetes 架构图

Master 节点

docker如何利用cgroup对容器资源进行限制

什么是cgroup

子系统

Golang 内存组件之mspan、mcache、mcentral 和 mheap 数据结构

mcache

GC 对根对象扫描实现的源码分析

工作池gcWork

工作原理

Runtime: Golang GC源码分析

基本知识

三种状态

三种模式

Golang中的切片与GC

Runtime: Golang 定时器实现原理及源码解析

数据结构

Golang中的CAS原子操作和锁

Golang并发同步原语之-信号量Semaphore

数据结构

学习Golang GC 必知的几个知识点

GC 四个阶段

Runtime: Golang 之 sync.Pool 源码分析

为什么使用Pool

sync.Pool 基本信息

Pool 数据结构

Runtime: Golang同步原语Mutex源码分析

锁的模式

正常模式

饥饿模式

模式区别

Golang什么时候会触发GC