环境:go 1.19.8
在读多写少的情况下,即使一段时间内没有写操作,大量并发的读访问也不得不在Mutex的保护下变成串行访问,这种情况下,使用Mutex,对性能影响比较大。所以就要区分读写操作。如果某个读操作的g持有了锁,其他读操作的g就不必等待了,可以并发的访问共享变量,这样就可以将串行的读变成并行的读,提高读操作的性能。可理解为共享锁。当写操作的g持有锁,它是一个排他锁,不管其他的g是写操作还是读操作,都需要阻塞等待持有锁的g释放锁。
【资料图】
什么是RWMutex?reader/writer互斥锁,在某一时刻只能由任意数量的reader持有,或者是只被单个writer持有。RWMutex实现了5个方法:
Lock/Unlock:写操作时调用。如果锁已经被reader或者writer持有,那么,Lock方法会一直阻塞,直到能获取到锁;Unlock是对应的释放锁方法RLock/RUnlock:读操作时调用。如果锁已经被writer持有,RLock方法会一直阻塞,直到能获取锁,否则直接return;Rnlock是对应的释放锁方法RLocker:这个方法的作用是为读操作返回一个 Locker 接口的对象案例:计数器,1writer n reader
使用场景如果可以明确区分 reader 和 writer goroutine ,且有大量的并发读,少量的并发写,并且有强烈的性能要求,可以考虑使用读写锁RWMutex替换Mutex
实现原理RWMutex 是很常见的并发原语,很多编程语言的库都提供了类似的并发类型。RWMutex一般都是基于互斥锁、条件变量(condition variables)或者信号量(semaphores)等并发原语来实现。Go 标准库中的 RWMutex 是基于 Mutex 实现的。reader-writers 问题,一般有三类,基于对读和写操作的优先级,读写锁的设计和实现也分成三类
Read-Preferring:读优先的设计可以提供很高的并发性。但在竞争激烈的情况下会导致写饥饿Write-Preferring:如果有一个writer在等待请求锁,它会阻止新来请求锁reader获取到锁,优先保障writer。当然,如果reader已经获得锁,新请求的writer也需要等待已持有锁的reader释放锁。写优先级设计中的优先权是针对新来的请求而言的。这种设计主要避免了 writer 的饥饿问题。不指定优先级:这种设计比较简单,不区分 reader 和 writer 优先级,某些场景下这种不指定优先级的设计反而更有效,因为第一类优先级会导致写饥饿,第二类优先级可能会导致读饥饿,这种不指定优先级的访问不再区分读写,大家都是同一个优先级,解决了饥饿的问题。Go 标准库中的 RWMutex 设计是 Write-preferring 方案。一个正在阻塞的 Lock 调用会排除新的 reader 请求到锁。
源码解析上锁解锁流程以及数值变化情况rwmutexMaxReaders 的数量被初始化为1<<30
,理想中,写锁不会持续很久,不会导致readerCount 自动从负值自动+1回到正值。
type RWMutex struct {w sync.Mutex // hold if there are pending writerswriterSem uint32 // 写 阻塞信号readerSem uint32 // 读 阻塞信号readerCount int32 // 正在读的调用者数量/ 当为负数时 表示有write持有锁readerWait int32 // writer持有锁之前正等待解锁的数量}const rwmutexMaxReaders = 1 << 30func (rw *RWMutex) RLock() {if atomic.AddInt32(&rw.readerCount, 1) < 0 {// 写端 持有锁, 读端阻塞runtime_SemacquireMutex(&rw.readerSem, false, 0)}}func (rw *RWMutex) RUnlock() {if r := atomic.AddInt32(&rw.readerCount, -1); r < 0 {rw.rUnlockSlow(r)}}func (rw *RWMutex) rUnlockSlow(r int32) {if r+1 == 0 || r+1 == -rwmutexMaxReaders {fatal("sync: RUnlock of unlocked RWMutex")}if atomic.AddInt32(&rw.readerWait, -1) == 0 {// 无读者等待,唤醒写端等待者runtime_Semrelease(&rw.writerSem, false, 1)}}
RLock第11行,上读锁,首先对readerCount进行原子加1,如果小于0则表示存在写锁,直接阻塞。为什么readerCount会存在负值?这个要看readerCount除了在RLock中处理,还在哪里被处理了。可以看到在获取写锁时有响应代码。后面在解释。如果原子加大于等于0,则表示获取读锁成功。
RUnlock第18行,读解锁,对readerCount进行原子减1,如果小于零,则表示存在活跃的reader(即当前获得互斥锁的写锁之前获取到读锁权限的读者数量),readerWait 字段就减 1,直到所有的活跃的 reader 都释放了读锁,才会唤醒这个 write
Lock/Unlockfunc (rw *RWMutex) Lock() {// 1. 先尝试获取互斥锁rw.w.Lock()// 2. 看是否有其他正持有锁的读者,有则阻塞r := atomic.AddInt32(&rw.readerCount, -rwmutexMaxReaders) + rwmutexMaxReadersif r != 0 && atomic.AddInt32(&rw.readerWait, r) != 0 {// rc - rwmutexMaxReaders + rwmutexMaxReaders > 0说明还有等待者, 写端阻塞runtime_SemacquireMutex(&rw.writerSem, false, 0)}}func (rw *rwMutex) Unlock() {r := atomic.AddInt32(&rw.readerCount, rwmutexMaxReaders)if r >= rwmutexMaxReaders {fatal("sync: Unlock of unlocked RWMutex")}// 如果有等待的读者,先唤醒for i := 0; i < int(r); i++ {runtime_Semrelease(&rw.readerSem, false, 0)}// 释放互斥锁rw.w.Unlock()}
Lock先获取互斥锁成功获取后,r=readerCount-rwmutexMaxReaders,得到的数值就是一个负数,在加上rwmutexReaders就表示写锁等待者的数量,此时,如果r不等于0,且readerWait+r!=0,则表示有读等待者,写锁阻塞我们知道,写操作要等待读操作结束后才可以获得锁,写操作等待期间可能还有新的读操作持续到来,如果写操作等待所有读操作结束,就会出现饥饿现象。然而,通过readerWait
可完美解决这个问题。
写操作到来时,会把readerCount
值拷贝到readerWait
中,用于标记排在写操作之前到读者个数。当读操作结束后,除了会递减readerCount
,还会递减readerWait
的值,当readerWait
值变为0时会唤醒写操作。
写操作之后产生的读操作会加入到readerCount
中,阻塞知道写锁释放。
上面说过,写锁之后来的读者会被阻塞,所以在写锁释放之际,会看是否有需要唤醒的读者,再释放互斥锁
场景讨论写操作如何阻塞写操作读写锁包含一个互斥锁(Mutex),写锁必须先获取该互斥锁,如果互斥锁已被协程A获取,意味者其他协程只能阻塞等待互斥锁释放
写操作是如何阻塞读操作readerCount
是个整型值,用于表示读者数量,不考虑写操作的情况下,每次获取读锁,将该值加1,每次解锁将其减1,所以readerCount
的取值为[0, N]
,最大可支持2^30
个并发读者。
当写锁定进行时,会先将readerCount -= rwmutextMaxReaders(2^30)
,此时 readerCount
负数。这时再有读者到了,检测到readerCount
为负值,则表示有写操作正在进行,后来到读者阻塞等待。等待者的数量即 reaerCount + 2^30
写操作时,会把readerCount
的值拷贝到readerWait
中,用于标记在写操作前面读者的个数,前面的写锁释放后,会递减readerCount,readerWait
,当readerWait
值变为0时唤醒写操作
rwmutex是由一个互斥锁和四个辅助字段组成的,与互斥锁一样,读写锁也是不能复制的。一旦读写锁被使用,它的字段就会记录它当前的一些状态,如果此时去复制这把锁,就会把它的状态也复制过去。但原来的锁在释放的时候,并不会修改复制出来的读写锁,会导致复制出来的读写锁状态异常,可能永远无法释放锁。
重入导致死锁读写锁重入,或者递归调用,导致的死锁情况很多
读写锁内部基于互斥锁实现对writer并发控制,而互斥锁本身就有重入问题,所以,writer重入调用Lock,会导致死锁func foo(l *sync.RWMutex) { fmt.Println("lock in foo") l.Lock() bar(l) l.Unlock()}func bar(l *sync.RWMutex) { fmt.Println("lock in bar") l.Lock() l.Unlock()}func main() { l := &sync.RWMutex{} foo(l)}
当一个 writer 请求锁的时候,如果已经有一些活跃的 reader,它会等待这些活跃的reader 完成,才有可能获取到锁,但是,如果之后活跃的 reader 再依赖新的 reader 的话,这些新的 reader 就会等待 writer 释放锁之后才能继续执行,这就形成了一个环形依赖: writer 依赖活跃的 reader -> 活跃的 reader 依赖新来的 reader -> 新来的 reader依赖 writer。func main() { var mu sync.RWMutex go func() { time.Sleep(200*time.Millisecond) mu.Lock() fmt.Println("Lock") time.Sleep(100*time.Millisend) mu.Unlock() fmt.Println("Unlock") } go func() { factorial(&mu, 10) // 计算10的阶乘 } select {}}// func factorial(m *sync.RWMutex, n int) { if n < 1 { return 0 } fmt.Println("RLock") m.RLock() defer func() { fmt.Println("RUnlock") m.RUnlock() } time.Sleep(100*time.Millisecond) return factorial(m, n-1) * n}
factorial 方法是一个递归计算阶乘的方法,我们用它来模拟 reader。为了更容易地制造出死锁场景,在这里加上了 sleep 的调用,延缓逻辑的执行。这个方法会调用读锁(第 27行),在第 33 行递归地调用此方法,每次调用都会产生一次读锁的调用,所以可以不断地产生读锁的调用,而且必须等到新请求的读锁释放,这个读锁才能释放。同时,我们使用另一个 goroutine 去调用 Lock 方法,来实现 writer,这个 writer 会等待200 毫秒后才会调用 Lock,这样在调用 Lock 的时候,factoria 方法还在执行中不断调用RLock。这两个 goroutine 互相持有锁并等待,谁也不会退让一步,满足了“writer 依赖活跃的reader -> 活跃的 reader 依赖新来的 reader -> 新来的 reader 依赖 writer”的死锁条件,所以就导致了死锁的产生。
释放未加锁的RWMutex锁都是成对出现的,Lock和RLock的多余调用会导致锁没有被释放,可能会出现死锁。而Unlock和RUnlock多余调用会导致panic
参考go中sync.RWMutex源码解读标签: