1、Golang中死锁的触发条件
1.1 书上关于死锁的四个必要条件的讲解
发生死锁时,线程永远不能完成,系统资源被阻碍使用,以致于阻止了其他作业开始执行。在讨论处理死锁问题的各种方法之前,我们首先深入讨论一下死锁特点。
必要条件:
如果在一个系统中以下四个条件同时成立,那么就能引起死锁:
- 互斥:至少有一个资源必须处于非共享模式,即一次只有一个线程可使用。如果另一线程申请该资源,那么申请线程应等到该资源释放为止。
- 占有并等待:—个线程应占有至少一个资源,并等待另一个资源,而该资源为其他线程所占有。
- 非抢占:资源不能被抢占,即资源只能被线程在完成任务后自愿释放。
- 循环等待:有一组等待线程 {P0,P1,…,Pn},P0 等待的资源为 P1 占有,P1 等待的资源为 P2 占有,……,Pn-1 等待的资源为 Pn 占有,Pn 等待的资源为 P0 占有。
我们强调所有四个条件必须同时成立才会出现死锁。循环等待条件意味着占有并等待条件,这样四个条件并不完全独立。
图示例:
线程1、线程2都尝试获取对方未释放的资源,从而会一直阻塞,导致死锁发生。
1.2 Golang 死锁的触发条件
看完了书上关于死锁的介绍,感觉挺清晰的,但是实际上到了使用或者看代码时,自己去判断是否会发生死锁却是模模糊糊的,难以准确判断出来。所以特意去网上找了些资料学习,特此记录。
golang中死锁的触发条件:
死锁是当 Goroutine 被阻塞而无法解除阻塞时产生的一种状态。注意:for 死循环不能算在这里,虽然空for循环是实现了阻塞的效果,但是实际上goroutine是处于运行状态的。
1.3 golang 中阻塞的场景
1.3.1 sync.Mutex、sync.RWMutex
golang中的锁是不可重入锁,对已经上了锁的写锁,再次申请锁是会报死锁。上了读锁的锁,再次申请写锁会报死锁,而申请读锁不会报错。
写写冲突,读写冲突,读读不冲突。
func main() {var lock sync.Mutexlock.Lock()lock.Lock()
}
//报死锁错误
func main() {var lock sync.RWMutexlock.RLock()lock.Lock()
}
//报死锁错误
func main() {var lock sync.RWMutexlock.RLock()lock.RLock()
}
//正常执行
1.3.2 sync.WaitGroup
一个不会减少的 WaitGroup 会永久阻塞。
func main() {var wg sync.WaitGroupwg.Add(1)wg.Wait()//报死锁错误
}
1.3.3 空 select
空 select 会一直阻塞。
package mainfunc main() {select {}
}
//报死锁错误
1.3.4 channel
为 nil 的channel 发送、接受数据都会阻塞。
func main() {var ch chan struct{}ch <- struct{}{}
}
//报死锁错误
无缓冲的channel 发送、接受数据都会阻塞。
func main() {ch := make(chan struct{})<- ch
}
//报死锁错误
channel 缓冲区满了的,继续发送数据会阻塞。
2、死锁案例讲解
2.1 案例一:空 select{}
package mainfunc main() {select {}
}
以上面为例子,select 语句会 造成 当前 goroutine 阻塞,但是却无法解除阻塞,所以会导致死锁。
2.2 案例二:从无缓冲的channel接受、发送数据
func main() {ch := make(chan struct{})//ch <- struct{}{} //发送<- ch //接受fmt.Println("main over!")
}
发生原因:
上面创建了一个 名为:ch 的channel,没有缓冲空间。当向无缓存空间的channel 发送或者接受数据时,都会阻塞,但是却无法解除阻塞,所以会导致死锁。
解决方案:边接受边读取
package main// 方式1
func recv(c chan int) {ret := <-cfmt.Println("接收成功", ret)
}
func main() {ch := make(chan int)go recv(ch) // 启用goroutine从通道接收值ch <- 10fmt.Println("发送成功")
}// 方式2
func main() {ch := make(chan int,1)ch<-1println(<-ch)
}
2.3 案例三:从空的channel中读取数据
package mainimport ("fmt""time"
)func request(index int,ch chan<- string) {time.Sleep(time.Duration(index)*time.Second)s := fmt.Sprintf("编号%d完成",index)ch <- s
}func main() {ch := make(chan string, 10)fmt.Println(ch,len(ch))for i := 0; i < 4; i++ {go request(i, ch)}for ret := range ch{ //当 ch 中没有数据的时候,for range ch 会发生阻塞,但是无法解除阻塞,发生死锁fmt.Println(len(ch))fmt.Println(ret)}
}
发生原因:
当 ch 中没有数据的时候,就是从空的channel中接受数据,for range ch 会发生阻塞,但是无法解除阻塞,发生死锁。
解决办法:当数据发送完了过后,close channel
package mainimport ("fmt""sync""time"
)var wg sync.WaitGroupfunc request(index int,ch chan<- string) {time.Sleep(time.Duration(index)*time.Second)s := fmt.Sprintf("编号%d完成",index)ch <- swg.Done()
}func main() {ch := make(chan string, 10)for i := 0; i < 4; i++ {wg.Add(1)go request(i, ch)}go func() {wg.Wait()close(ch)}()LOOP:for {select {case i,ok := <-ch: // select会一直等待,直到某个case的通信操作完成时,就会执行case分支对应的语句if !ok {break LOOP}println(i)default:time.Sleep(time.Second)fmt.Println("无数据")}}
}
2.4 案例四:给满了的channel发送数据
func main() {ch := make(chan struct{}, 3)for i := 0; i < 4; i++ {ch <- struct{}{}}
}
发生原因:
ch 是一个带缓冲的channel,但是只能缓冲三个struct,当channel满了过后,继续往channel发送数据会阻塞,但是无法解除阻塞,发生死锁。
解决办法:读取channel中的数据
package mainimport ("fmt""sync""time"
)var wg sync.WaitGroupfunc main() {ch := make(chan struct{}, 3)go func() {for {select {case i, ok := <- ch:wg.Done()fmt.Println(i)if !ok {return}}}}()for i := 0; i < 4; i++ {wg.Add(1)ch <- struct{}{}}wg.Wait()
}
3、总结
最重要的是记住golang中死锁的触发条件:当 goroutine 发生阻塞,但是无法解除阻塞状态时,就会发生死锁。然后在使用或者阅读代码时,再根据具体情况进行分析。
channel异常情况总结:
注意:对已经关闭的channel再次关闭,也会发生panic。