在流量高峰期时Redis的通用权限列表超时了,那一瞬间所有的线程都需要去数据库中读取数据,导致DB中的CPU立马飙到100%。
DB 挂后,紧接着 Basic Data Service 也挂了,因所有的线程堵塞了,我们获取不到数据库连接,导致 Basic Data Service 无法接受新的请求。
而 User API 因调用了 Basic Data Service 的线程出现了堵塞,以至于 User API 服务的所有线程也出现堵塞,即 User API 也挂了,导致 App 上的所有操作都不能使用。