SQL Server误区30日谈 第10天 数据库镜像在故障发生后 马上就能发现

误区10.数据库镜像在故障发生后,马上就能发现

错误

市面上大肆宣传数据库镜像技术可以在故障发生后,立即检测到错误并进行故障转移。

但事实并不是这样,检测到故障发生的速度要取决于故障的类型。

检测故障发生的最快的情况是,镜像中的主体实例崩溃,从而镜像服务器每秒一次的ping就无法返回值,从而知道主体服务器上不再有这个进程侦听相应的tcp端口,这种情况下,镜像服务器几乎瞬间就能发现故障。

检测到故障发生第二快的情况是主体服务器的操作系统崩溃。此时主体服务器不再响应镜像服务器的ping,从而在镜像服务器ping超时后发现错误。这个超时的阈值默认是10秒。但你也可以延长这个时间,这时,故障发生时间完全取决于ping的超时时间。

检测到故障第三快的情况是是主体的日志磁盘不可用,此时sql server仍然会发起io请求,但20秒io等待无法写入日志后发现日志磁盘不可用,最终40秒后宣告磁盘日志不可用,从而让镜像服务器上线。sql server是十分有耐心的,比如拿锁来说,sql server对于锁会无限等待,除非遇到死锁才进行干预。

还有,损坏页有可能完全不会引发故障,如果查询报了823或是824错误,镜像技术完全不会关注(sql server 2008之后这个问题得到修复: sql server 2008: automatic page repair with database mirroring),如果数据回滚的过程中遇到823错误或是824错误,数据库立刻会变为质疑状态,也就是日志和数据不统一。这也会导致镜像失败。

你在圣经上学习到的那些教条也不是需要完全遵循的嘛:-)

(0)
上一篇 2022年3月21日
下一篇 2022年3月21日

相关推荐