SQL Server 数据页缓冲区的内存瓶颈分析

sql server会把经常使用到的数据缓存在内存里(就是数据页缓存),用以提高数据访问速度。因为磁盘访问速度远远低于内存,所以减少磁盘访问量同样是数据库优化的重要方面。

当数据页缓存区出现内存不足,则会出现查询慢,磁盘忙等等问题。

分析方法:主要是用到性能计数器。

查看如下性能计数器:


1. sql server:buffer manager-lazy writes/sec:内存不足则会频繁调用lazy writer把数数据写入磁盘,此值会经常不为0.

2. sql server:buffer manager-page life expectancy:内存不足时,此计数器表现为下降趋势或者一直停留在较低值。

3. sql server:buffer manager-page reads/sec:内存不足时,则查询那些经常使用但又没有缓存在内存里的数据时,就不需要读取磁盘,这此值表现为持续上升或者停留在较高值。

4. sql server:buffer manager-stolen pages:stolen pages通常用于缓存执行计划,以备重用。内存不足时,sql server本身机制会优先清除执行计划缓存,则此值表现为下降或者较低水平。

查询当前用户任务等待:

复制代码 代码如下:

select * from sys.sysprocesses

如果内存不足则,会看到较多的async_io_completion等待类型。这是因为内存不足时:a.内存和磁盘间会频繁进行交互,磁盘负载增加 b.需要读取磁盘上的数据完成查询,磁盘负载增加。

也就是说这时候磁盘也出现了性能瓶颈,但是这只是“表面”的,我们要结合多个性能指标来认清根本原因是“内存不足”。

确定压力来源及解决办法:


通过前的分析,确定了数据页缓存相关的内存瓶颈。就要分析为什么会这样及解决办法。主要分为如下5个方面:

1. 外部压力


如果os层面或者其它应用服务需要更多的内存,windows会压缩database pages的内存量。这时内存压力来自外部。可以查看如下性能计数器确定是否是外部压力:

1. sql server:memory manager-total server memory:此计数器值会下降。

2. memory:available mbytes:此值会下降到较低水平。

3. 在没有使用awe或者lock page in memory前提下,查看process:private bytes-sqlserver和process:working set-sqlserver,两者值会有显著下降。

解决方法:如果非db专用服务器,则要权衡各个应用服务之间重要性来分配内存或者加大内存。尽量让服务器只运行sql server,成为db专用服务器。

2. sql server自身对database page的使用压力

当total server memory已经达到设定的max server memory或者无法从os获得更多内存,但是经常访问的数据量又远大于物理内存用于数据缓存的容量时,sql server被迫将内存的数据移入又移出,用于完成当前查询。

观察如下性能计数器:

1. sql server:memory manager-total server memory 和 sql server:memory manager-target server memory两者值将会相等。但是前者不会大于后者。

2. 将会出现“分析方法”所述之情况。

解决方法:既然sql server没有足够内存存放database page,那就要么增加sql server使用的内存量或者减少其使用的内存里。

增加:可以通增加物理内存,启用awe等方法。

减少:可以通过横向扩展,有两台或者多台服务器分别载部分库;优化相关读取量较大的语句等。

3. buffer pool中的stolen memory压力


正常情况下buffer pool中的stolen memory不会给database pages造成压力。因为database pages有压力,会触发lazy writes,同时sql server 会清理stolen memory中的执行计划缓存。

但是,如果用户申明了过多的对象,而没有登出,并且占用内存过多,就会压缩database pages.如:游标,自定义引用的执行计划等。

解决方法:通常是会表现为a)用户提交的请求因内存不足无法完成,701错误;b)需要压缩某些clerk的内存量,来完成用户请求,造成响应延时和缓慢。

通过查询sys.dm_os_memory_clerks的字段single_pages_kb,找出是哪个clerk使用了过多内存并分析其原因,然后解决之。

4. multi-page的压力

multi-page跟buffer pool共享os的虚拟地址空间,如果multi-page使用过多内存,就会压缩datbase pages。multi-page内存用量一般较小且相对固定,可能发生的情况有:

a. 未开启awe的32位sql server只有2g地址空间,且用-g启动参数扩展的memtoleave的上限。

b. 64位sql server调了内存泄露的第三方代码。

c. 使用带有大量参数或者较长的”in”语句

d. 调高了network packet size,大于或等于8kb,并且较多这种连接。

e. 大量复杂xml查询,或者第三代码。

解决方法: 通过查询sys.dm_os_memory_clerks的字段multi_pages_kb,找出是哪个clerk使用了过多内存并分析其原因,然后解决之。

作者:joe.tj

(0)
上一篇 2022年3月21日
下一篇 2022年3月21日

相关推荐