共计 2480 个字符,预计需要花费 7 分钟才能阅读完成。
导读 | vmstat 命令是用来获得有关进程、内存、页面交换空间及 CPU 活动的信息。这些信息反映了系统的负载情况。 |
vmstat 命令:用来获得有关进程、内存、页面交换空间及 CPU 活动的信息。这些信息反映了系统的负载情况。
参数用法
vmstat [-a] [-n] [-S unit] [delay [ count]]
vmstat [-s] [-n] [-S unit]
vmstat [-m] [-n] [delay [ count]]
vmstat [-d] [-n] [delay [ count]]
vmstat [-p disk partition] [-n] [delay [ count]]
vmstat [-f]
vmstat [-V]
-a:显示活跃和非活跃内存
-f:显示从系统启动至今的 fork 数量。-m:显示 slabinfo
-n:只在开始时显示一次各字段名称。-s:显示内存相关统计信息及多种系统活动数量。delay:刷新时间间隔。如果不指定,只显示一条结果。count:刷新次数。如果不指定刷新次数,但指定了刷新时间间隔,这时刷新次数为无穷。-d:显示磁盘相关统计信息。-p:显示指定磁盘分区统计信息
-S:使用指定单位显示。参数有 k、K、m、M,分别代表 1000、1024、1000000、1048576 字节(byte)。默认单位为 K(1024 bytes)-V:显示 vmstat 版本信息。
常用命令如下:
vmstat 1 10
1 表示每隔 1 秒采集一次服务器状态,10 表示只采集 10 次。
r:运行队列中进程数量,这个值也可以判断是否需要增加 CPU。(长期大于 1),当这个值超过了 CPU 数目,就会出现 CPU 瓶颈了。这个也和 top 的负载有关系,一般负载超过了 3 就比较高,超过了 5 就高,超过了 10 就不正常了,服务器的状态很危险。
b:等待 IO 的进程数量,及阻塞的进程。
swpd:使用虚拟内存大小,如果大于 0,表示你的机器物理内存不足了,如果不是程序内存泄露的原因,那么你该升级内存了或者把耗内存的任务迁移到其他机器。
注意:如果 swpd 的值不为 0,但是 SI,SO 的值长期为 0,这种情况不会影响系统性能。
free:空闲物理内存大小
buff:用作缓冲的内存大小,inux/Unix 系统是用来存储,目录里面有什么内容,权限等的缓存
cache:用作缓存的内存大小 (这里是 Linux/Unix 的聪明之处,把空闲的物理内存的一部分拿来做文件和目录的缓存,是为了提高 程序执行的性能,当程序使用内存时,buffer/cached 会很快地被使用。)
注意:如果 cache 的值大的时候,说明 cache 处的文件数多,如果频繁访问到的文件都能被 cache 处,那么磁盘的读 IO bi 会非常小。
si:每秒从交换区写到内存的大小,由磁盘调入内存,如果这个值大于 0,表示物理内存不够用或者内存泄露了,要查找耗内存进程解决掉。
so:每秒写入交换区的内存大小,由内存调入磁盘,如果这个值大于 0,同上。
注意:内存够用的时候,这 2 个值都是 0,如果这 2 个值长期大于 0 时,系统性能会受到影响,磁盘 IO 和 CPU 资源都会被消耗。有些朋友看到空闲内存 (free) 很少的或接近于 0 时,就认为内存不够用了,不能光看这一点,还要结合 si 和 so,如果 free 很少,但是 si 和 so 也很少(大多时候是 0),那么不用担心,系统性能这时不会受到影响的。
bi:每秒读取的块数,块设备每秒接收的块数量,这里的块设备是指系统上所有的磁盘和其他块设备,默认块大小是 1024byte。
bo:每秒写入的块数,块设备每秒发送的块数量,例如我们读取文件,bo 就要大于 0。bi 和 bo 一般都要接近 0,不然就是 IO 过于频繁,需要调整。
注意:随机磁盘读写的时候,这 2 个值越大(如超出 1024k),能看到 CPU 在 IO 等待的值也会越大。
in:每秒中断数,包括时钟中断。
cs:每秒上下文切换数。每秒上下文切换次数,例如我们调用系统函数,就要进行上下文切换,线程的切换,也要进行上下文切换,这个值要越小越好,太大了,要考虑调低线程或者进程的数目, 例如在 apache 和 nginx 这种 web 服务器中,我们一般做性能测试时会进行几千并发甚至几万并发的测试,选择 web 服务器的进程可以由进程或者线程的峰值一直下调,压测,直到 cs 到一个比较小的值,这个进程和线程数就是比较合适的值了。系统调用也是,每次调用系统函数,我们的代码就会进入内核空间,导致上下文切换,这个是很耗资源的,也要尽量避免频繁调用系统函数。上下文切换次数过多表示你的 CPU 大部分浪费在上下文切换,导致 CPU 干正经事的时间少了,CPU 没有充分利用,是不可取的。
注意:上面 2 个值越大,会看到由内核消耗的 CPU 时间会越大。
us:用户进程执行时间百分比(user time)
注意:us 的值比较高时,说明用户进程消耗的 CPU 时间多,但是如果长期超 50% 的使用,那么我们就该考虑优化程序算法或者进行加速。
sy:内核系统进程执行时间百分比(system time),系统 CPU 时间,如果太高,表示系统调用时间长,例如是 IO 操作频繁
注意:sy 的值高时,说明系统内核消耗的 CPU 资源多,这并不是良性表现,我们应该检查原因。
wa:IO 等待时间百分比,等待 IO 时间,wa 的值高时,说明 IO 等待比较严重,这可能由于磁盘大量作随机访问造成,也有可能磁盘出现瓶颈。
注意:wa 的值高时,说明 IO 等待比较严重,这可能由于磁盘大量作随机访问造成,也有可能磁盘出现瓶颈(块操作)。
id:空闲时间百分比,空闲 CPU 时间,一般来说,id + us + sy = 100, 一般我认为 id 是空闲 CPU 使用率,us 是用户 CPU 使用率,sy 是系统 CPU 使用率
wt:等待 IO CPU 时间。