Linux服务器的性能监控与分析
阅读原文时间:2023年08月21日阅读:1

通过vmstat分析性能

如上图所示,我们在命令vmstat后面添加了两个参数,1表示间隔一秒获取一次,10表示总共获取10次

我们一列一列数据来看:

  • r:代表目前实际运行的指令队列,很高表示CPU很繁忙通常会CPU使用率过高

    • 这个数据如果高于服务器CPU核数就可能出现瓶颈(需要结合后五列CPU使用百分比)
    • 超过CPU核数的3个就比较高,超过5个已经很高,超过10个就比较危险了
  • b:目前因为等待资源而阻塞运行指令,比如等待I/O,内存交换、CPU资源瓶颈

  • swpd:表示虚拟内存(swap)已使用的大小。当服务器物理内存不够用时候,会把物理内存的部分空间释放出来,以供急需物理内存的来运行的程序使用,而从物理内存释放出来的一般是很长时间没有实际运行的程序。被保存到虚拟内存的内容等到运行起来,会从虚拟内存中恢复到物理内存。swpd大于0,不代表物理内存不够用了,需要结合si和so,如果si和so为0,表示物理内存是够用的

  • free:空闲的物理内存

  • buff:系统缓冲区的内存大小,只有对块设备读写才会需要缓冲区

  • cache:给已经打开的文件作为缓存的内存大小

  • si:每秒从虚拟内存读到内存中的数据大小,如果这个值长期大于0,表示物理内存不够用了

  • so:每秒写入虚拟内存的数据内容大小

  • bi和bo:表示每秒块设备读写,bi和bo两个值越大,CPU在I/O等待的值越大

  • in:CPU中断次数

  • cs:CPU每秒上下文切换次数,这值要越小越好,太大了要考虑调低线程和进程数量。上下文切换次数过多会让CPU大部分时间都浪费在上下文切换上,CPU正经运行就少了,CPU没有充分被利用。

  • us:用户模式CPU使用时间百分比,越高越好,说明CPU被充分利用了

  • sy:系统内核执行时间百分比,太高说明系统内核消耗CPU资源多

  • id:表示空闲空闲CPU占比,一般id + us + sy =100

  • wa:表示I/O等待时间百分比,越高说明I/O等待情况严重

  • st:改值一般都是0,一般在虚拟机中才会有

通过mpstat分析性能

如上图所示,我们在命令mpstat后面添加了两个参数,1表示间隔一秒获取一次,10表示总共获取10次

  • %usr:用户模式下CPU使用时间的百分比,和vmstat中us数据基本一致
  • %nice:CPU进程优先级调度占用的时间,这个值一般都是0,只有修改过默认优先级才会显示
  • %sys:表示系统内核进程执行时间百分比(system time)。该值越高,说明系统内核消耗的CPU资源越多,和vmstat命令中的sy数据基本一致。
  • %iowait:表示I/O等待时间的百分比。该值越高,说明IO等待越严重,和vmstat命令中的wa数据基本一致。
  • %irq:表示用于处理系统中断的CPU百分比。和vmstat命令中的in数据的含义类似。in越高,%irq也会越高。
  • %soft:表示用于软件中断的CPU百分比
  • %steal:表示CPU等待虚拟机调度的时间占比。这个指标一般在虚拟机中才会有,物理机中该值一般维持为0,和vmstat命令中的st数据基本一致。
  • %idle:表示空闲CPU时间的占比。和vmstat命令中的id数据基本一致

通过pidstat分析性能

  • UID:用户id
  • PID:进程id
  • %usr:进程对用户模式CPU使用的时间
  • %system:进程对系统模式CPU使用的时间
  • CPU:执行指定进程的CPU编号
  • Command:当前进程运行命令

通过free看内存

  • total:显示系统总的物理内存和交换区大小单位是k
  • used:显示已经被使用的物理内存和交换区大小单位是k
  • free:显示还有多少未使用的物理内存和交换区单位是k
  • shared:显示共享区占用的物理内存大小单位是k
  • buff/cache:缓冲区和缓存合计使用的内存大小单位是k
  • available列:显示的是可用物理内存的大小,单位为k。通常情况下,available的值等于free+buff/cache。

通过top系统情况

  • 第一行显示的是系统运行信息:系统时间20:04:16秒、系统运行了12天、当前登陆用户2个、系统平均负载:4.75(1分钟平均负载压力),2.83(5分钟平均负载压力),2.02(15分钟平均负载压力)(这个数值除以CPU核数得到的值大于3-5时,系统负载就超高了)
  • 第二行显示任务信息:总进程352,1个运行状态,298个休眠中,0个停止,0个假死
  • 第3行显示的是CPU的运行信息: 11.1us表示用户模式下CPU占用比为11.1%,5.0 sy表示系统模式下CPU占用比为5.0%,0.1 ni表示改变过优先级的进程的CPU占用比为0.1%,83.2 id表示空闲状态的CPU占用比为83.2%,0.3 wa表示因为I/O等待造成的CPU占用比为0.3%,0.0 hi表示硬中断的CPU占用比,0.3 si表示软中断的CPU的占用比。0.0 st表示CPU等待虚拟机调度的时间占比,这个指标一般在虚拟机中才会有,在物理机中该值一般维持为0。
  • 第4行显示的是内存的使用信息:total表示物理内存的总量,free表示物理内存的空闲大小,198808 used表示已使用的物理内存的大小,buff/cache表示用于缓存的物理内存的大小。
  • 第5行显示的是虚拟内存(swap)的使用信息: total表示虚拟内存空间的大小, free表示空闲的虚拟内存空间的大小, used表示已使用的虚拟内存空间的大小, avail Mem表示可供使用的内存大小。
  • 第7行显示的是每个进程的资源消耗信息
    • %CPU:进程运行时CPU占用比
    • %MEM:进程使用的内存占用比
    • TIME+:进程占用CPU总时长
    • COMMAND:正在运行的命令

友情链接

https://www.cnblogs.com/yetangjian/p/15705398.html