阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

Centos 服务器系统内存故障排查

33次阅读
没有评论

共计 548 个字符,预计需要花费 2 分钟才能阅读完成。

导读 该笔记主要记录一下如何排查指定服务器中的指定内存条是否损坏。

Centos 服务器系统内存故障排查

1. 内存故障排查

因为 68 – 71 软 SBC 服务器都是 Centos7 系统,所以我们可以通过以下命令来排查内存是否出现损坏。

grep "[0-9]" /sys/devices/system/edac/mc/mc/csrow/ch*_ce_count

Centos 服务器系统内存故障排查

1> count 不为 0 表示有错误 
2> mc 代表第几个 cpu,
3> csrow 内存通道,
4> ch 第几个内存 

EDAC 即 error detection and correction(错误检测与纠正),是 Linux 系统内部的机制。在上面的日志中,可以清楚地看出是内存读错误。MC 即 memory controller(内存控制器)。CE 则代表 correctable error,是 ECC 内存中可以纠正的错误,相对地还有 UE(uncorrectable error)。为了摸清是哪些内存出了问题,找出所有内存的 CE 计数, 由上图可知,第四块内存出现了故障。

通过 dmidecode -t memory 命令,可以查看每个 DIMM
Centos 服务器系统内存故障排查

2.CPU 排查 cat /sys/devices/system/cpu/cpu*/online

Centos 服务器系统内存故障排查

阿里云 2 核 2G 服务器 3M 带宽 61 元 1 年,有高配

腾讯云新客低至 82 元 / 年,老客户 99 元 / 年

代金券:在阿里云专用满减优惠券

正文完
星哥说事-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2024-07-25发表,共计548字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中