阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

借助IPMITOOL解决服务器底层维护难题

29次阅读
没有评论

共计 2685 个字符,预计需要花费 7 分钟才能阅读完成。

硬件维护工具我常用的就 2 个:倚天剑 ipmitool 以及屠龙刀 MegaCli。今天我们来介绍 Ipmitool。注意:Ipmitool 是针对硬件底层进行操作管理,对于电源相关的操作请三思!

1. IPMI 简介

IPMI (intelligent platform management interface)智能平台管理接口是一种开放标准的硬件管理接口规格,定义了嵌入式管理子系统进行通信的特方法。IPMI 信息通过基板管理控制器 (BMC)(位于 IPMI 规格的硬件组上)进行交流。使用低级智能管理而不使用操作系统 进行管理,用户可以利用 IPMI 监视服务器的物理健康状态,如温度、电压、风扇工作状态、电源状态等。

2. IPMI 优点

IPMI 把系统管理软件从系统的硬件平台管理任务中分离出来,并且把底层的服务器管理功能与高层软件分开。这样,推出一个通用的、跨系统的平台管理监控软件就成为可能;
IPMI 是可扩展的并且能够快速简单地在其上附加新功能,如增加更多的传感器、管理控制器或特定的配件设备;
在加入 IPMI 技术的系统里,CPU 只需要与 IPMI 就事件进行通信,形成 IPMI 事件记录(Event Log)。在系统上的每个设备直接通过 IPMI 与事件记录文件通信,而事件记录文件以统一的方法为每个特定的设备记录所有的事件状态。这一特点进一步简化了代理(Agent)的处理任务,提高了系统的整体运行性能。

3. IPMI 工作原理

IPMI 的核心是基板管理控制器(BMC),其并不依赖于服务器的处理器、BIOS 或操作系统来工作,可谓非常地独立,是一个单独在系统内运行的无代理管理子系统,只要有 BMC 与 IPMI 固件其便可开始工作,而 BMC 通常是一个安装在服务器主板上的独立的板卡,现在也有服务器主板提供对 IPMI 支持的。IPMI 良好的自治特性便克服了以往基于操作系统的管理方式所受的限制,例如操作系统不响应或未加载的情况下其仍然可以进行开关机、信息提取等操作。

在工作时,所有的 IPMI 功能都是向 BMC 发送命令来完成的,命令使用 IPMI 规范中规定的指令,BMC 接收并在系统事件日志中记录事件消息,维护描述系统中传感器情况的传感器数据记录。在需要远程访问系统时,IPMI 的 SOL 特性很有用。SOL 改变 IPMI 会话过程中本地串口传送方向,从而提供对紧急管理服务、Windows 专用管理控制台或 Linux 串行控制台的远程访问。BMC 通过在 LAN 上改变传送给串行端口的信息的方向来做到这点,提供了一种与厂商无关的远程查看启动、操作系统加载器或紧急管理控制台来诊断和维修故障的标准方式。

4. BMC 的功能
  • 系统的串行端口进行访问
  • 故障日志记录和 SNMP 警报发送
  • 访问系统事件日志 (System Event Log ,SEL) 和传感器状况
  • 控制包括开机和关机
  • 独立于系统电源或工作状态的支持
  • 用于系统设置、基于文本公用程序和操作系统控制台的文本控制台重定向
5. BMC 工作原理

BMC 基板管理控制器 (baseboard management controller) 的缩写,这是一个在 IPMI 结构下提供智能管理的控制器,BMC 因为多集成于主板而得名,系统管理软件对各个被管理器件的管理,都是通过与 BMC 通信来实现的。BMC 通过与主板上的不同传感器通信来监视系统是否有严重事件,并在某些参数超出其预置阈值时发出警报和日志事件。BMC 支持工业标准的 Intelligent Platform Management Interface (IPMI) 协议,可以实现远程配置、监测和恢复系统。BMC 芯片就相当于计算机中的中央处理器,通过 BMC 芯片上一对 SMBus 接口连接网络,用户可通过网络访问实现对远程服务器接管的带外管理(Out-of-band)功能,例如远程接管服务器(Pre-OS),在客户端实现对远程服务器的完全接管;通过 RS-232 接口连接 Modem,在远程服务器宕机情况下,用户可以通过拨号访问获取 SDR、SEL 数据,分析诊断故障原因;BMC 通过 IPMB 接口访问模组风扇背板、电源背板等上的 SMC,实现对各种背板的温度电压风扇转速等关键参数管理;BMC 通过系统接口(多用 SMIC:ServerManagement Interface Chip),实现 IPMI 消息传输机制,控制 LCD 显示和实现上层软件与底层 F /W 通信,实现告警、数据采集。SDR、SEL、FRU(Field Replacement Unit)物理实体可以是做在芯片内的存储体,也可以是外挂的 E2PROM。

借助 IPMITOOL 解决服务器底层维护难题BMC 从不同的传感器收集信息,然后可以存到本地的 SEL 里面,便于以后查询,也会把重要的信息显示到服务器前面板上面的那个小的 LCD 显示器上(需要硬件支持)。同时还能通过网卡(LAN), 串口(Serial)、本地(Host)来访问这些信息

6. Ipmitool 的实现方式

借助 IPMITOOL 解决服务器底层维护难题

6.1 本地调用系统结构图

借助 IPMITOOL 解决服务器底层维护难题借助 IPMITOOL 解决服务器底层维护难题

6.2 远程调用系统结构图

借助 IPMITOOL 解决服务器底层维护难题借助 IPMITOOL 解决服务器底层维护难题

6.3 配置本 地啊哦做系统支持 IPMI

载入系统功能模块(2.6 kernels):

modprobe ipmi_msghandler
modprobe ipmi_si
modprobe ipmi_devintf

注意:必须先载入模块,这样内核才能识别 ipmidev 设备。如果是 2.4kernels 载入模块有所区别,请参考文档结尾附录部分。

7. 各品牌服务器对于 Ipmitool 的支持

如下命令都是在本地调用,如果需要配合远程调用使用,则改为:
ipmitool -I lanplus -H $ILO_IP -U $USERNAME -P $PASSWORD XXXXXXXX

8、坑—客户端无法获取 dell 机器的 mac 信息

现象无法远程获取 dell 机型的 mac 地址信息

#ipmitool -I lanplus -U $ILO_USER -P $ILO_PW -H $ILO_IP delloem mac get 1

Error in getting MAC Address : Not supported platform

经过多次测试,对比不同服务器的系统版本,ipmitool 版本以及,IDRAC 固件版本后发现是客户端的 ipmitool 的版本问题

9、坑—SOL 重定向出现乱码

在启动的各个阶段都能够正常显示,一到登录界面,就出现乱码.

故障原因:配置不同

/etc/inittab 文件配置不同 S0:12345:respawn:/sbin/agetty -L 57600 ttyS1 vt102

/boot/grub/menu.lst 文件配置不同 未注释掉 splashimage 图形显示

阿里云 2 核 2G 服务器 3M 带宽 61 元 1 年,有高配

腾讯云新客低至 82 元 / 年,老客户 99 元 / 年

代金券:在阿里云专用满减优惠券

正文完
星哥说事-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2024-07-24发表,共计2685字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中