服務器無法開機點不亮怎么解決?
-
服務器無法開機點不亮怎么解決?
1.CPU 過熱關機
當檢測到CPU溫度過高,導致OS關機時,會產生此告警。告警示例如下。
告警描述(iBMC V296及以上版本):
The OS was shut down due to CPU arg1 overheating (SN: arg2, BN: arg3).
可能的原因如下:
●風扇模塊故障。
●環境溫度過高。
●進風口/出風口堵塞。
●存在空槽位或間隔。
●未安裝導風罩。
●散熱器接觸不良或液冷裝置故障。
● CPU故障
2.CPU VRD 溫度讀取失敗
CPUarg1 VRD溫度讀取失敗時,會產生如下告警。讀取溫度失敗示例如下。
告警描述:
Failed to obtain data of the CPU arg1 VRD temperature (SN: arg2, BN: arg3).
可能原因如下:
●CPU VRD電源芯片故障或訪問通道故障。
3.CPU 不在位
當系統無法啟動,CPU不在位時,產生此告警。CPU不在位故障示例如下。
告警描述:
Failed to start the system. CPU arg1 was not detected (SN: arg2, BN: arg3).
可能原因如下:
● CPU故障。
●主板故障。
4. CPU 自檢失敗
系統啟動過程中,當CPU自檢失敗系統無法啟動時,產生此告警,CPU自檢失敗示例
如下。
告警描述:
CPU arg1 self-test failed (SN: arg2, BN: arg3).
可能原因如下:
● CPU故障。
●主板故障。
處理方法:更換主板。
5.CPU 配置錯誤
CPU配置錯誤,操作系統會無法啟動,有如下告警。
告警描述:
CPU arg1 cÑnfigñr?ì²Ñn error (SN: arg2, BN: arg3).
可能原因如下:
● CPU故障。
●主板故障。
6.CPU MCE/AER 錯誤
當CPU產生不可糾正的錯誤時,系統掛死,產生如下告警。
告警描述:
CPU arg1 triggered an uncorrectable error, arg2 (SN: arg3, BN: arg4).
可能原因如下:
●非內存鏡像模式下,SMI2鏈路失效。
● CPU執行錯誤的程序。
● VMSE鏈路發生奇偶校驗錯誤。
●內存控制器接收到帶poison標簽的數據。
處理方法:先冷復位一次,如果告警再次出現,更換主板。
7.CPU 電壓過高或過低
CPU當前核心電壓高于高壓門限時,產生如下告警,當電壓恢復到正常范圍時,告警
恢復。CPU電壓過高告警示例如下。
告警描述:
CPU arg1 core voltage (arg2 V) exceeds the overvoltage threshold (arg3 v) (SN: arg4, BN: arg5).
CPU當前核心電壓低于低壓門限時,產生如下告警,當電壓恢復到正常范圍時,告警
恢復。CPU電壓過低示例如下。
告警描述:
CPU arg1 core voltage (arg2 V) is lower than the undervoltage threshold (arg3 V) (SN: arg4, BN: arg5).
該類型故障可能導致系統掛死,可能是CPU故障或主板故障,處理方法是更換主板。
8.主板異常下電
當主板電源故障導致系統異常下電時,產生此告警。主板異常下電故障示例如下。
告警描述:
The [arg1] power arg2 failure results abnormal power-off.
對系統的影響:
服務器自動關機,導致操作系統業務中斷。
可能原因:
●主板電壓跌落。
●主板故障。
9.主板上電超時
電源故障導致系統上電超時無法正常開機時,BMC產生此告警。電源故障示例如下。
告警描述:
The [arg1] power [arg2] failure results host power-on timed out.
可能原因:
●外部供電不滿足服務器整機的功耗要求。
●主板故障。
推薦閱讀: - 上一篇:服務器主板點不亮是怎么回事? 下一篇:電腦風扇聲音大是怎么回事?