Apa yang saya lihat?
IERR adalah kesalahan katastropik yang dilaporkan oleh prosesor, tetapi umumnya disebabkan oleh perangkat di luar inti prosesor (misalnya, memori, PCIe).
- Eksekusi prosesor terhenti karena biasanya terjadi peristiwa di luar prosesor.
- Masalah ini sering disertai dengan peristiwa CATERR yang dapat dirujuk silang untuk informasi tambahan.
Cara memperbaikinya:
Ikuti langkah-langkah ini secara berurutan:
- Tinjau Log Peristiwa Sistem (SEL) untuk peristiwa kode koreksi kesalahan (ECC ). Memori yang rusak dapat memicu IERR.
- Tinjau SEL untuk setiap peristiwa PCIe. Perangkat PCIe yang tidak berfungsi dapat memicu IERR.
- Pastikan bahwa driver Sistem Operasi (OS) sudah diperbarui untuk server serta untuk perangkat keras yang baru ditambahkan. Driver OS yang kedaluwarsa dapat memicu IERR.
- Periksa log OS untuk setiap entri Machine Check Architecture (MCA) yang mungkin mengindikasikan kesalahan perangkat keras yang dapat memicu IERR.
- Konfirmasikan bahwa Anda memiliki BIOS terbaru untuk sistem server.
- Buka Baseboard Management Controller Web Console > Configuration > Memory Configuration > PPR Type dan atur pengaturan PPR ke Hard.
- Jika log mengonfirmasi bahwa ada modul memori tertentu yang dapat menyebabkan masalah, lanjutkan untuk memasang kembali memory stick dan pantau server selama 24 jam.