Intel® Data Center Diagnostic Tool untuk Prosesor Intel® Xeon®

Dokumentasi

Perawatan & Kinerja

000058107

22/04/2024

Produk Lebihview

Intel® Data Center Diagnostic Tool adalah alat untuk memverifikasi kesehatan inti CPU.

Versi saat ini adalah 603 dan dirilis pada 22 Maret 2024.

Lingkungan

Fokus utama penyedia cloud hyperscale dan pusat data perusahaan selalu memberikan uptime dan keandalan terbaik. Secara historis industri ini telah melakukannya dengan cukup baik, secara rutin mencapai uptime >99,999%. Namun, infrastruktur komputasi modern menghadirkan ekspektasi pengguna yang terus meningkat untuk Kualitas Layanan (QoS) dan ketersediaan tinggi. Harapan ini menekankan perlunya alat perangkat lunak canggih yang dapat membantu mengidentifikasi dan meminimalkan kesalahan sistem tak terduga yang dapat membahayakan QoS atau uptime.

Di Intel, kami membangun dan menggunakan alat pengujian dan validasi tingkat komponen lanjutan yang secara signifikan mengurangi cacat pada produk kami yang mungkin mengakibatkan kesalahan sistem. Pelanggan hyperscale kami dan pemasok mereka menggunakan alat perangkat lunak yang dikembangkan Intel yang sama ini untuk menjaga kesehatan armada sepanjang masa pakai sistem mereka. Mereka menyadari bahwa seiring waktu, pemantauan ketat terhadap aset sistem dapat meningkatkan ketahanan armada dan QoS pelanggan secara keseluruhan.

Intel menyadari banyak pelanggan yang berbeda dapat memperoleh manfaat dari kemampuan yang sama, dan Intel® Data Center Diagnostic Tool adalah versi yang disederhanakan dari perangkat lunak ini untuk mengelola lingkungan di lokasi.

Alat Diagnostik Pusat Data Intel®

Intel® Data Center Diagnostic Tool (Intel® DCDiag) dirancang bagi manajer TI untuk melakukan pemeliharaan berkala terhadap armada pusat data mereka. Intel® DCDiag dapat digunakan pada berbagai ukuran pusat data untuk membantu memastikan tingkat tertinggi kualitas dan ketersediaan yang berkelanjutan. Selain itu, DCDiag dapat digunakan untuk penyaringan armada berkala di latar depan (~ runtime 45 menit) atau dalam mode latar belakang dan dapat mengidentifikasi mikroprosesor yang salah. Menjalankan pemeliharaan sistem secara berkala membantu mengidentifikasi potensi masalah secara proaktif dan memberi administrator sistem kemampuan untuk mengganti mikroprosesor tersebut.

Intel® DCDiag adalah serangkaian pengujian yang secara metodis memeriksa sebagian besar fungsionalitas SoC, termasuk setiap inti mikroprosesor. Dengan memverifikasi bahwa setiap perhitungan DCDIAG benar, dan tidak hanya mengkonfirmasi bahwa tes menyelesaikan eksekusi dengan benar, DCDIAG mampu mendeteksi banyak jenis kesalahan termasuk yang bermanifestasi sebagai Kesalahan Data Senyap.

Intel® DCDiag menemukan kegagalan dengan memeriksa hasil operasi prosesor yang benar dengan beberapa pengujian.

  • Menjalankan beberapa loop kode, atau menjalankan kode yang sama pada semua inti, dan memeriksa apakah hasilnya sama.
  • Memeriksa cache, komunikasi inti-ke-inti, dan sebagian besar instruksi prosesor.

Kumpulan data acak digunakan untuk menguji instruksi dan inti. Laporan keluar adalah lulus/gagal yang mudah dipahami pada prosesor. Prosesor yang gagal dalam pengujian harus dikembalikan ke vendor atau distributor sistem untuk penggantian.

How Does DCDIAG Work?

Hasil Tes

Hasil tes DCDiag dirancang agar mudah dipahami. Ketika diagnostik selesai, sistem mengembalikan salah satu pesan berikut:

  • Pengujian berhasil diselesaikan. Tidak ada masalah yang terdeteksi.
  • Pengujian berhasil diselesaikan. Satu atau lebih kesalahan pemeriksaan mesin terjadi. Silakan periksa log sistem.
  • Prosesor ini tidak didukung oleh versi alat ini.
    • Periksa model dan versi prosesor sistem. Pesan ini muncul jika Intel Data Center Diagnostic Tool tidak mendeteksi versi produksi prosesor yang didukung. Sampel teknik tidak didukung oleh alat ini.

    • Temukan bantuan dalam mengidentifikasi prosesor.

  • Tes selesai. Hasilnya tidak meyakinkan karena versi mikrokode yang sudah ketinggalan zaman.
    • Versi terbaru pengendali membahas masalah yang diketahui. Intel menyarankan untuk memperbarui ke versi terbaru.

  • Tes gagal. Hubungi produsen sistem atau vendor prosesor Anda untuk mendapatkan dukungan.
    • Jika hasil pengujian menunjukkan kegagalan, periksa apakah prosesor node server Anda masih dalam garansi.

    • Jika Anda memiliki Prosesor Box Intel® Xeon® yang masih dalam garansi 3 tahun, hubungi Intel Customer Support untuk mendapatkan bantuan.

    • Jika Anda memiliki prosesor tray, hubungi vendor sistem atau prosesor atau tempat pembelian untuk mendapatkan bantuan.

Persyaratan Sistem

Intel® Data Center Diagnostic Tool adalah aplikasi yang tersedia untuk sistem operasi Linux* dan Windows*. Alat ini dapat diinstal dan dijalankan pada banyak distribusi Linux* dan Windows* saat ini, lihat Instalasi pada Linux* dan Windows*.

Mulai dengan versi 558, alat ini dapat diinstal pada Windows* menggunakan penginstal MSI yang disediakan dan berjalan pada semua versi Windows 10*, Windows Server 2016*, atau yang lebih baru yang saat ini didukung oleh Microsoft. Silakan baca informasi rilis Server Windows* untuk menentukan versi sistem Server Windows* mana yang saat ini tersedia dan didukung.

Untuk cakupan terbaik, jalankan aplikasi di sistem root server. Dimungkinkan untuk menjalankannya di dalam wadah atau mesin virtual tetapi perlu diketahui bahwa beberapa fungsi mungkin dinonaktifkan.

Prosesor yang didukung:

  • Prosesor Intel® Xeon® yang Dapat Diskalakan Generasi ke-5 (sebelumnya Emerald Rapids)
  • Prosesor Intel® Xeon® yang Dapat Diskalakan Generasi ke-4 (sebelumnya Sapphire Rapids)
  • CPU Seri Max Intel® Xeon® (sebelumnya Sapphire Rapids HBM)
  • Prosesor Intel® Xeon® yang Dapat Diskalakan Generasi ke-3 (sebelumnya Ice Lake dan Cooper Lake)
  • Prosesor Intel® Xeon® yang Dapat Diskalakan Generasi ke-2 (sebelumnya Cascade Lake)
  • Prosesor Intel® Xeon® yang Dapat Diskalakan Generasi ke-1 (sebelumnya Skylake)
  • Rangkaian Prosesor Intel® Xeon® E5 v4 (sebelumnya Broadwell)
  • Intel® Xeon® Rangkaian Prosesor E7 v4 (sebelumnya Broadwell)

Intel® Data Center Diagnostic Tool untuk Windows pada Prosesor Intel® Xeon®

Intel® Data Center Diagnostic Tool untuk Linux pada Prosesor Intel® Xeon®

Cara menguji Prosesor Intel® Xeon® menggunakan Intel® Data Center Diagnostic Tool

Catatan:

Untuk pengembang: Intel memulai Proyek Diagnostik Pusat Data Terbuka, yang membuka kerangka kerja Diagnostik Pusat Data Intel dan menyediakan pengujian tertentu. Ini menawarkan pengembang kerangka kerja pengembangan pengujian yang konsisten yang mengundang kreativitas komunitas Sumber Terbuka untuk meningkatkan manajemen armada cloud melalui pengembangan layar uji unik dan solusi inovatif lainnya. Untuk informasi lebih lanjut dan akses ke kerangka kerja dan pengujian ini.

Riwayat versi

Tanggal Versi Deskripsi
Selasa, 07 Juli 2021 pukul 540 Versi awal
16 Agustus 2022 549 Perbaikan bug
20 September 2022 549 Perintah diubah untuk mengaktifkan alat dan memverifikasi pengaktifan
10 Januari 2023 550 Termasuk Prosesor Intel® Xeon® generasi ke-4
20 Januari 2023 576 Versi 576 Rilis
14 Des 2023 594 Versi 594 Rilis
22 Maret 2024 603 Versi 603 Rilis

*Nama dan merek lain dapat diklaim sebagai milik orang lain.

Topik terkait
Situs Web Pusat Dukungan Intel® Xeon®
Panduan Garansi untuk Prosesor Intel®
Intel® Data Center Diagnostic Tool bagi Prosesor Intel® Xeon® untuk Windows*