Intel® Data Center Diagnostic Tool untuk Prosesor Intel® Xeon®

Dokumentasi

Perawatan & Kinerja

000058107

14/03/2022

Pengenalan

Intel® Data Center Diagnostic Tool adalah alat perangkat lunak diagnostik yang dapat dijalankan pada platform pusat data Anda untuk:

  • Verifikasi fungsionalitas semua inti dalam Prosesor Intel® Xeon®.
  • Digunakan sebagai bagian dari program pemeliharaan sistem reguler.

Keandalan dan ketersediaan yang tinggi di pusat data memerlukan alat yang tepat dan komitmen untuk pemeliharaan. Intel percaya bahwa ini adalah praktik terbaik industri untuk menggunakan alat pemeliharaan seperti ini untuk penerapan awal dan pengujian berkala untuk membantu memastikan pengalaman sistem terbaik.

    Catatan
    • Infrastruktur komputasi modern menghadirkan permintaan daya pemrosesan yang terus meningkat dikombinasikan dengan ekspektasi bisnis untuk kualitas layanan dan ketersediaan tinggi (serta jaminan pada perjanjian tingkat layanan [SLA] secara umum). Harapan ini menekankan perlunya alat perangkat lunak canggih yang dapat membantu memprediksi, mengidentifikasi, dan meminimalkan kesalahan sistem tak terduga yang dapat membahayakan kualitas layanan atau uptime. Baca makalah dari IDC yang mencakup kebutuhan alat diagnostik termasuk Intel® Data Center Diagnostic Tool.

    Persyaratan sistem

    the Intel Data Center Diagnostic Tool adalah aplikasi Linux* yang dapat diinstal dan dijalankan pada banyak distribusi Linux saat ini. Tidak ada versi Windows* dari alat ini.

    Untuk cakupan terbaik, jalankan aplikasi di sistem root server. Dimungkinkan untuk menjalankannya di dalam kontainer atau mesin virtual, tetapi perlu diketahui bahwa beberapa fungsi mungkin dinonaktifkan.

    Prosesor yang didukung:

    • Prosesor Intel® Xeon® yang Dapat Diskalakan Generasi ke-3 (sebelumnya Ice Lake dan Cooper Lake)
    • Prosesor Intel® Xeon® generasi ke-2 yang Dapat Diskalakan (sebelumnya Cascade Lake)
    • Prosesor Intel® Xeon® yang Dapat Diskalakan Generasi ke-1 (sebelumnya Skylake)
    • Rangkaian Prosesor Intel® Xeon® E5 v4 (sebelumnya Broadwell)
    • Rangkaian Prosesor Intel® Xeon® E7 v4 (sebelumnya Broadwell)
    Catatan
    • Untuk pengembang: Intel memulai Open Data Center Diagnostic Project, yang membuka kerangka kerja Diagnostik Pusat Data Intel dan memberikan pengujian tertentu. Hal ini menawarkan kerangka kerja pengembangan pengujian konsisten kepada developer yang mengundang kreativitas komunitas Sumber Terbuka untuk meningkatkan pengelolaan armada cloud melalui pengembangan layar pengujian unik dan solusi inovatif lainnya. Untuk informasi lebih lanjut dan akses ke kerangka kerja dan pengujian ini

    Instalasi

    Catatan
    • Detail tambahan tersedia dalam berkas /usr/share/doc/dcdiag/README.rst yang disertakan dalam instalasi.
    • Kami menyarankan menggunakan langkah-langkah pada bagian di bawah ini untuk menautkan ke repositori, yang memastikan Anda mendapatkan versi terbaru dari Intel® Data Center Diagnostic Tool. Namun, jika Anda memerlukan biner yang dapat diunduh, gunakan berkas RPM atau berkas DEB.

     

    Debian*/Ubuntu*

    Untuk menginstal paket perangkat lunak Intel® Data Center Diagnostic Tool pada distribusi berbasis Debian*, tambahkan penyimpanan paket Intel software dan instal paket yang sesuai.

    Sebelum menyalin+menempel ke konsol, Anda mungkin ingin menjalankan sudo ls dan memasukkan kata sandi untuk mencegah perintah dikonsumsi oleh prompt kata sandi sudo :

    Atur kunci untuk memverifikasi tanda tangan paket

    curl https://repositories.intel.com/dcdt/dcdiag.pub | sudo apt-key add -

    Mengatur repositori

    sudo apt-add-repository 'deb https://repositories.intel.com/dcdt/debian stable main'

    Instal paket

    sudo apt-get update
    sudo apt-get install dcdiag

    Fedora*/CentOS*/RHEL*

    Untuk menginstal paket perangkat lunak Intel Data Center Diagnostic Tool pada distribusi berbasis Fedora, tambahkan repositori paket Intel software dan instal paket.

    Pertama kali Anda menginstal, YUM atau DNF akan meminta Anda untuk menerima kunci penandatanganan. Verifikasi bahwa sidik jari adalah sebagai berikut, kemudian terima:
    Userid: "CN=Release Key"
    Fingerprint: 6226 CA48 AAB6 0900 2093 C7C4 0A04 4B42 CF00 5B79

    Sebelum menyalin+menempel ke konsol, Anda mungkin ingin menjalankan sudo ls dan memasukkan kata sandi untuk mencegah perintah dikonsumsi oleh prompt kata sandi sudo :

    Instal berkas repository

    sudo yum install https://repositories.intel.com/dcdt/dcdiag-repo.rpm

    Instal paket

    sudo yum install dcdiag

    OpenSUSE*/SUSE Linux Enterprise*:

    Instal berkas repository

    sudo zypper ar https://repositories.intel.com/dcdt/dcdiag.repo

    Instal paket

    sudo zypper install dcdiag

    Anda akan diperingatkan bahwa respond.xml tidak ditandatangani. Respons ya untuk melanjutkan. Anda akan diberikan kesempatan lain untuk memverifikasi tanda tangan paket. Verifikasi bahwa sidik jari adalah sebagai berikut, kemudian terima:

    Repository: dcdiag
    Key Name: CN=Release Key
    Key Fingerprint: 6226CA48 AAB60900 2093C7C4 0A044B42 CF005B79
    Key Created: Tue 24 Nov 2020 01:47:38 PM PST
    Key Expires: Sat 25 Nov 2023 01:47:38 PM PST
    Rpm Name: gpg-pubkey-cf005b79-5fbd7f7a

     

    Cara menguji Prosesor Intel Xeon

    Setelah terinstal, Intel Data Center Diagnostic Tool secara otomatis diaktifkan untuk eksekusi latar belakang. Anda dapat memverifikasi bahwa ini berhasil dengan perintah berikut:

    # systemctl status dcdiag
    ● dcdiag.service - Intel® Data Center Diagnostic Tool
    Loaded: loaded (/usr/lib/systemd/system/dcdiag.service; enabled; vendor preset: disabled)
    Active: active (running) since Fri 2021-02-19 11:24:17 MST; 4 days ago
    Docs: file:///usr/share/doc/dcdiag/README.rst
    Main PID: 8777 (dcdiag)
    CGroup: /system.slice/dcdiag.service
    └─8777 /usr/bin/dcdiag --service

    Catatan

    Jika Anda ingin menonaktifkan eksekusi latar belakang Intel Data Center Diagnostic Tool, jalankan:

    systemctl disable --now dcdiag

    Untuk informasi lebih lanjut tentang penggunaan perintah systemctl(1), lihat halaman manual Linux*.

    Jika ada galat yang terdeteksi saat Intel Data Center Diagnostic Tool dijalankan di latar belakang, alat akan mencatatnya ke log sistem. Alat ini juga dapat mengkueri jika ada kesalahan yang terdeteksi di pemindaian latar belakang menggunakan argumen --query.

    # dcdiag --query
    Intel® Data Center Diagnostic Tool Version 506
    Test completed successfully. No issues detected.

    Alat ini juga dapat dijalankan secara manual di latar depan dengan mengeksekusi di prompt perintah Linux:

    # dcdiag

    Pengujian manual berjalan selama sekitar 45 menit dan memiliki pemanfaatan CPU yang tinggi.

    Ketika diagnostik selesai, sistem mengembalikan salah satu pesan berikut:

    • Pengujian berhasil diselesaikan. Tidak ada masalah yang terdeteksi.
       
    • Pengujian berhasil diselesaikan. Terjadi satu atau beberapa galat pemeriksaan mesin. Periksa log sistem.
       
    • Prosesor ini tidak didukung oleh versi alat ini.

      Periksa model dan versi prosesor sistem. Pesan ini muncul jika Intel Data Center Diagnostic Tool tidak mendeteksi versi produksi prosesor yang didukung. Sampel teknik tidak didukung oleh alat ini.

      Temukan bantuan dalam mengidentifikasi prosesor.
       
    • Pengujian telah selesai. Hasil tidak meyakinkan karena versi mikrokode yang sudah kedaluarsa.

      Versi terbaru dari mikrokode mengatasi masalah yang diketahui. Perbarui. Pembaruan mikrokode biasanya dikirim oleh vendor distribusi Linux Anda bersama perbaikan keamanan dan pembaruan firmware lainnya untuk berbagai komponen. Jika sistem Anda tidak mengaktifkan pembaruan ini, kami sarankan Anda mengaktifkannya. Mikrokode secara otomatis dimuat oleh kernel Linux pada setiap booting dan dapat dimuat ulang pada runtime dengan perintah berikut sebagai root:

      echo 1 > /sys/devices/system/cpu/microcode
       
    • Pengujian telah selesai. Hasil tidak meyakinkan karena sistem melebihi batas suhu

      Ini bisa disebabkan oleh berbagai masalah dengan sistem yang tidak memberikan pendinginan yang cukup bagi CPU untuk beroperasi dalam batas suhu yang diperlukan. Kami menyarankan Anda memeriksa sistem untuk memastikan pendinginan yang diperlukan beroperasi dengan benar. Ini mungkin termasuk kipas yang rusak, aliran udara yang salah, atau beberapa masalah lingkungan lainnya.
       
    • Pengujian telah selesai. Hasil tidak meyakinkan, terjadi satu atau beberapa galat pemeriksaan mesin.

      Periksa log sistem.
       
    • Pengujian gagal. Hubungi produsen atau vendor prosesor sistem Anda untuk dukungan.

      Jika hasil pengujian gagal, periksa apakah prosesor node server Anda masih dalam masa garansi:

      • Jika Anda memiliki Prosesor Intel® Xeon® box yang masih dalam masa garansi 3 tahun, hubungi Dukungan Pelanggan Intel untuk bantuan.
      • Jika Anda memiliki prosesor tray, hubungi vendor sistem atau prosesor Anda atau tempat pembelian untuk memeriksa apakah prosesor masih dalam masa garansi.
        CatatanProsesor tray dijual langsung ke produsen sistem atau distributor resmi Intel. Intel tidak memberikan garansi langsung kepada pengguna akhir untuk prosesor tray kecuali prosesor tersebut telah diinstal sebelumnya dalam sistem server Intel® Data Center Block (Intel® DCB). Kecuali untuk sistem Intel DCB, garansi prosesor tray berasal dari vendor atau tempat pembelian prosesor atau sistem jika prosesor telah diinstal. Intel merekomendasikan pembelian dari Distributor Resmi Intel, Pemasok Resmi Intel, dan pengecer produk Intel®®
      • Ketahuilah bahwa Intel tidak memiliki program penggantian di luar garansi.
         
    • Pengujian gagal.

      Pengujian telah selesai, dan terdeteksi galat pada prosesor fisik yang berisi /sys/devices/system/cpu/cpuXX.

      Hubungi produsen atau vendor prosesor sistem Anda untuk dukungan.

    • Pengujian gagal.

      Pengujian tidak dapat menentukan prosesor fisik mana yang menyebabkan kegagalan.

      Hubungi produsen atau vendor prosesor sistem Anda untuk dukungan.
       

    Riwayat versi

    TanggalVersiDeskripsi
    7 Juli 2021540Versi awal

     

    Topik terkait
    Situs Web Pusat Dukungan Intel® Xeon®
    Panduan Garansi untuk Prosesor Intel®