Lewatkan ke Konten Utama
Dasar Pengetahuan Dukungan

Mengapa Latensi dan Throughput Lebih Tinggi Saat Menginferensi model dengan OpenVINO™ Benchmark pada GPU Dibandingkan dengan CPU?

Jenis Konten: Informasi & Dokumentasi Produk   |   ID Artikel: 000093152   |   Terakhir Ditinjau: 09/02/2023

Deskripsi

  • Model yang sama dengan OpenVINO™ Benchmark pada CPU dan GPU:
    benchmark_app.exe -m model.xml -d CPU
    benchmark_app.exe -m model.xml -d CPU
  • Latensi dan throughput yang dihasilkan pada GPU lebih tinggi dibandingkan pada CPU.
  • Tidak dapat menentukan mengapa latensi dan throughput inferensi pada GPU lebih tinggi dari CPU karena latensi rendah menghasilkan throughput tinggi.

Resolusi

Latensi mengukur waktu inferensi yang diperlukan untuk memproses satu input jika inferensi sinkron.

Saat menjalankan OpenVINO™ Benchmark dengan parameter bawaan, hal ini merupakan inferensi dalam mode asynchronous. Oleh karena itu, latensi yang dihasilkan mengukur total waktu inferensi yang diperlukan untuk memproses jumlah permintaan inferensi.

Selain itu, saat menjalankan Aplikasi Benchmark di CPU dengan parameter bawaan, 4 permintaan inferensi dibuat sedangkan 16 permintaan inferensi dibuat jika menjalankan Aplikasi Benchmark pada GPU dengan parameter bawaan. Oleh karena itu, latensi inferensi pada GPU yang dihasilkan lebih tinggi dibandingkan pada CPU.

Tentukan jumlah permintaan inferensi yang sama saat menjalankan Aplikasi Benchmark pada CPU dan GPU untuk perbandingan yang adil:
benchmark_app.exe -m model.xml -d CPU -nireq 4
benchmark_app.exe -m model.xml -d CPU -nireq 4

Produk Terkait

Artikel ini berlaku untuk 3 produk.
Perangkat Lunak Prosesor Intel® Xeon Phi™ OpenVINO™ toolkit Pustaka Kinerja

Pelepasan Tanggung Jawab

Isi halaman ini adalah kombinasi terjemahan manusia dan komputer dari konten berbahasa Inggris. Konten ini diberikan hanya untuk kenyamanan Anda serta sebagai informasi umum dan tidak bisa dianggap sebagai lengkap atau akurat. Jika terdapat kontradiksi antara versi bahasa Inggris halaman ini dan terjemahannya, versi bahasa Inggris akan didahulukan. Lihat versi bahasa Inggris halaman ini.