Lewatkan ke Konten Utama
Basis Pengetahuan Dukungan

Mengapa waktu muat model ke GPU lebih lama daripada ke CPU?

Jenis Konten: Pemeliharaan & Kinerja   |   ID Artikel: 000057525   |   Terakhir Ditinjau: 05/03/2026

Lingkungan

Toolkit OpenVINO™ Plugin GPU Plugin CPU

Deskripsi

Memuat Representasi Menengah (IR) model input ke GPU membutuhkan waktu lebih lama daripada memuat model yang sama ke CPU.

Resolusi

Buat direktori cl_cache secara manual di direktori kerja aplikasi Anda.

Driver akan menggunakan direktori ini untuk menyimpan representasi biner dari kernel yang dikompilasi. Ini akan berfungsi pada semua OS yang didukung.

Atau, atur variabel lingkungan:

export INTEL_OPENCL_CACHE=1

Informasi tambahan

Lihat artikel ini untuk Ikhtisar Caching Model guna mengoptimalkan latensi.

Memuat model input Anda dalam format Representasi Menengah (IR) ke GPU membutuhkan waktu lebih lama daripada memuat model yang sama ke CPU karena tumpukan GPU didasarkan pada OpenCL*. Waktu muat tergantung pada waktu kompilasi kernel OpenCL*.

Saat Anda mengaktifkan cl_cache, saat pertama kali Anda memuat model, masih akan memakan waktu lama karena kernel OpenCL* akan dikompilasi. Namun, setiap pemuatan berikutnya dari model yang sama akan jauh lebih cepat.

Untuk konfigurasi cache terprogram di OpenVINO™ 2026.0:
core.set_property("GPU", {"CACHE_DIR": "./cl_cache"})

Informasi Terkait

Dokumentasi Plugin GPU OpenVINO™ 2026.0

Produk Terkait

Artikel ini berlaku untuk 1 produk.

Pelepasan Tanggung Jawab

Isi halaman ini adalah kombinasi terjemahan manusia dan komputer dari konten berbahasa Inggris. Konten ini diberikan hanya untuk kenyamanan Anda serta sebagai informasi umum dan tidak bisa dianggap sebagai lengkap atau akurat. Jika terdapat kontradiksi antara versi bahasa Inggris halaman ini dan terjemahannya, versi bahasa Inggris akan didahulukan. Lihat versi bahasa Inggris halaman ini.