Menjelaskan properti OpenCL CL_DEVICE_MAX_WORK_ITEM_SIZES dan apakah produk grafis Intel yang lebih baru memiliki performa yang lebih baik untuk komputasi paralel.
- Apakah Grafik Intel® Iris® Xe memiliki lebih banyak item kerja atau utas daripada yang Intel® UHD Graphics?
- Mencari Grafis Intel® terbaik untuk melakukan komputasi paralel.
- Mengetik perintah "clinfo" di Linux dengan OpenCL:
- Intel Iris Xe Graphics memiliki total 96 Unit Eksekusi (EU) atau thread, empat kali lebih banyak dari Intel UHD Graphics dengan 24.
- Ukuran item kerja maksimal dari gambar di atas adalah nilai properti yang disebut CL_DEVICE_MAX_WORK_ITEM_SIZES dari spesifikasi OpenCL 2.1:
Jumlah maksimum item kerja yang dapat ditentukan dalam setiap dimensi grup kerja ke clEnqueueNDRangeKernel.
Mengembalikan n size_t entri, di mana n adalah nilai yang dikembalikan oleh kueri untuk CL_DEVICE_MAX_WORK_ITEM_DIMENSIONS.
Nilai minimum adalah (1, 1, 1) untuk perangkat yang bukan tipe CL_DEVICE_TYPE_CUSTOM. - Ini tidak berarti bahwa mesin dapat memiliki 256*256*256 = 16777216 item kerja dalam grup kerja dan dapat mengeksekusi thread 16777216 secara paralel.
- Properti CL_DEVICE_MAX_COMPUTE_UNITS menunjukkan bahwa mesin memiliki total 24 Unit Eksekusi (EU).
- Setiap thread mampu mengeksekusi baik di jalur SIMD8, SIMD16, atau SIMD32, SIMD tergantung pada kernel dan bagaimana itu dibangun oleh kompiler.
- Setiap EU memiliki 7 thread perangkat keras (HW) (untuk grafis Intel Generasi ke-6).
- Jumlah maksimum teoritis thread OpenCL untuk platform ini adalah 24*7*32 = 5376.
- Ini akan ditangani oleh 168 thread HW dan mengingat bahwa setiap kernel tertentu dibangun menggunakan mode SIMD32.
Jumlah EU untuk produk tertentu dapat ditemukan di halaman spesifikasi grafis kami.
Misalnya, 96 EU terlihat di bagian Grafis Prosesor untuk prosesor i7-11370H.