Contoh ini berisi implementasi performa tinggi dari operasi penggandaan matriks dasar dan menunjukkan optimisasi yang dapat dijelaskan dalam Open Computing Language (OpenCL™) untuk mencapai performa yang ditingkatkan secara signifikan. Pada tingkat algoritmik, kernel dalam contoh ini menunjukkan cara menggambarkan ubin loop untuk memanfaatkan penggunaan kembali data yang melekat dalam komputasi.
Contoh ini juga menunjukkan cara menggunakan unrolling loop dan optimisasi kompiler bergaya SIMD untuk dengan mudah meningkatkan performa kernel. Sebagai bagian dari paket contoh, parameter untuk setiap biner perangkat yang telah dikompilasi telah dipilih untuk memaksimalkan performa pada board tertentu. Detail tambahan tersedia dalam paket contoh yang menunjukkan betapa mudahnya parameterisasi kernel untuk menargetkan performa dan persyaratan sumber daya yang berbeda.
Juga, aplikasi host diatur untuk secara otomatis memanfaatkan beberapa perangkat OpenCL dengan mendistribusikan komputasi dan mencapai lebih banyak paralelisme.
Performa Pengganda Matriks Puncak
Fitur
- Implementasi operasi fundamental yang dioptimalkan
- Buffering memori lokal
- Optimisasi kompiler (loop unrolling, atribut num_simd_work_items)
- Optimisasi titik ambang
- Eksekusi beberapa perangkat
Mingguan
Contoh desain memberikan kode sumber untuk perangkat OpenCL (.cl) serta aplikasi host. Untuk mengkompirasi aplikasi host, paket Linux mencakup Makefile dan paket Windows mencakup proyek Microsoft Visual Studio 2010.
Unduhan berikut disediakan untuk contoh ini:
Penggunaan desain ini diatur oleh, dan tunduk pada, syarat dan ketentuan perjanjian lisensi desain referensi perangkat keras.
Persyaratan Perangkat Lunak dan Perangkat Keras
Contoh desain ini memerlukan alat berikut:
- perangkat lunak Intel FPGA v17.1 atau yang lebih baru
- Intel FPGA SDK untuk OpenCL™ v17.1 atau yang lebih baru
- Pada Linux: GNU Make dan gcc
- Pada Windows: Microsoft Visual Studio 2010
Untuk mengunduh alat desain Intel, kunjungi halaman unduhan OpenCL. Persyaratan untuk sistem operasi yang mendasar sama dengan yang ada di Intel FPGA SDK untuk OpenCL.
OpenCL dan logo OpenCL adalah merek dagang dari Apple Inc. yang digunakan oleh Khronos dengan izin.
* Produk berdasarkan Spesifikasi Khronos yang dipublikasikan, dan telah lulus Proses Pengujian Kesesuaian Khronos. Status kesuaian saat ini dapat ditemukan di www.khronos.org/conformance.