ID Artikel: 000058759 Jenis Konten: Pemecahan Masalah Terakhir Ditinjau: 06/09/2022

Konversi Model INT8 menjadi Representasi Menengah (IR)

BUILT IN - ARTICLE INTRO SECOND COMPONENT
Ringkasan

Alur Optimisasi Model dengan OpenVINO

Deskripsi

Dalam paragraf terakhir Panduan Optimasi Presisi Rendah, disebutkan pelatihan sadar kuantisasi. Dikatakan, hal ini memungkinkan pengguna untuk mendapatkan model optimal yang akurat yang dapat dikonversi ke IR. Namun, tidak ada detail lain yang disediakan.

Resolusi

Pelatihan Kuantisasi-Sadar, menggunakan OpenVINO™ kerangka kerja pelatihan yang kompatibel, mendukung model yang ditulis pada TensorFlow QAT atau PyTorch NNCF, dengan ekstensi optimisasi.

NNCF adalah kerangka kerja berbasis PyTorch yang mendukung beragam model Deep Learning untuk berbagai kasus penggunaan. Ini juga menerapkan pelatihan sadar kuantisasi yang mendukung mode dan pengaturan kuantisasi yang berbeda, serta mendukung berbagai algoritma kompresi, termasuk Kuantisasi, Binarisasi, Sparitas, dan Pemangkasan Filter.

Ketika penyempurnaan selesai, model optimal yang akurat dapat diekspor ke format ONNX, yang kemudian dapat digunakan oleh Pengoptimal Model untuk menghasilkan file Intermediate Representation (IR) dan kemudian diinferensikan dengan OpenVINO™ Inference Engine.

Produk Terkait

Artikel ini berlaku untuk 2 produk

Isi halaman ini adalah kombinasi terjemahan manusia dan komputer dari konten berbahasa Inggris. Konten ini diberikan hanya untuk kenyamanan Anda serta sebagai informasi umum dan tidak bisa dianggap sebagai lengkap atau akurat. Jika terdapat kontradiksi antara versi bahasa Inggris halaman ini dan terjemahannya, versi bahasa Inggris akan didahulukan. Lihat versi bahasa Inggris halaman ini.