Ringkasan Penting
Netflix berupaya mentransformasi hiburan rumah dan memberikan pengalaman yang andal dan disesuaikan untuk 260 juta pelanggan di semua perangkat. Untuk mencapai hal itu, Netflix harus mengakselerasi pergerakan data dan beban kerja AI menggunakan teknologi canggih, termasuk instans Amazon EC2 yang didukung oleh prosesor Intel® Xeon®. Bekerja dengan Intel, Netflix:
- Instans Amazon yang dioptimalkan di tingkat mikroarsitektur untuk meningkatkan performa dan mengurangi pengeluaran cloud. Setelah meng-upgrade instans EC2-nya, Netflix mencapai peningkatan performa 3,5x per CPU, melebihi penskalaan linear yang diantisipasi.1
- Menggunakan Pustaka oneAPI Deep Neural Network (oneDNN) Intel® dan instruksi Intel® Advanced Vector Extensions (Intel® AVX-512) yang diatur untuk mengoptimalkan kecepatan encoding video selama permintaan pengguna lebih rendah. Solusi Intel menghadirkan peningkatan yang signifikan dalam encoding frame per detik.
Manfaatkan kecanggihan AI dan akselerasi aplikasi di seluruh perusahaan Anda. Temukan bagaimana AI yang didukung oleh Intel Xeon dapat bekerja untuk Anda.
Tantangan
Netflix berusaha menghadirkan konten sesuai permintaan dan bebas hambatan ke basis pelanggan globalnya terlepas dari perangkat yang mereka gunakan untuk menontonnya. Proses ini memerlukan beberapa layanan mikro yang dioptimalkan untuk beban kerja yang mendukung pengalaman pelanggan. Beberapa layanan mikro backend harus menangani tugas pengembangan konten, rendering, dan encoding. Di ujung yang menghadap pengguna, pelanggan Netflix memerlukan tampilan halaman beranda khusus yang mengidentifikasi dan merekomendasikan konten yang paling relevan dari ribuan judul. Selain itu, Netflix terus berusaha melayani anggotanya dengan hiburan terbaik dan kualitas streaming mengagumkan, yang tersedia kapan saja.
Grafik ini menggambarkan rincian CPU berdasarkan node. Meski analisis menemukan distribusi lalu lintas yang kurang lebih sama antara node, metrik CPU menunjukkan pola distribusi bimodal yang berbeda.1
Untuk melakukan semua tugas ini dan banyak lagi, Netflix memerlukan solusi cloud yang andal, sangat dapat diskalakan, dan siap AI dengan alat canggih untuk menyederhanakan pemecahan masalah jika masalah terjadi. Misalnya, tim Netflix menemukan tantangan lantensi yang tidak terduga saat mengevaluasi instans Amazon EC2-nya untuk performa. Mereka memerlukan cara yang efektif untuk melakukan instans hingga tingkat mikroarsitektur CPU untuk mengakselerasi beban kerja sekaligus meminimalkan pengeluaran cloud.
Solusi
Untuk memberikan pengalaman streaming yang cepat dan disesuaikan kepada pelanggan, Netflix memanfaatkan kecanggihan instans Amazon EC2 yang didukung oleh prosesor Intel® Xeon®. Tim performa Netflix bekerja sama dengan Intel untuk meneliti interaksi perangkat lunak dengan sumber daya perangkat keras yang tersedia dan mengidentifikasi bottleneck. Intel® VTuneTM Profiler menemukan segmen kode yang tidak menggunakan waktu prosesor secara optimal. Intel® PerfSpect memberikan wawasan tambahan dengan mengevaluasi subsistem mikroarsitektur dan urutan yang diprogram. Alat ini pada akhirnya membantu menentukan bottleneck instans dalam serangkaian instruksi dalam Virtual Machine Java.
Penurunan latensi signifikan yang dicapai setelah mengidentifikasi dan mengatasi masalah berbagi yang sebenarnya diilustrasikan secara dramatis dalam grafik ini.1
Dengan menggunakan instans Amazon dengan dasar prosesor Intel Xeon bukannya GPU, Netflix menemukan cara untuk menghemat uang dengan menggunakan setiap instans untuk menyelesaikan beberapa tugas. Selama jam puncak menonton, instans Amazon dapat memfokuskan sumber daya pada streaming. Ketika permintaan pengguna berkurang, instans dapat mengalihkan daya komputasi untuk mengakselerasi encoding video.
Hasil
Dengan dukungan Intel untuk mengidentifikasi bottleneck instans, Netflix mewujudkan peningkatan performa per CPU sebesar 3,5x dibandingkan dengan throughput awal pada instans Amazon EC2.1 Mereka juga diuntungkan dari pengurangan latensi rata-rata dan latensi ekor yang signifikan.2 Perusahaan lain yang memanfaatkan beban kerja Java juga dapat memperoleh manfaat dari pendekatan optimasi CPU Netflix karena Intel mengatasi sumber latensi dalam Kit Pengembangan Java terbuka.
“Untuk memastikan pelanggan kami memiliki pengalaman terbaik dengan layanan streaming kami, kecepatan sangat berarti. Menggunakan teknologi Intel untuk mengidentifikasi bottleneck, kami meningkatkan performa instans Amazon EC2 kami hampir tiga kali lipat sekaligus meminimalkan pengeluaran cloud.” – Vadim Filanovsky, Performance Engineer di Netflix
Dengan menggunakan oneDNN yang memanfaatkan rangkaian instruksi Intel AVX, Netflix mengklaim persentase peningkatan yang substansial dalam encoding frame per detik, menghadirkan kualitas video yang mengagumkan di semua perangkat.
Instans Amazon Netflix dengan prosesor Intel Xeon juga dapat melayani beberapa tujuan secara efektif menggunakan penskalaan otomatis. Efisiensi yang diperoleh melalui CPU memungkinkan Netflix untuk mengurangi jumlah instans yang diperlukan untuk beban kerja mission-critical dan secara signifikan memangkas pengeluaran infrastruktur cloud mereka secara keseluruhan.
Ringkasan Solusi
- Prosesor Intel® Xeon®
- Intel® oneAPI Deep Neural
- Pustaka Jaringan
- Intel® Deep Learning Boost
- dengan Vector Neural Network
- Instructions (VNNI)
- Intel® Advanced Vector
- Extensions 512 (Intel® AVX 512)
- Profiler Intel® VTune™
- Intel® PerfSpect
- Instans Amazon EC2