Menganalisis Lebih Banyak Data untuk Beban Kerja Apache Spark

Fitur Instans Amazon Web Services Seri M5n Intel® Xeon® Prosesor yang Dapat Diskalakan

Tingkatkan Throughput untuk Pembelajaran Mesin dengan Instans Amazon EC2 Seri M5n Prosesor Intel Xeon yang Dapat Diskalakan Generasi ke-2

Seiring pertumbuhan Data Besar, organisasi harus menemukan cara untuk mengurutkan dan memanfaatkan pelajaran yang bersinar dari data tersebut agar tetap tangkas di marketplace. Menjalankan analisis data dalam offload cloud pada kerumitan administrasi prem, tetapi dapat menyulitkan untuk membedakan dampak yang dapat dimiliki oleh pilihan instans terhadap performa beban kerja analisis data yang kompleks. Untuk beban kerja Apache Spark di Amazon EC2, memilih instans M5n yang diaktifkan oleh prosesor Intel Xeon generasi ke-2 yang Dapat Diskalakan dapat memberikan lebih banyak throughput untuk mengurutkan data lebih banyak pada suatu waktu untuk memberi Anda wawasan lebih cepat.

Dalam pengujian dua implementasi pembelajaran mesin yang membandingkan instans Amazon EC2, instans seri M5n yang lebih baru diaktifkan oleh Intel Xeon Generasi ke-2.

Prosesor yang dapat diskalakan mengungguli instans seri M4 lama dengan prosesor Intel Xeon E5 v4, yang memberikan throughput data hingga 1,72x untuk beban kerja Apache Spark.

Baik beban kerja machine learning Anda memerlukan, ukuran instans kecil, sedang, atau besar, memilih instans seri M5n yang menampilkan prosesor Intel Xeon yang Dapat Diskalakan Generasi ke-2 melalui instans M4 yang lebih lama dapat menganalisis lebih banyak data dan memberikan wawasan yang dapat ditindak lanjuti dengan lebih cepat.

Meningkatkan Waktu untuk Wawasan tentang Contoh Kecil

Semua data yang dikumpulkan organisasi hanya bermanfaat jika mereka dapat memahaminya dengan cepat. Misalnya, prediksi preferensi pelanggan dan inferensi serupa harus bekerja secara real time untuk memiliki dampak bisnis—dan ini memerlukan teknologi terbaru yang dapat memberikan hasil lebih cepat.

Gambar 1. Perbandingan throughput relatif pada instans kecil (RAM 8 vCPU/32 GB) untuk klasifikasi Naïve Bayesian dan beban kerja pengelompokan k-means dari rangkaian benchmark HiBench.

Pengujian yang membandingkan instans kecil dengan delapan vCPU yang menunjukkan memilih instans M5n Amazon EC2 yang dilengkapi prosesor Intel® Xeon® yang Dapat Diskalakan Generasi ke-2 menawarkan hingga 1,57x throughput untuk beban kerja machine learning Apache Spark dari instans seri M4 dengan prosesor Intel Xeon E5 v4.

Meningkatkan Waktu untuk Wawasan tentang Instans Sedang

Seperti halnya instans kecil, pengujian yang membandingkan instans sedang dengan 16 vCPU menunjukkan bahwa instans M5n Amazon EC2 yang menampilkan prosesor Intel® Xeon® Generasi ke-2 yang Dapat Diskalakan meningkatkan implementasi machine learning pada Apache Spark—dalam hal ini, memberikan throughput hingga 1,42x throughput instans M4 yang lebih lama.

Gambar 2. Perbandingan throughput relatif pada instans sedang (RAM 16 vCPU/64 GB) untuk klasifikasi Naïve Bayesian dan beban kerja pengelompokan k-means dari rangkaian benchmark HiBench.

Meningkatkan Waktu untuk Wawasan tentang Instans Besar

Pengujian menunjukkan bahwa ukuran instans besar (dengan 64 vCPU) memiliki peningkatan performa pembelajaran mesin yang paling dramatis, menawarkan hingga 1,72x throughput instans seri M4 untuk beban kerja kluster k-means.

Gambar 3. Perbandingan throughput relatif pada instans besar (RAM 64 vCPU/256 GB) untuk klasifikasi Naïve Bayesian dan beban kerja kluster k-means dari rangkaian benchmark HiBench.

Ini berarti bahwa organisasi yang ingin mendapatkan wawasan yang dapat ditindaklanjuti dengan cepat dari data dapat memanfaatkan pilihan instans M5n Amazon EC2 yang ditingkatkan yang diaktifkan oleh prosesor Intel Xeon yang Dapat Diskalakan Generasi ke-2, apa pun ukuran instans yang diperlukan.

Pelajari lebih lanjut

Untuk memulai penerapan Apache Spark Anda pada instans Amazon EC2 seri M5n dengan prosesor Intel Xeon yang Dapat Diskalakan Generasi ke-2, kunjungi http://intel.com/AWS.

Untuk detail pengujian lebih lanjut, kunjungi http://facts.pt/3Kjn66x.

Pilih Bahasa

Menggunakan Pencarian di Intel.com

Tautan Cepat

Pencarian Terbaru

Pencarian Tingkat Lanjut

Hanya pencarian di