Alur Kerja Master Data Science
Stasiun kerja yang dirancang khusus ini menggabungkan rentang memori besar, berbagai slot ekspansi untuk menghubungkan beberapa perangkat, dan CPU pilihan tangan yang dirancang untuk memenuhi tuntutan unik dari ilmuwan data berbasis Python dan analis data seperti Anda.
Stasiun Kerja Ilmu Data: Termasuk Kekuatan Super
Sebagai ilmuwan data, Anda menghabiskan sebagian besar waktu Anda untuk mengguncang rangkaian data sedang dan besar dalam pustaka dan algoritma Python intensif CPU - hal ini membawa sebagian besar stasiun kerja ke lutut mereka.
Itu karena stasiun kerja Anda mungkin terlalu dibangun untuk pelatihan model namun belum dibangun untuk transformasi data yang intensif memori.
Hindari kesalahan memori saat mencoba memuat dan menjelajahi data - pengalaman umum ketika fungsi Pandas memerlukan memori lebih dari yang tersedia pada mesin atau instans cloud Anda.
Komputasi NumPy/SciPy Lebih Cepat Dibandingkan Generasi Sebelumnya
Aljabar linear adalah landasan dari numerik dan ilmu data. Alat komputasi numerik yang disediakan oleh NumPy dan SciPy memungkinkan ilmuwan data untuk bekerja melalui analisis dan fungsi numerik serta berbagai model pembelajaran mesin dan rumus matematika. iBench adalah benchmark yang menguji perintah stres dalam aljabar linear algoritma umum yang digunakan dalam NumPy dan SciPy seperti dot, det, inv, lu, qr, dan svd. Performa diukur dalam hitungan detik (semakin rendah semakin baik). Dibandingkan dengan Xeon-W3275 generasi ke-3, Xeon-W3495X generasi ke-4 melakukan 25% hingga 75% lebih cepat dalam pengujian iBench terbaru.1
Tingkatkan Ilmu Data
Kami merancang Intel-based stasiun kerja sains data untuk membuat AI dan alur kerja pembelajaran mesin intensif data menjadi cepat, lancar, dan responsif. Dengan memori hingga 8 TB dalam sistem soket ganda dan CPU yang cocok untuk beban kerja, stasiun kerja ini dapat menjalankan rangkaian data sedang hingga besar dalam memori dan mencukur waktu tugas yang paling memakan waktu dalam pengembangan AI.
Stasiun Kerja Ilmu Data Berbasis Intel yang Direkomendasikan
Intel-based stasiun kerja sains data ada dalam tiga platform - mobile, mainstream, dan expert - dengan beragam slot ekspansi CPU, memori, dan PCIe.
Platform Mobile Data Science untuk Rangkaian Data 32 GB-64 GB
Performa luar biasa untuk pengembangan AI mobile dan visualisasi data.
- Intel Core Seri HX dengan hingga 24 inti (8P+16E).
- 128 GB DDR5 DRAM untuk semua platform.
- SKU yang Disarankan:
- i9-13950HX (24 inti)
- i7-13850HX (20 inti)
Platform Umum Ilmu Data untuk Rangkaian Data 64 GB-512 GB
Performa per dolar yang luar biasa untuk praproscesing dan analisis pada rangkaian data berukuran sedang.
- Intel Xeon Prosesor W-2400 dengan hingga 24 core tak terkunci.
- Hingga 2 TB DDR5 RIDMM.
- SKU yang Disarankan:
- W7-2495X (24 inti)
- W5-2465X (16 inti)
Platform Ahli Ilmu Data untuk DDR5 hingga 8 TB untuk Platform Soket Ganda
Performa maksimum untuk memanipulasi rangkaian data besar, pembelajaran mesin, dan analisis data.
- Intel Xeon Prosesor W-3400 dengan hingga 56 Core.
- Hingga 4 TB DDR5 RIDMM untuk seri W-3400 dan hingga 8 TB DDR5 untuk soket ganda platform Xeon SP Generasi ke-4.
- SKU yang disarankan untuk platform soket tunggal:
- W9-3475X (36 inti)
- W7-3455 (24 inti)
- W5-3425X (16 inti)
- SKU yang disarankan untuk platform soket ganda:
- 6448Y (32 inti)
- 6442Y (24 inti)
- 6444Y (16 inti)
Pilih Stasiun Kerja Ilmu Data Berbasis Intel Anda
Intel-based stasiun kerja sains data dikirimkan dalam berbagai konfigurasi dan berbagai harga dari mitra dan produsen Intel.
Berjalan Lebih Cepat dengan Toolkit Analisis AI Intel® oneAPI
Kami telah mengoptimalkan alat paling populer dalam ekosistem Python untuk arsitektur Intel dan menggabungkannya dalam Toolkit Analisis AI Intel oneAPI untuk memudahkan pengalaman Anda dalam membangun lingkungan sains data Dan untuk meningkatkan performa alat ini. Optimisasi drop-in ini siap dijalankan sehingga Anda dapat bekerja lebih cepat dengan sedikit atau tanpa perubahan kode.
Pertanyaan yang Sering Diajukan
Ada dua faktor utama yang perlu dipertimbangkan saat memilih stasiun kerja sains data: alat dan teknik mana yang paling sering Anda gunakan serta ukuran kumpulan data Anda.
Dalam hal kerangka kerja ilmu data, jumlah inti yang lebih tinggi tidak selalu diterjemahkan ke dalam performa yang lebih baik. NumPy, SciPy, dan scikit-learn tidak menskalakan dengan baik melewati 18 core. Di sisi lain, HEAVY. AI (sebelumnya OmniSci) akan mengambil semua inti yang bisa didapatkan.
Semua stasiun kerja Intel-based sains data menggunakan prosesor Intel® Core™, Intel® Xeon® W, dan Intel® Xeon® yang Dapat Diskalakan yang unggul dalam beban kerja sains data dalam pengujian dunia nyata. Anda akan mendapatkan performa terbaik dalam rangkaian prosesor, yang menjadikan kapasitas memori sebagai pilihan terpenting Anda.
Kerangka kerja ilmu data jejak memori balon dua hingga tiga kali. Untuk mendapatkan kebutuhan memori dasar Anda, periksa rangkaian data pada umumnya dan perkalian tiga kali lipat. Jika Anda dapat bekerja dengan 512 GB atau kurang, Anda bisa mendapatkan performa luar biasa di mesin desktop. Jika kumpulan data Anda cenderung di atas 500 GB, Anda menginginkan tower dengan memori 1,5 TB atau lebih.
Akselerator GPU bersinar pada pelatihan model deep learning dan inferensi pembelajaran mendalam berskala besar. Namun, untuk sebagian besar pekerjaan sains data—persiapan data, analisis, dan pembelajaran mesin klasik—GPU tersebut duduk diam karena sebagian besar pustaka Python untuk sains data berjalan secara asli di CPU. Anda memerlukan adaptor grafis untuk mendorong layar Anda, tetapi bukan peralatan GPU.
Cloud tidak akan memberikan performa terbaik kecuali Anda berjalan di VM khusus atau server bare metal. Instans cloud menyajikan dirinya sebagai satu node, tetapi di bagian belakang, semuanya sangat terdistribusi. Beban kerja dan data Anda dibagi menjadi beberapa server di beberapa lokasi. Hal ini menciptakan latensi pemrosesan dan memori yang menurunkan runtime. Selain itu, bekerja dengan rangkaian data dan grafik yang besar melalui desktop jarak jauh bukanlah pengalaman yang ideal.
Menjaga beban kerja dan data tetap lokal, pada satu mesin, dapat memberikan performa yang jauh lebih baik dan pengalaman kerja yang lebih lancar dan responsif.
Anda bisa, tetapi Anda akan membakar sejumlah besar waktu menonton kocok data antara penyimpanan, memori, dan CPU. Jika Anda bekerja di lingkungan profesional, meningkatkan ke laptop sains data atau desktop midrange Intel® dapat menjadi penghemat waktu. Kami sengaja menguji dan menduga laptop sains data berbasis Intel® Core™ sehingga siswa, pemula, dan pembuat AI dapat memiliki opsi terjangkau untuk mengembangkan dan bereksperimen dengan alat AI sumber terbuka.
Anda dapat menjalankan perkakas sains data berbasis Python lebih cepat pada PC standar menggunakan pustaka dan distribusi yang dioptimalkan Intel. Semuanya merupakan bagian dari Kit Intel AI gratis.
Pemberitahuan dan Pelafalan
Sebagaimana diperkirakan melalui pengukuran yang dilakukan menggunakan platform validasi Intel yang membandingkan Intel Xeon w9-3495X dibandingkan Intel® Xeon® W-3275 pada NumPy/SciPy – Inv, N=25000
Lihat intel.com/performanceindex untuk detail konfigurasi. Hasil dapat berbeda.
Hasil performa berdasarkan pengujian per tanggal yang tercantum dalam konfigurasi dan mungkin tidak mencerminkan semua pembaruan yang tersedia untuk umum. Lihat cadangan untuk detail konfigurasi. Pelajari lebih lanjut di intel.com/PerformanceIndex.
Akselerasi Pandas, scikit-learn, dan TensorFlow yang dicapai menggunakan Intel® Distribution of Modin. Untuk detailnya, lihat intel.com/content/www/id/id/developer/articles/technical/code-changes-boost-pandas-scikit-learn-tensorflow.html#gs.mdyh9o.
© Intel Corporation. Intel, logo Intel, dan merek Intel lainnya adalah merek dagang dari Intel Corporation atau anak perusahaannya. Nama dan merek lain dapat diklaim sebagai hak milik pihak lain.
Informasi Produk dan Performa
Isi halaman ini adalah kombinasi terjemahan manusia dan komputer dari konten berbahasa Inggris. Konten ini diberikan hanya untuk kenyamanan Anda serta sebagai informasi umum dan tidak bisa dianggap sebagai lengkap atau akurat. Jika terdapat kontradiksi antara versi bahasa Inggris halaman ini dan terjemahannya, versi bahasa Inggris akan didahulukan. Lihat versi bahasa Inggris halaman ini.