Alur Kerja Master Data Science

Stasiun kerja yang dirancang khusus ini menggabungkan rentang memori besar, berbagai slot ekspansi untuk menghubungkan beberapa perangkat, dan CPU pilihan tangan yang dirancang untuk memenuhi tuntutan unik dari ilmuwan data berbasis Python dan analis data seperti Anda.

Pertanyaan yang Sering Diajukan

Ada dua faktor utama yang perlu dipertimbangkan saat memilih stasiun kerja sains data: alat dan teknik mana yang paling sering Anda gunakan serta ukuran kumpulan data Anda.

Dalam hal kerangka kerja ilmu data, jumlah inti yang lebih tinggi tidak selalu diterjemahkan ke dalam performa yang lebih baik. NumPy, SciPy, dan scikit-learn tidak menskalakan dengan baik melewati 18 core. Di sisi lain, HEAVY. AI (sebelumnya OmniSci) akan mengambil semua inti yang bisa didapatkan.

Semua stasiun kerja Intel-based sains data menggunakan prosesor Intel® Core™, Intel® Xeon® W, dan Intel® Xeon® yang Dapat Diskalakan yang unggul dalam beban kerja sains data dalam pengujian dunia nyata. Anda akan mendapatkan performa terbaik dalam rangkaian prosesor, yang menjadikan kapasitas memori sebagai pilihan terpenting Anda.

Kerangka kerja ilmu data jejak memori balon dua hingga tiga kali. Untuk mendapatkan kebutuhan memori dasar Anda, periksa rangkaian data pada umumnya dan perkalian tiga kali lipat. Jika Anda dapat bekerja dengan 512 GB atau kurang, Anda bisa mendapatkan performa luar biasa di mesin desktop. Jika kumpulan data Anda cenderung di atas 500 GB, Anda menginginkan tower dengan memori 1,5 TB atau lebih.

Akselerator GPU bersinar pada pelatihan model deep learning dan inferensi pembelajaran mendalam berskala besar. Namun, untuk sebagian besar pekerjaan sains data—persiapan data, analisis, dan pembelajaran mesin klasik—GPU tersebut duduk diam karena sebagian besar pustaka Python untuk sains data berjalan secara asli di CPU. Anda memerlukan adaptor grafis untuk mendorong layar Anda, tetapi bukan peralatan GPU.

Cloud tidak akan memberikan performa terbaik kecuali Anda berjalan di VM khusus atau server bare metal. Instans cloud menyajikan dirinya sebagai satu node, tetapi di bagian belakang, semuanya sangat terdistribusi. Beban kerja dan data Anda dibagi menjadi beberapa server di beberapa lokasi. Hal ini menciptakan latensi pemrosesan dan memori yang menurunkan runtime. Selain itu, bekerja dengan rangkaian data dan grafik yang besar melalui desktop jarak jauh bukanlah pengalaman yang ideal.

Menjaga beban kerja dan data tetap lokal, pada satu mesin, dapat memberikan performa yang jauh lebih baik dan pengalaman kerja yang lebih lancar dan responsif.

Anda bisa, tetapi Anda akan membakar sejumlah besar waktu menonton kocok data antara penyimpanan, memori, dan CPU. Jika Anda bekerja di lingkungan profesional, meningkatkan ke laptop sains data atau desktop midrange Intel® dapat menjadi penghemat waktu. Kami sengaja menguji dan menduga laptop sains data berbasis Intel® Core™ sehingga siswa, pemula, dan pembuat AI dapat memiliki opsi terjangkau untuk mengembangkan dan bereksperimen dengan alat AI sumber terbuka.

Anda dapat menjalankan perkakas sains data berbasis Python lebih cepat pada PC standar menggunakan pustaka dan distribusi yang dioptimalkan Intel. Semuanya merupakan bagian dari Kit Intel AI gratis.

Isi halaman ini adalah kombinasi terjemahan manusia dan komputer dari konten berbahasa Inggris. Konten ini diberikan hanya untuk kenyamanan Anda serta sebagai informasi umum dan tidak bisa dianggap sebagai lengkap atau akurat. Jika terdapat kontradiksi antara versi bahasa Inggris halaman ini dan terjemahannya, versi bahasa Inggris akan didahulukan. Lihat versi bahasa Inggris halaman ini.