Apa itu Analitik Data?

Data diciptakan lebih cepat dari sebelumnya-tetapi apakah Anda mendapatkan hasil maksimal dari data yang Anda kumpulkan?

Ikhtisar Analitik Data

  • Analitik data mengubah data mentah menjadi pengetahuan dan informasi yang dapat digunakan untuk membuat keputusan yang lebih baik.

  • Data bergerak melalui empat tahapan alur saat dianalisis: ingest (pengumpulan data), prepare (pemrosesan data), analysis (pemodelan data), dan action (pengambilan keputusan).

  • Analisis canggih menggunakan machine learning dan Artificial Intelligence (AI) adalah batas terbaru bagi organisasi dengan kemampuan analisis yang matang.

author-image

Oleh

Untuk semua jenis bisnis dan organisasi, mengubah data menjadi kecerdasan yang dapat ditindaklanjuti dapat diartikan sebagai perbedaan antara berjuang dan berkembang. Memaksimalkan nilai informasi memerlukan analitik data: proses di mana data mentah dianalisis untuk mencapai kesimpulan.

Meskipun hampir setiap organisasi menganalisis beberapa data, namun analitik modern memungkinkan tingkat pemahaman dan informasi yang belum pernah terjadi sebelumnya. Seberapa jauh perusahaan Anda telah menuju budaya berbasis data dan analitik—dan apa langkah selanjutnya?

Semuanya dimulai dengan alur data.

Memahami Alur Data

Menetapkan pendekatan analitik data yang dikembangkan dengan baik adalah proses evolusi yang membutuhkan waktu dan komitmen. Bagi organisasi yang ingin mengambil langkah selanjutnya, sangatlah penting untuk memahami alur data dan siklus hidup data yang melalui alur tersebut.

  • Ingest: Pengumpulan Data
    Tahap pertama dari alur data adalah peresapan. Selama tahap ini, data dikumpulkan dari berbagai sumber dan dipindahkan ke dalam sistem di mana data tersebut dapat disimpan. Data dapat dikumpulkan sebagai streaming yang berkelanjutan atau sebagai serangkaian peristiwa terpisah.
    Untuk sebagian besar data yang tidak terstruktur-IDC memperkirakan 80 hingga 90 persen1 -pertanyaan adalah awal dan akhir dari siklus hidup data. Informasi ini, yang disebut "data gelap," dicerna tetapi tidak pernah dianalisis atau digunakan untuk memengaruhi seluruh organisasi.
    Saat ini, salah satu tren analitik data canggih terbesar dimulai tepat pada tahap peresapan. Dalam kasus ini, analitik real-time dari data streaming terjadi bersamaan dengan proses peresapan. Hal ini dikenal sebagai analitik edge, dan memerlukan performa komputasi yang tinggi dengan konsumsi daya yang rendah. Analitik edge sering kali melibatkan perangkat IoT dan sensor yang mengumpulkan informasi dari perangkat, termasuk mesin pabrik, lampu jalan kota, peralatan pertanian, atau benda.benda lain yang terhubung.
  • Persiapan: Pemrosesan Data
    Tahap berikutnya dari alur data menyiapkan data untuk digunakan dan menyimpan informasi dalam sistem yang dapat diakses oleh pengguna dan aplikasi. Untuk memaksimalkan kualitas data, data harus dibersihkan dan ditransformasikan menjadi informasi yang dapat dengan mudah diakses dan ditanyakan.
    Biasanya, informasi disiapkan dan disimpan dalam database. Berbagai jenis database yang berbeda digunakan untuk memahami dan menganalisis data dalam format yang berbeda dan untuk tujuan yang berbeda. Sistem manajemen basis data relasional SQL*, seperti SAP HANA* atau Oracle DB*, biasanya menangani kumpulan data terstruktur. Hal ini dapat meliputi informasi keuangan, verifikasi kredensial, atau pelacakan urutan. Beban kerja data yang tidak terstruktur dan analitik real time lebih cenderung menggunakan basis data NoSQL* seperti Cassandra dan HBase.
    Mengoptimalkan tahap alur data ini memerlukan kinerja komputasi dan memori, serta manajemen data, untuk kueri yang lebih cepat. Hal ini juga memerlukan skalabilitas untuk mengakomodasi volume data yang tinggi. Data dapat disimpan dan dijenjang sesuai dengan urgensi dan kegunaannya, sehingga data yang paling penting dapat diakses dengan kecepatan tertinggi.
    Teknologi Intel® memberi daya pada beberapa kasus penggunaan database yang paling intensif penyimpanan dan memori saat ini. Dengan Drive Intel® Optane™ Solid State, Alibaba Cloud* mampu menyediakan kapasitas penyimpanan 100 TB untuk setiap instance POLARDB.
  • Analisis: Pemodelan Data
    Pada tahap berikutnya dari alur data, data yang tersimpan dianalisis, dan algoritme pemodelan dibuat. Data dapat dianalisis oleh platform analitik menyeluruh seperti SAP, Oracle, atau SAS—atau diproses dalam skala besar oleh alat seperti Apache Spark*.
    Mempercepat dan mengurangi biaya untuk fase alur data ini sangat penting untuk keunggulan kompetitif. Pustaka dan toolkit dapat memangkas waktu dan biaya pengembangan. Sementara itu, optimalisasi perangkat keras dan perangkat lunak dapat membantu menekan biaya server dan pusat data sekaligus meningkatkan waktu respons.
    Teknologi seperti analitik dalam memori dapat meningkatkan kemampuan analitik data dan membuat investasi analitik lebih hemat biaya. Dengan Intel, perusahaan kimia Evonik mencapai restart 17x lebih cepat untuk tabel data SAP HANA*.2
  • Tindakan: Pengambilan Keputusan
    Setelah data diserap, disiapkan, dan dianalisis, data siap untuk ditindaklanjuti. Visualisasi dan pelaporan data membantu mengomunikasikan hasil analitik.
    Secara tradisional, interpretasi oleh ilmuwan atau analis data telah diperlukan untuk mengubah hasil-hasil ini menjadi kecerdasan bisnis yang dapat ditindaklanjuti secara lebih luas. Namun demikian, bisnis telah mulai menggunakan AI untuk mengotomatisasi tindakan—seperti mengirim kru pemeliharaan atau mengubah suhu ruangan berdasarkan analitik.

Untuk sumber daya yang lebih mendalam tentang alur data dan bagaimana organisasi dapat mengembangkan kemampuan analitik mereka, baca e-book kami Dari Data ke Informasi: Memaksimalkan Alur Data Anda.

Seberapa jauh perusahaan Anda telah menuju budaya berbasis data dan analitik—dan apa langkah selanjutnya?

Empat Tipe Analitik Data

Analitik data dapat dibagi menjadi empat jenis dasar: analitik deskriptif, analitik diagnostik, analitik prediktif, dan analitik preskriptif. Ini adalah langkah-langkah menuju kematangan analitik, dengan setiap langkah memperpendek jarak antara fase "analisis" dan "tindakan" dari alur data.

  • Analitik Deskriptif
    Analitik deskriptif digunakan untuk meringkas dan memvisualisasikan data historis. Dengan kata lain, hal ini memberi tahu organisasi apa yang sudah terjadi.
    Jenis analisis yang paling sederhana, analisis deskriptif dapat menjadi dasar seperti bagan yang menganalisis angka penjualan tahun lalu. Setiap upaya analitik bergantung pada landasan yang kuat dari analitik deskriptif. Banyak bisnis yang masih mengandalkan terutama pada bentuk analitik ini, yang mencakup dasbor, visualisasi data, dan alat bantu pelaporan.
  • Analisis Diagnostik
    Seiring dengan semakin matangnya upaya analitik, organisasi mulai mengajukan pertanyaan yang lebih sulit dari data historis mereka. Analitik diagnostik tidak hanya memeriksa apa yang terjadi, tetapi juga mengapa hal itu terjadi. Untuk melakukan analitik diagnostik, analis harus mampu membuat kueri terperinci untuk mengidentifikasi tren dan sebab-akibat.
    Dengan menggunakan analitik diagnostik, hubungan baru di antara variabel dapat ditemukan: untuk perusahaan pakaian olahraga, meningkatnya angka penjualan di Midwest mungkin berkorelasi dengan cuaca yang cerah. Analitik diagnostik mencocokkan data dengan pola dan bekerja untuk menjelaskan data anomali atau terpisah.
  • Analisis Prediktif
    Meskipun demikian, dua jenis analitik pertama memeriksa data historis, baik pandangan analitik prediktif maupun analitik preskriptif ke masa depan. Analisis prediktif menciptakan perkiraan hasil yang mungkin terjadi berdasarkan tren yang teridentifikasi dan model statistik yang berasal dari data historis.
    Membangun strategi analitik prediktif memerlukan pembuatan model dan validasi untuk menciptakan simulasi yang dioptimalkan, sehingga pengambil keputusan bisnis dapat mencapai hasil terbaik. Machine learning biasanya digunakan untuk analisis prediktif, melatih model pada set data berskala tinggi untuk menghasilkan prediksi yang lebih cerdas.
  • Analisis Preskriptif
    Jenis analitik canggih lainnya adalah analitik preskriptif. Dengan analitik preskriptif, yang merekomendasikan solusi terbaik berdasarkan analitik prediktif, evolusi menuju pengambilan keputusan berbasis data yang sebenarnya sudah lengkap.
    Analitik preskriptif sangat bergantung pada analitik machine learning dan jaringan neural. Beban kerja ini berjalan pada komputasi dan memori berperforma tinggi. Jenis analitik ini memerlukan fondasi yang kuat berdasarkan tiga jenis analitik lainnya dan hanya dapat dieksekusi oleh perusahaan dengan strategi analitik yang sangat berkembang yang bersedia melakukan sumber daya yang signifikan untuk upaya tersebut.

Kasus Penggunaan Analitik Data

Teknologi Intel® mengubah cara organisasi perusahaan modern melakukan analitik. Dengan kasus penggunaan yang menjangkau banyak industries—dan ke seluruh dunia—Intel bekerja untuk secara terus menerus mendorong analisis ke depan sekaligus membantu bisnis mengoptimalkan performa dan efektivitas biaya.

  • Manufaktur
    Bagi produsen mobil, kendali mutu menghemat uang—dan menjaga keselamatan jiwa. Di pabrik otomatis Audi, para analis menggunakan pengambilan sampel untuk memastikan kualitas pengelasan. Dengan menggunakan analitik prediktif di edge, yang dibangun di atas Perangkat Lunak Informasi Edge Industri Intel, produsen dapat secara otomatis memeriksa setiap pengelasan, pada setiap mobil, dan memprediksi masalah pengelasan berdasarkan pembacaan sensor saat pengelasan dilakukan.
  • Layanan Kesehatan
    Melatih AI untuk membaca rontgen dada dapat membantu pasien dan penyedia layanan mendapatkan diagnosis lebih cepat. Dengan menggunakan prosesor Intel® Xeon® yang Dapat Diskalakan untuk memberi daya pada jaringan neural, organisasi penelitian SURF mengurangi waktu pelatihan dari satu bulan menjadi enam jam sekaligus meningkatkan akurasi.
  • Telekomunikasi
    Smartphone dan internet seluler telah menciptakan jumlah data seluler yang belum pernah terjadi sebelumnya. Untuk meningkatkan pengalaman konsumen, perusahaan telekomunikasi Bharati Airtel menggunakan analitik jaringan canggih menggunakan prosesor Intel® Xeon® dan Intel® SSD untuk mendeteksi dan memperbaiki masalah jaringan dengan lebih cepat.

Teknologi Intel® untuk Analisis

Dengan ekosistem teknologi dan mitra yang luas untuk membantu bisnis dalam menciptakan solusi masa depan, Intel mendukung analisis tingkat lanjut untuk perusahaan di seluruh dunia. Mulai dari pusat data untuk edge, Intel bekerja di setiap titik dalam ekosistem analisis untuk memberikan nilai dan performa maksimum.

  • Prosesor Intel® Xeon® yang Dapat Diskalakan memungkinkan untuk menganalisis data dalam jumlah besar dengan kecepatan tinggi, baik di edge, di pusat data, atau di cloud.
  • Teknologi Intel® Optane™ mewakili pendekatan revolusioner untuk memori dan penyimpanan yang membantu mengatasi hambatan dalam cara data dipindahkan dan disimpan.
  • Intel® FPGA menyediakan akselerasi dalam pusat data untuk meningkatkan waktu respons.
  • Solusi Pilihan Intel® diverifikasi untuk performa optimal, memberikan kepastian, dan mempercepat penerapan solusi.

Pertanyaan Umum

Analitik data adalah proses di mana informasi bergerak dari data mentah ke informasi yang dapat ditindaklanjuti oleh bisnis.

Analitik Big data menggunakan kumpulan data berskala tinggi untuk mengungkap adanya hubungan baru dan lebih memahami informasi dalam jumlah besar.

Analitik canggih bukanlah teknologi atau serangkaian teknologi tertentu. Ini adalah klasifikasi untuk kasus penggunaan dan solusi yang memanfaatkan teknologi canggih seperti mesin pembelajaran, analitik tambahan, dan jaringan neural.

Analitik data digunakan untuk menghasilkan kecerdasan bisnis yang dapat membantu organisasi memahami peristiwa masa lalu, memprediksi peristiwa di masa depan, dan merencanakan tindakan.

Empat tahap alur data adalah peresapan, persiapan, analisis, dan tindakan.

Analitik deskriptif dan diagnostik keduanya melihat ke masa lalu. Analitik deskriptif menjawab pertanyaan tentang apa yang terjadi, sementara analitik diagnostik mempelajari mengapa hal itu terjadi.

Analitik deskriptif melihat ke masa lalu untuk mengatakan apa yang telah terjadi dan merupakan dasar dari semua jenis analitik lainnya. Analitik preskriptif membuat rekomendasi untuk tindakan berdasarkan data yang ada dan algoritme prediktif.

Analitik prediktif dan preskriptif, keduanya menghasilkan informasi tentang masa depan. Analitik prediktif menghasilkan prakiraan tentang peristiwa yang diprediksi, dan analitik preskriptif merekomendasikan tindakan berdasarkan prediksi tersebut.

Analitik prediktif digunakan untuk mengantisipasi peristiwa di masa depan dengan lebih baik. Analitik prediktif dapat mengidentifikasi kebutuhan pemeliharaan sebelum mereka berkembang atau menilai dampak yang paling memungkinkan dari kondisi ekonomi terhadap prakiraan penjualan di masa mendatang.

Informasi Produk dan Performa

1 "What Your Data Isn't Telling You: Dark Data Presents Problems And Opportunities For Big Businesses," Forbes, Juni 2019, forbes.com/sites/marymeehan/2019/06/04/what-your-data-isnt-telling-you-dark-data-presents-problems-and-opportunities-for-big-businesses/#3086fe21484e.
2SAP HANA* simulasi beban kerja untuk edisi SAP BW untuk SAP HANA* Standard Application Benchmark Versi 2 per 30 Mei 2018. Perangkat lunak dan beban kerja yang digunakan dalam pengujian performa mungkin telah dioptimalkan performanya hanya pada mikroprosesor Intel®. Uji performa, seperti SYSmark* dan MobileMark, diukur menggunakan sistem komputer, komponen, perangkat lunak, operasi, dan fungsi yang spesifik. Perubahan apa pun terhadap salah satu faktor tersebut dapat menyebabkan hasil yang beragam. Sebaiknya pelajari pengujian performa dan informasi lain untuk membantu Anda mengevaluasi rencana pembelian secara keseluruhan, termasuk performa produk bila dikombinasikan dengan produk lain. Untuk informasi lebih lengkap, kunjungi www.intel.com/benchmarks. Hasil performa berdasarkan pengujian per tanggal yang diperlihatkan dalam konfigurasi dan mungkin tidak mencerminkan semua pembaruan keamanan yang tersedia untuk umum. Lihat cadangan untuk detail konfigurasi. Tidak ada produk atau komponen yang bisa sepenuhnya aman. Konfigurasi baseline dengan DRAM tradisional: Server Lenovo ThinkSystem SR950 dengan 8x prosesor Intel® Xeon® Platinum 8176M (28 core, 165W, 2,1 GHz). Total memori terdiri dari 48x 16 GB TruDDR4 2.666 MHz RDIMM dan 5x ThinkSystem 2,5 inci PM1633a 3,84 TB kapasitas SAS 12 GB hot-swap solid-state drive (SSD) untuk penyimpanan SAP HANA*. Sistem operasi yang digunakan adalah SUSE Linux Enterprise Server 12* SP3 dan menggunakan SAP HANA* 2.0 SPS 03 dengan data set 6 TB. Waktu mulai rata-rata bagi semua data yang diselesaikan setelah pramuat tabel untuk 10 iterasi: 50 menit. Konfigurasi baru dengan kombinasi DRAM dan memori persisten Intel® Optane™ DC: Intel Lightning Ridge SDP dengan 4x prosesor CXL QQ89 (24 core, 165W, 2,20 GHz). Total memori terdiri dari 24x 32 GB DDR4 2666 MHz dan 24x 128 GB AEP ES2, serta 1x Intel® SSD DC S3710 Series 800 GB, 3x Intel® SSD DC P4600 Series 2.0 TB, 3x Intel® SSD DC Series S4600 kapasitas 1.9 TB. BIOS versi WW33’18. Sistem operasinya adalah SUSE Linux*4 Enterprise Server 15 dan menggunakan SAP HANA* 2.0 SPS 03 (PTF Kernel khusus dari SUSE telah diaplikasikan) dengan data set 1,3 TB. Waktu mulai rata-rata untuk pramuat tabel yang dioptimalkan (peningkatan 17x).