Perbedaan Antara Data mining dan Data Warehousing

Anonim

Data mining vs Data Warehousing

Data Mining dan Data Warehousing keduanya sangat kuat dan teknik populer untuk menganalisis data. Pengguna yang cenderung ke arah statistik menggunakan Data Mining. Mereka menggunakan model statistik untuk mencari pola tersembunyi dalam data. Penambang data tertarik untuk menemukan hubungan yang berguna antara elemen data yang berbeda, yang pada akhirnya menguntungkan bagi bisnis. Namun di sisi lain, data ahli yang bisa menganalisa dimensi bisnis secara langsung cenderung menggunakan data warehouse.

Data mining juga dikenal sebagai Knowledge Discovery in data (KDD). Seperti disebutkan di atas, ini adalah bidang ilmu komputer, yang membahas ekstraksi informasi yang sebelumnya tidak diketahui dan menarik dari data mentah. Karena pertumbuhan data yang eksponensial, terutama di bidang bisnis, data mining menjadi alat yang sangat penting untuk mengubah kekayaan data yang besar ini menjadi intelijen bisnis, karena ekstraksi pola secara manual tampaknya tidak mungkin dilakukan dalam beberapa dekade terakhir. Misalnya, saat ini sudah digunakan untuk berbagai aplikasi seperti analisis jejaring sosial, deteksi kecurangan dan pemasaran. Data mining biasanya berkaitan dengan empat tugas berikut: clustering, klasifikasi, regression, dan association. Clustering mengidentifikasi kelompok serupa dari data tidak terstruktur. Klasifikasi adalah aturan pembelajaran yang dapat diterapkan pada data baru dan biasanya mencakup langkah-langkah berikut: preprocessing data, perancangan pemodelan, seleksi pembelajaran / fitur dan evaluasi / validasi. Regresi adalah menemukan fungsi dengan kesalahan minimal pada data model. Dan asosiasi mencari hubungan antar variabel. Data mining biasanya digunakan untuk menjawab pertanyaan seperti produk utama apa yang bisa membantu mendapatkan keuntungan yang tinggi tahun depan di Wal-Mart?

Seperti disebutkan di atas, pergudangan data juga digunakan untuk menganalisis data, namun oleh kumpulan pengguna yang berbeda dan tujuan yang sedikit berbeda dalam pikiran. Misalnya, ketika menyangkut sektor ritel, pengguna pergudangan Data lebih memperhatikan jenis pembelian yang populer di kalangan pelanggan, sehingga hasil analisis dapat membantu pelanggan dengan meningkatkan pengalaman pelanggan. Tapi Penambang data pertama-tama mengemukakan hipotesis seperti pelanggan membeli jenis produk tertentu dan menganalisis data untuk menguji hipotesis. Pergudangan data dapat dilakukan oleh pengecer besar yang pada awalnya menyimpan tokonya dengan ukuran produk yang sama untuk kemudian mengetahui bahwa toko New York menjual inventori ukuran lebih kecil daripada di toko Chicago. Jadi, dengan melihat hasil ini, pengecer bisa menyimpan persediaan New York dengan ukuran lebih kecil dibandingkan dengan toko di Chicago.

Jadi, seperti yang dapat Anda lihat dengan jelas, kedua jenis analisis ini tampaknya sama dengan mata telanjang. Keduanya memprihatinkan untuk meningkatkan keuntungan berdasarkan data historis. Tapi tentu saja, ada perbedaan utama. Secara sederhana, Data Mining dan Data Warehousing didedikasikan untuk melengkapi berbagai jenis analisis, namun pasti untuk berbagai jenis pengguna. Dengan kata lain, Data Mining mencari korelasi, patters untuk mendukung hipotesis statistik. Tapi, Data Warehousing menjawab pertanyaan yang relatif lebih luas dan mengiris data dari sana dan seterusnya untuk mengenali cara perbaikan di masa depan.