Senin, 04 Januari 2021

 1.Peran Utama Data Mining

a)    Prediksi 

Prediksi memiliki kemiripan dengan klasifikasi, akan tetapi data diklasifikasikan berdasarkan perilaku atau nilai yang diperkirakan pada masa yang akan datang. Contoh dari tugas prediksi misalnya untuk memprediksikan adanya pengurangan jumlah pelanggan dalam waktu dekat dan prediksi harga saham dalam tiga bulan yang akan datang.

 

b)   Estimasi 

Estimasi hampir sama dengan prediksi, kecuali variabel target estimasi lebih ke arah numerik dari pada ke arah kategori. Model dibangun menggunakan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi. Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel prediksi.

 

c)    Klasifikasi 

Klasifikasi adalah proses menemukan sebuah model atau fungsi yang mendeskripsikan dan membedakan data ke dalam kelas-kelas. Klasifikasi melibatkan proses pemeriksaan karakteristik dari objek dan memasukkan objek ke dalam salah satu kelas yang sudah didefinisikan sebelumnya.

 

d)   Clustering 

Clustering adalah pengelompokan data tanpa berdasarkan kelas data tertentu ke dalam kelas objek yang sama. Sebuah kluster adalah kumpulan record yang memiliki kemiripan suatu dengan yang lainnya dan memiliki ketidakmiripan dengan record dalam kluster lain. Tujuannya adalah untuk menghasilkan pengelompokan objek yang mirip satu sama lain dalam kelompok-kelompok. Semakin besar kemiripan objek dalam suatu cluster dan semakin besar perbedaan tiap cluster maka kualitas analisis cluster semakin baik.

 

e)    Asosiasi 

Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam suatu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja (market basket analisys). Tugas asosiasi berusaha untuk mengungkap aturan untuk mengukur hubungan antara dua atau lebih atribut.

 

2. Perbedaan Estimasi dan Prediksi

Algoritma estimasi mirip dengan algoritma klasifikasi, tapi variabel target adalah berupa bilangan numerik (kontinyu) dan bukan kategorikal (nominal atau diskrit).Prediksi adalah penggunaan fungsi regresi sampel untuk memperkirakan nilai untuk variabel dependen yang dikondisikan pada beberapa nilai yang tidak teramati dari variabel independen. Estimasi adalah proses atau teknik penghitungan parameter atau jumlah populasi yang tidak diketahui.

3. Perbedaan Prediksi Dan Klasifikasi

Prediksi memiliki kemiripan dengan klasifikasi, akan tetapi data diklasifikasikan berdasarkan perilaku atau nilai yang diperkirakan pada masa yang akan datang. Klasifikasi adalah proses menemukan model (fungsi) yang menjelaskan dan membedakan kelas-kelas atau konsep, dengan tujuan agar model yang diperoleh dapat digunakan untuk memprediksikan kelas atau objek yang memiliki label kelas tidak diketahui. Model yang turunkan didasarkan pada analisis dari training data (yaitu objek data yang memiliki label kelas yang diketahui).

4. Perbedaan Klasifikasi Dan Klastering

Klasifikasi merupakan proses menemukan sebuah model atau fungsi yang mendeskripsikan dan membedakan data ke dalam kelas-kelas. Klasifikasi melibatkan proses pemeriksaan karakteristik dari objek dan memasukkan objek ke dalam salah satu kelas yang sudah didefinisikan sebelumnya.Clustering merupakan pengelompokan data tanpa berdasarkan kelas data tertentu ke dalam kelas objek yang sama. Sebuah kluster adalah kumpulan record yang memiliki kemiripan suatu dengan yang lainnya dan memiliki ketidakmiripan dengan record dalam kluster lain

5.Perbedaan Klastering dan Asosiasi

Pengelompokan (Clustering) : membuat kelompok kasus, dimana beberapa kasus dapat dikelompokkan bersama. Clustering dipakai ketika tidak diketahuinya bagaimana data harus dikelompokkan. Jumlah kelompok diasumsikan sendiri tanpa ditentukan terlebih dahulu.Penggabungan (Association) : dasar yang mencari keterkaitan antara satu item dengan item lainnya pada atribut yang sama, sehingga asosiasi dapat juga disebut keterkaitan. Item-item yang terkait satu sama lain dapat dipandang sebagai satu kesatuan unit.

6.Perbedaan Estimasi dan Klasifikasi

Estimasi digunakan untuk menerka sebuah nilai yang belum diketahui, variabel target estimasi lebih ke arah numerik dari pada ke arah kategori. Model dibangun menggunakan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi, Klasifikasi proses menemukan sebuah model atau fungsi yang mendeskripsikan dan membedakan data ke dalam kelas-kelas. Klasifikasi melibatkan proses pemeriksaan karakteristik dari objek dan memasukkan objek ke dalam salah satu kelas yang sudah didefinisikan sebelumnya.

 

 

7. Perbedaan Klastering dan Estimasi

Klastering merupakan satu-satunya fungsi data mining yang berisfat unsupervised learning, pengelompokan data dilakukan tanpa target atau label tertentu ke dalam kelas objek yang sama, sedangkan estimasi merupakan fungsi data mining yang bersifat supervised.

8. Perbedaan Supervised dan Unsupervised lerning

Supervised learning adalah sebuah pendekatan dimana sudah terdapat data yang dilatih, dan terdapat variable yang ditargetkan sehingga tujuan dari pendekatan ini adalah mengkelompokan suatu data ke data yang sudah ada, lain halnya dengan unsupervised learning, unsupervised learning tidak memiliki data latih, sehingga dari data yang ada, kita mengelompokan data tersebut menjadi 2 bagian atau 3 bagian dan seterusnya.

9. Tahapan Utama Data Mining 

Proses tahapan data mining tersebut memiliki tahap sebagai berikut (Tan, 2004):

a)    Pembersihan data (untuk membuang data yang tidak konsisten dan noise)

b)    Integrasi data (penggabungan data dari beberapa sumber)

c)    Transformasi data (data diubah menjadi bentuk yang sesuai untuk di-mining)

d)    Aplikasi teknik Data Mining, proses ekstraksi pola dari data yang ada

e)    Evaluasi pola yang ditemukan (proses interprestasi pola menjadi pengetahuan yang dapat digunakan untuk mendukung pengambilan keputusan)

f)     Presentasi pengetahuan (dengan teknik visualisasi)

Tahapan-tahapan tersebut, diantaranya :

a)    Pembersihan data

b)    Integrasi dataa

c)    Transformasi data

d)    Aplikasi teknik data mining.

e)    Evaluasi pola yang ditemukan

f)     Presentasi pola yang ditemukan untuk menghasilkan aksi


deskripsi ini merupakan tugas pribadi milik yang diambil dari berbagai sumber, pada mata kuliah Market Analysis Business Inteligence di Universitas Diponegoro, Program Pertukaran Mahasiswa Tanah Air Nusantara Sistem Alih Kredit dengan Teknologi Informasi 2020.

 

0 Coment:

Posting Komentar