Sabtu, 07 Januari 2012

Konsep Data Mining


Tahapan- tahapan pada pemrosesan data mining
  • Selection, penyeleksian atau segmentasi data berdasarkan kriteria tertentu.
  • Preprocessing, tahap pembersihan dimana info. tidakberguna dibuang. Selain itu data dikonfigurasi ulang untuk menjamin format tetap konsisten.
  • Transformation, proses transformasi sehingga data dapat digunakan dan ditelusuri. Pemetaan data kompleks
  • Data mining, proses ekstraksi pola dari data yang ada.
  • Interpretation & evaluation, proses interpretasi pola menjadi pengetahuan yang dapat digunakan untuk mendukung pengambilan keputusan (contoh prediksi & klasifikasi, ringkasan konten database serta penjelasan fenomena yang diamati.

Metode proses data mining

Tugas Data Mining

Metode Prediksi
Menggunakan beberapa atribut untukk memprediksi nilai dariatribut yg akan datang.
Atribut yg akan diprediksi disbt target atau dependent variable. Atribut yg digunakan disebut explanatory atau independent variable.
Ada 2 tipe :
- classification, digunakan untuk variabel target diskrit
-  regression, digunakan untuk variabel target kontinu
Metode Deskripsi
Menemukan pola2 (yg menggambarkan data) yg dapat diinterpretasikan manusia
• Clustering
• Association Rule Discovery
• Sequential Pattern Discovery




Arsitektur data mining




Definisi  pohon keputusan

Pohon Keputusan ( Decision Tree )

• Struktur hirarkis seperti pohon yg terdiri atas node & edge
– Root node, node yg tidak mempunyai edge yang masuk & 0 atau banyak edge yang keluar
– Internal node, node yg mempunyai satu edge yang masuk & dua atau lebih edge yang keluar
– Leaf atau terminal node, node yg mempunyai satu edge yg masuk &  tidak ada edge keluar
Leaf atau terminal node dinyatakan sebagai label kelas.
Non-terminal node terdiri atas atribut kondisi tes untuk membedakan record dengan karakteristik berbeda.



Pengukuran kinerja klasifikasi

 

Tidak ada komentar:

Posting Komentar