Tahapan- tahapan pada pemrosesan
data mining
- Selection, penyeleksian atau segmentasi data berdasarkan kriteria tertentu.
- Preprocessing, tahap pembersihan dimana info. tidakberguna dibuang. Selain itu data dikonfigurasi ulang untuk menjamin format tetap konsisten.
- Transformation, proses transformasi sehingga data dapat digunakan dan ditelusuri. Pemetaan data kompleks
- Data mining, proses ekstraksi pola dari data yang ada.
- Interpretation & evaluation, proses interpretasi pola menjadi pengetahuan yang dapat digunakan untuk mendukung pengambilan keputusan (contoh prediksi & klasifikasi, ringkasan konten database serta penjelasan fenomena yang diamati.
Metode proses data mining
Tugas
Data Mining
Metode Prediksi
Menggunakan
beberapa atribut untukk memprediksi nilai dariatribut yg akan datang.
Atribut
yg akan diprediksi disbt target atau dependent variable. Atribut yg digunakan
disebut explanatory atau independent variable.
Ada
2 tipe :
-
classification, digunakan untuk variabel target diskrit
- regression, digunakan untuk variabel target
kontinu
Metode Deskripsi
Menemukan
pola2 (yg menggambarkan data) yg dapat diinterpretasikan manusia
•
Clustering
•
Association Rule Discovery
• Sequential Pattern
Discovery
Arsitektur
data mining
Definisi pohon keputusan
Pohon
Keputusan ( Decision Tree )
•
Struktur hirarkis seperti pohon yg terdiri atas node & edge
–
Root node, node yg tidak mempunyai edge yang masuk & 0 atau banyak edge yang
keluar
–
Internal node, node yg mempunyai satu edge yang masuk & dua atau lebih edge
yang keluar
–
Leaf atau terminal node, node yg mempunyai satu edge yg masuk & tidak ada edge keluar
Leaf
atau terminal node dinyatakan sebagai label kelas.
Non-terminal
node terdiri atas atribut kondisi tes untuk membedakan record dengan
karakteristik berbeda.
Pengukuran kinerja klasifikasi
Tidak ada komentar:
Posting Komentar