Ekstraksi Rules Pada Decision Tree
Klasifikasi menggunakan decision tree merupakan metode yang populer digunakan untuk klasifikasi karena mudah dimengerti dan diterapkan serta dalam penghitungan akurasinya. Namun dalam perbandingannya IF-Then rules mungkin lebih mudah dimengerti jika terdapat decision tree yang rumit.
Untuk mendapatkan sebuah aturan (rules) pada decision tree dapat dibuat pada setiap path dari root sampai ke sebuah leaf node. Untuk setiap kriteria yang terpisah pada suatu path, maka diberi logika ‘AND’ atau conjunction pada formula rule antecedent atau pada bagian “IF”. Leaf node memiliki class prediction yang diformulasi untuk rule consequent atau pada bagian “THEN”.

data-training-test
Lalu diubah kedalam bentuk Decision Tree :

decision-tree-model
Sebagai contoh, decision tree pada data diatas dapat dikonversi ke bentuk IF-Then rules dengan cara menelusuri path dari root ke setiap leaf node. Maka hasil yang hasilkan akan menjadi seperti ini :
R1: (Give Birth = no) ∧ (Can Fly = yes) → Birds
R2: (Give Birth = no) ∧ (Live in Water = yes) → Fishes
R3: (Give Birth = yes) ∧ (Blood Type = warm) → Mammals
R4: (Give Birth = no) ∧ (Can Fly = no) → Reptiles
R5: (Live in Water = sometimes) → Amphibians
Terdapat mutually exclusive dan exhaustive. Mutually exclusive berarti tidak dapat memiliki konflik pada rule, karena tidak ada dua rule yang akan diacu oleh tuple yang sama, artinya setiap satu rule per leaf dan beberapa tuple hanya dapat mengacu pada satu leaf. Sedangkan exhaustive adalah suatu rule untuk setiap nilai atribut yang dapat dikombinasikan. Oleh karena itu, urutan dari rule tidak menjadi masalah. Rules yang telah diekstraksi dari decision tree mungkin akan menjadi rumit dan hasilnya akan menjadi banyak karena terdapat replikasi pada subtree serta attribut tests yang mungkin tidak relevan atau memiliki redudansi.

tuple-test-data
Setiap tuple mengacu hanya pada satu rule.
Hawk mengacu pada Rule R1 karena memiliki attribute give birth = “no‟ dan can fly = “yes‟, maka memiliki class = “bird”.
Grizzly bear mengacu pada Rule R3 karena memiliki attribute give birth = “yes‟ dan blood type = “warm‟, maka memiliki class = “mammals”.
Kualitas dari Aturan Klasifikasi (Classification Rule)
Kualitas dari classification rule dapat dievaluasi menggunakan coverage dan accuracy. Coverage merupakan persentase untuk cakupan tuple yang sesuai dengan rule. Accuracy merupakan persentase tuple yang dicover dan telah diklasifikasi dengan benar.

coverage-dan-accuracy
R : Rule.
ncovers : Jumlah tuple yang di-cover.
|D| : Jumlah seluruh tuple pada data.
ncorrect : Jumlah tuple yang di-klasifikasi.
Contoh : Evaluasi pada rule R1
R1 : (Give Birth = no) ∧ (Can Fly = yes) → Birds

coverage-dan-accuracy-tabel
Berdasarkan data di atas didapatkan :
ncovers = 3
|D| = 20
ncorrect = 3
Sehingga :
Coverage (R1) = 3 / 20 = 15%
Accuracy (R1) = 3 / 3 = 100%
Semoga artikel berjudul “Ekstraksi Rules Pada Decision Tree” bisa bermanfaat dan silahkan jika masih ada yang kurang jelas dapat ditanyakan di kolom komentar dibawah ini.
Silahkan Like Fanspage dan Share artikel ini jika menurut kamu bermanfaat untuk kamu dan orang lain.