Hell Yeah Pointer 6

Kamis, 11 November 2021

Decision Tree

Referensi : Pengenalan konsep pembelajaran mesin dan deep learning (Jan Wira Gotama Putra)







1.Alat dan Bahan [kembali]


a. Matlab 

Matlab merupakan platform programming dan komputasi numerik yang digunakan untuk analisa data, algoritma dan model 





Pohon Keputusan 
Decision tree adalah algoritma yang digunakan untuk menentukan/mencari suatu kelas dari instance baru dengan membangun pohon keputusan berdasarkan inductive learning. Dimana inductive learning akan menentukan suatu kelas berdasarkan atributnya.

ID3 
ID3 Merupakan salah satu algoritma varian decision tree. Decision tree dibaungun atas asynsu bila atribut memberikan informasi yang cukup memadai maka kita mampu membangung decision tree. Sehingga perlu dicari hubungan antara kelas dengan atribut






Pada setiap Langkah pembuatan decision tree akan menggunakan information gain. Information gain digunakan untuk mengukur kemampuan suatu atribut memisahkan data training berdasarkan kelas
Untuk mencari information gain kita akan menggunakan entropy. Dimana 
Sehingg untuk mencari information gain 
- Outlook = Sunny
Ada dua instance dengan play = yes dan tiga instance dengan play = no
saat outlook — sunny, dengan demikian kita hitung Info-nya.
- Outlook = Overcast
Ada empat otance dengan play = yes dan tidak ada instance dengan
play = no saat outlook = overcast, dengan demikian kita hitung Infonya,
- Outlook = rainy
Ada tiga instance dengan play =  yes dan dua instance dengan play =  no
saat outlook = rainy, dengan demikian kita hitung Info-nya.
Maka dapat dihitung information gain padaatribut outlook


Dengan metoda yang sama maka akan didapatkan

1. IG Temperatur = 0.029
2. IG Humditiy = 0.152
3. IG Windy = 0.048

Dengan demikian maka didapatkan bahwa Outlook akan menjadi root





1. Mudah overfitting
2. Masalah menangani atribut kontinu
3. Information gain memiliki bias terhadap atribut yang memiliki banyak nilai (highly-branching attributes)
4. Data dengan missing value. Beberapa sel pada tabel dataset tidak terisi.
5. Data dengan unseen value. Misal nilai atribut yang tidak pernah dilihatpada training data, muncul saat testing.

5. Listing Program [kembali]
load fisheriris % load the sample data
ctree = fitctree(meas,species); % create classification tree
view(ctree) % text description
view(ctree,'mode','graph') % graphic description
 





Tidak ada komentar:

Posting Komentar

Laporan Akhir Modul 4

[KEMBALI KE MENU SEBELUMNYA] DAFTAR ISI 1. Tujuan Perancangan 2. Hardware 3. Dasar Teori 4. Listing Program 5. Flowchart 6....