Referensi : Pengenalan konsep pembelajaran mesin dan deep learning (Jan Wira Gotama Putra)
1.Alat dan Bahan [kembali]
a. Matlab
Matlab merupakan platform programming dan komputasi numerik yang digunakan untuk analisa data, algoritma dan model
Pohon Keputusan
Decision tree adalah algoritma yang digunakan untuk menentukan/mencari suatu kelas dari instance baru dengan membangun pohon keputusan berdasarkan inductive learning. Dimana inductive learning akan menentukan suatu kelas berdasarkan atributnya.
ID3
ID3 Merupakan salah satu algoritma varian decision tree. Decision tree dibaungun atas asynsu bila atribut memberikan informasi yang cukup memadai maka kita mampu membangung decision tree. Sehingga perlu dicari hubungan antara kelas dengan atribut
Pada setiap Langkah pembuatan decision tree akan menggunakan information gain. Information gain digunakan untuk mengukur kemampuan suatu atribut memisahkan data training berdasarkan kelas
Untuk mencari information gain kita akan menggunakan entropy. Dimana
Sehingg untuk mencari information gain
- Outlook = Sunny
Ada dua instance dengan play = yes dan tiga instance dengan play = no
saat outlook — sunny, dengan demikian kita hitung Info-nya.
- Outlook = Overcast
Ada empat otance dengan play = yes dan tidak ada instance dengan
play = no saat outlook = overcast, dengan demikian kita hitung Infonya,
- Outlook = rainy
Ada tiga instance dengan play = yes dan dua instance dengan play = no
saat outlook = rainy, dengan demikian kita hitung Info-nya.
Maka dapat dihitung information gain padaatribut outlookDengan metoda yang sama maka akan didapatkan
1. IG Temperatur = 0.029
2. IG Humditiy = 0.152
3. IG Windy = 0.048
Dengan demikian maka didapatkan bahwa Outlook akan menjadi root
1. Mudah overfitting
2. Masalah menangani atribut kontinu
3. Information gain memiliki bias terhadap atribut yang memiliki banyak nilai (highly-branching attributes)
4. Data dengan missing value. Beberapa sel pada tabel dataset tidak terisi.
5. Data dengan unseen value. Misal nilai atribut yang tidak pernah dilihatpada training data, muncul saat testing.
5. Listing Program [kembali]
load fisheriris % load the sample data
ctree = fitctree(meas,species); % create classification tree
view(ctree) % text description
view(ctree,'mode','graph') % graphic description
Tidak ada komentar:
Posting Komentar