Accuracy Estimation – Accuracy Estimation Menggunakan Confusion Matrix merupakan salah satu metode Data Mining berupa Prediksi tipe Klasifikasi yang juga merupakan metode supervised learning, dimana terdapat label yang dapat dijadikan acuan dalam mengukur perfomansi sebuah model dan mewakili jumlah dari nilai yang diprediksi dan nilai aktual. Selain itu, Confusion Matrix merupakan bagian dari keluarga Machine Learning yang mempelajari data yang sudah tersedia dan mengklasifikasikan sebagai data baru serta menghasilkan output variabel bersifat kategorial (Nominal atau Ordinal).

Metode Penilaian untuk Klasifikasi antara lain:

Faktor PenilaianPenjelasan
KecepatanBiaya Komputasi yang terlibat dalam proses
menghasilkan dan menggunakan model,
dimana apabila lebih cepat maka dianggap
lebih baik.
KekokohanKemampuan Model untuk membuat atau
menghasilkan prediksi yang cukup akurat
SkalabilitasKemampuan untuk membangun model
prediksi secara efisien dengan jumlah data
yang cukup besar
InterpretabilitasTingkat pemahaman dan wawasan yang
diberikan oleh model

Di dalam Confusion Matrix, terdapat empat istilah yang digunakan sebagai representasi hasil proses klasifikasi , yaitu True Positive (TP), True Negative (TN), False Positive (FP) dan False Negative (FN).

Confusion Matrix sederhana untuk Tabulasi Hasil Klasifikasi Dua Kelas.

Accuracy Estimation

Dengan keterangan sebagai berikut:

RepresentasiPenjelasan
TP (True Positive)Jumlah Nilai True diklasifikasikan dengan
akurat
TN (True Negative)Jumlah Nilai False diklasifikasikan secara
akurat
FP (False Positive)Jumlah Nilai False diklasifikasikan sebagai
True
FN (False Negative)Jumlah Nilai True diklasifikasikan sebagai
False

Contoh:

Accuracy Estimation – Disini pada contoh kasus yang akan di pakai adalah sistem pengecekan penyakit kanker pada manusia. Dalam kasus ini terdapat 2 kemungkinan yang terjadi yaitu terdeteksi nya kanker dan juga tidak terdeteksi / sehat. Pertama yang kita harus lakukan adalah menklasifikasikan kelas positive dan negative. Dalam kasus ini maka pembagian akan seperti:

Positive: Kanker Terdeteksi.

Negative: Kanker tidak terdeteksi / Sehat.

True PositiveFalse Positive
Dalam kondisi true positive hal yang akanDalam kondisi false positive hal yang akan
terjadi adalahterjadi adalah
Sistem pendeteksi: Terdeteksi kankerSistem pendeteksi: Terdeteksi kanker
Kenyataan: Kanker memang hadir dalamKenyataan: Tidak ada kanker yang hadir
pasiendalam pasien
False NegativeTrue Negative
Dalam kondisi false negative yang akanDalam kondisi true negative yang akan
terjadi adalahterjadi adalah
Sistem pendeteksi: Tidak terdeteksi kankerSistem pendeteksi: Tidak terdeteksi kanker
Kenyataan: Kanker memang hadir dalamKenyataan: Tidak ada kanker yang hadir
pasiendalam pasien

Dari tabel penjelasan contoh kasus dapat disimpulkan bahwa True positive dan True negative akan memiliki dampak baik untuk pasien karena sistem akan memberikan informasi yang penting dan akurat. Namun sebaliknya dalam kondisi false positive akan terjadi kerugian yang lumayan terhadap pasien. Dan yang paling bahaya adalah false negative dimana ini memberikan dampak buruk terbesar pada pasien karena ada-nya kanker yang tidak terdeteksi.

Referensi:

Ramesh Sharda; Dursun Delen; Efraim Turban. (2021).Analytics, Data Science, & Artificial Intelligence Systems for Decision Support, Global Edition. 11 th Edition.Pearson (Intl). Harlow.