Kajian Data Mining untuk Klasifikasi Gender Menggunakan Data Wajah dengan Algoritma Naive Bayes dan K Nearest Neighbor (KNN)
DOI:
https://doi.org/10.25126/jtiik.20251218724Kata Kunci:
Data Mining, Klasifikasi, Gender, Wajah, Naive Bayes, KNN, Cross Validation, Confusion MatrixAbstrak
Identifikasi gender saat ini lebih sulit dilakukan. Penyebabnya antara lain banyaknya klasifikasi gender, penggunaan identitas palsu di media sosial dan semakin maraknya foto palsu. Peristiwa nyata yang terjadi adalah banyaknya klasifikasi di negara Thailand yang memiliki 18 gender. Peristiwa lainnya adalah penambahan gender “X” pada aplikasi permohonan passport di Amerika dan beredarnya foto palsu yang diedit dengan aplikasi FaceApp. Kejadian tersebut menyebabkan perlunya membuat model yang bisa melakukan klasifikasi gender agar gender asli dari seseorang bisa diketahui. Penelitian dilakukan dengan mencari model yang bisa mengklasifikasikan gender. Caranya adalah dengan membandingkan hasil akurasi dua algoritma yaitu Naïve Bayes dan KNN (K Nearest Neighbor). Metode yang digunakan mengikuti tahapan dalam KDD (Knowledge Discovery in Database). Atribut yang dipakai adalah bagian-bagian pada wajah yaitu lebar dahi, lebar hidung, panjang hidung, bibir dan jarak hidung ke bibir. Akurasi kedua algoritma diuji dengan metode Cross Validation dan Confusion Matrix. Tujuan penelitian ini adalah memastikan apakah atribut wajah dapat digunakan untuk klasifikasi gender serta menentukan model yang lebih baik antara Naïve Bayes atau KNN. Hasil pengujian menunjukkan, kedua algoritma memiliki akurasi yang sangat baik. Namun algoritma Naïve Bayes memiliki nillai AUC yang lebih tinggi yaitu 0,996 dibanding algoritma KNN yang memiliki nilai AUC sebesar 0,992. Berdasarkan nilai tersebut, atribut bagian-bagian pada wajah yaitu lebar dahi, lebar hidung, panjang hidung, bibir dan jarak hidung ke bibir dapat digunakan untuk klasifiikasi gender, karena bisa menghasilkan akurasi yang baik. Namun, model Naïve Bayes lebih direkomendasikan karena nilai akurasinya lebih tinggi dan stabil.
Downloads
Referensi
ADMINLP2M. 2023, February 16. Algoritma K-Nearest Neighbors (KNN) – Pengertian dan Penerapan. https://lp2m.uma.ac.id/2023/02/16/algoritma-k-nearest-neighbors-knn-pengertian-dan-penerapan/
(Diakes tanggal 23 November 2023)
AJIJAH, N., & KURNIAWAN, A. 2023. Klasifikasi Teks Mining Terhadap Analisa Isu Kegiatan Tenaga Lapangan Menggunakan Algoritma K-Nearest Neighbor (KNN). In Jurnal Sains Komputer & Informatika (J-SAKTI (Vol. 7, Issue 1). http://dx.doi.org/10.30645/j-sakti.v7i1.589
APRILIA, T. 2024. Klasifikasi Kanker Payudara Menggunakan Algoritma K-Nearest Neighbor dan Metode Naive Bayes. SATESI (Jurnal Sains Teknologi Dan Sistem Informasi), 4(2), 156–163. https://doi.org/10.54259/satesi.v4i2.3167
ARMANDHANI, R., CAHYA WIHANDIKA, R., & RAHMAN, M. A. 2019. Klasifikasi Gender berbasis Wajah menggunakan Metode Local Binary Pattern dan Random KNN (Vol. 3, Issue 8). http://j-ptiik.ub.ac.id
AZIZAH, N. 2021. Aliran Feminis dan Teori Kesetaraan Gender dalam Hukum. In SPECTRUM: Journal of Gender and Children Studies (Vol. 1, Issue 1). http://journal.iain-manado.ac.id/index.php/SPECTRUM https://doi.org/10.30984/spectrum.v1i1.163
BAHTIAR, R. 2023. Implementasi Data Mining Untuk Prediksi Penjualan Kusen Terlaris Menggunakan Metode K-Nearest Neighbor. In Jurnal Informatika MULTI (Vol. 1, Issue 3). https://jurnal.publikasitecno.id/index.php/jim203
BUULOLO, E. 2020. Data Mining untuk Perguruan Tinggi. Deepublish .
CARRINGTON, A. M., MANUEL, D. G., FIEGUTH, P. W., RAMSAY, T., OSMANI, V., WERNLY, B., BENNETT, C., HAWKEN, S., MAGWOOD, O., SHEIKH, Y., MCINNES, M., & HOLZINGER, A. 2023. Deep ROC Analysis and AUC as Balanced Average Accuracy, for Improved Classifier Selection, Audit and Explanation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 45(1), 329–341. https://doi.org/10.1109/TPAMI.2022.3145392
DANAR. 2019. Tragis! Aplikasi FaceApp Abal-Abal Tipu Ribuan Pengguna di Indonesia - Krjogja. https://www.krjogja.com/teknologi/1242545082/tragis-aplikasi-faceapp-abalabal-tipu-ribuan-pengguna-di-indonesia
(Diakes tanggal 21 September 2023)
DEVIAN, SABRINA, P. N., & KOMARUDIN, A. 2024. Prediksi Penyakit Diabetes Dengan Metode K-Nearest Neighbor (KNN) Dan Seleksi Fitur Information Gain. JATI (Jurnal Mahasiswa Teknik Informatika), 8(6), 11320–11326. https://doi.org/10.36040/jati.v8i6.11364
DEVITO, D., CAHYA WIHANDIKA, R., & WIDODO, A. W. 2019. Ekstraksi Ciri Untuk Klasifikasi Gender Berbasis Citra Wajah Menggunakan Metode Histogram of Oriented Gradients (Vol. 3, Issue 8). http://j-ptiik.ub.ac.id
DW. 2022. AS Perkenalkan Paspor “X” yang Netral Gender. https://www.dw.com/id/as-perkenalkan-paspor-x-yang-netral-gender/a-61325255
(Diakses tanggal 11 Oktober 2023)
FANSYURI, M., & YUNITA, D. 2024. Analisa Citra Wajah Untuk Identifikasi Klasifikasi Jenis Kelamin Menggunakan Algoritma Naive Bayes. LOGIC : Jurnal Ilmu Komputer Dan Pendidikan, 2(3), 594–606. https://journal.mediapublikasi.id/index.php/logic
FAUZIAH, S. 2023. 18 Gender di Thailand yang Belum Banyak Diketahui, Apa Saja? https://lifestyle.sindonews.com/read/1024453/166/18-gender-di-thailand-yang-belum-banyak-diketahui-apa-saja-1676534541
(Diakses tanggal 21 September 2023)
FEBRINAMAS, D. R., HIDAYATI, R., & NIRMALA, I. 2023. Klasifikasi Buah Pinang Berdasarkan Data Sensor Menggunakan Metode K-Nearest Neighbor Berbasis Web. Journal of Computer System and Informatics (JoSYC), 4(4). https://doi.org/10.47065/josyc.v4i4.3805
FITRI AYUNING TYAS, MAHDA NURAYUNI, & HIDAYATUR RAKHMAWATI. 2024. Optimasi Algoritma K-Nearest Neighbors Berdasarkan Perbandingan Analisis Outlier (Berbasis Jarak, Kepadatan, LOF). Jurnal Nasional Teknik Elektro Dan Teknologi Informasi, 13(2), 108–115. https://doi.org/10.22146/jnteti.v13i2.9579
GOENAWAN, N, R., CHANRICO, W., SUHARTONO, D., & PURNOMO, F. 2019. Gender demography classification on instagram based on user’s comments section. Procedia Computer Science, 157, 64–71. https://doi.org/10.1016/j.procs.2019.08.142
HUSSEIN, S., FAROUK, M., & HEMAYED, E. S. 2019. Gender identification of egyptian dialect in twitter. Egyptian Informatics Journal, 20(2), 109–116. https://doi.org/10.1016/j.eij.2018.12.002
ISSADEN, J. 2020. Gender Classification Dataset |Kaggle. https://www.kaggle.com/datasets/elakiricoder/gender-classification-dataset
(Diakses tanggal 30 Juni 2023)
KUCUKYILMAZ, T., DENIZ, A., & KIZILOZ, H. E. 2020. Boosting gender identification using author preference. Pattern Recognition Letters, 140, 245–251. https://doi.org/10.1016/j.patrec.2020.10.002
KURNIAWAN, C., & IRSYAD, H. 2022. Perbandingan Metode K-Nearest Neighbor Dan Naïve Bayes Untuk Klasifikasi Gender Berdasarkan Mata. Jurnal Algoritme, 2(2).
https://doi.org/10.35957/algoritme.v2i2.2358
MUHADI, A., & OCTAVIANO, A. 2023. Penerapan Data Mining Untuk Prediksi Hasil Keuntungan Lelang Mesin X-Ray Tahun 2020 Dengan Metode K-Nearest Neighbor (Studi Kasus : PT.Ramadika Mandiri). In Jurnal Informatika MULTI (Vol. 1, Issue 2). https://jurnal.publikasitecno.id/index.php/jim126
ONIKOYI, B., NNAMOKO, N., & KORKONTZELOS, I. 2023. Gender prediction with descriptive textual data using a Machine Learning approach. Natural Language Processing Journal, 4, 100018. https://doi.org/10.1016/j.nlp.2023.100018
PRAYOGO, A. A. T. 2022. Penerapan Model Klasifikasi Untuk Prediksi Gender Berdasrakan Wajah Dengan Menggunakan Metode Naïve Bayes. JURNAL INDUSTRI KREATIF DAN INFORMATIKA SERIES (JIKIS), 02(02).
PUTRI, V. A. P., PRASETIJO, A. B., & ERIDANI, D. 2022. Perbandingan Kinerja Algoritme Naïve Bayes Dan K-Nearest Neighbor (Knn) Untuk Prediksi Harga Rumah. Jurnal Ilmiah Teknik Elektro, 24(2), 162–171. https://ejournal.undip.ac.id/index.php/transmisi
https://doi.org/10.14710/transmisi.24.4.162-171
ROY, S., MITTAL, M., KIM, T. H., DHAYAL, K., BHATTACHARYYA, D., & PATEL, B. 2021. Demographical gender prediction of Twitter users using big data analytics: an application of decision marketing. International Journal of Reasoning-Based Intelligent Systems, 13(2), 41. https://doi.org/10.1504/ijris.2021.10036801
SUGIYONO. 2017. Statistika untuk Penelitian. Alfabeta.
TABASSUM, H., IQBAL, M. M., MAHMOOD, Z., PARVEEN, M., & ULLAH, I. 2023. Gender classification from anthropometric measurement by boosting decision tree: A novel machine learning approach. Journal of the National Medical Association, 115(3), 273–282. https://doi.org/10.1016/j.jnma.2022.12.005
UTAMI, M., & AYUMI, V. 2024. Prediksi Penjualan Produk Terlaris Menggunakan Algoritma K-Nearest Neighboard ( KNN ). JCOSIS (Journal Computer Science and Information Syetem), 43–47. https://doi.org/10.61567/jcosis.v1i2.214
WAHYU, M., SANTOSO, B., CAHYA WIHANDIKA, R., & RAHMAN, M. A. 2019. Ekstraksi Ciri untuk Klasifikasi Jenis Kelamin berbasis Citra Wajah menggunakan Metode Compass Local Binary Patterns (Vol. 3, Issue 11). http://j-ptiik.ub.ac.id
WANI, M. A., BOURS, P., AGRAWAL, N., & JABIN, S. 2019. Emotion-based Mining for Gender Prediction in Online Social Networks. ACM International Conference on Machine Learning and Data Science (ICMLDS)-2019, 56–60. https://doi.org/10.1145/1234567890
WIDAYATI, Y. T., PRIHATI, Y., & WIDJAJA, S. 2021. Pelanggan Mnc Play Kota Semarang. TRANSFORMTIKA, 18(2), 161–172. http://dx.doi.org/10.26623/transformatika.v18i2.2541
WINDANU, L. S., WIGUNA, A. S., & BUDIANTO, A. E. 2024. Optimasi Metode K-Nearest Neighbor Berbasis Particle Swarm Optimization Untuk Analisis Sentimen Pemilihan Presiden Indonesia Tahun 2024-2029. JATI (Jurnal Mahasiswa Teknik Informatika), 8(1), 35–42. https://doi.org/10.36040/jati.v8i1.6874
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2025 Jurnal Teknologi Informasi dan Ilmu Komputer

Artikel ini berlisensiCreative Commons Attribution-ShareAlike 4.0 International License.

Artikel ini berlisensi Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Penulis yang menerbitkan di jurnal ini menyetujui ketentuan berikut:
- Penulis menyimpan hak cipta dan memberikan jurnal hak penerbitan pertama naskah secara simultan dengan lisensi di bawah Creative Common Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) yang mengizinkan orang lain untuk berbagi pekerjaan dengan sebuah pernyataan kepenulisan pekerjaan dan penerbitan awal di jurnal ini.
- Penulis bisa memasukkan ke dalam penyusunan kontraktual tambahan terpisah untuk distribusi non ekslusif versi kaya terbitan jurnal (contoh: mempostingnya ke repositori institusional atau menerbitkannya dalam sebuah buku), dengan pengakuan penerbitan awalnya di jurnal ini.
- Penulis diizinkan dan didorong untuk mem-posting karya mereka online (contoh: di repositori institusional atau di website mereka) sebelum dan selama proses penyerahan, karena dapat mengarahkan ke pertukaran produktif, seperti halnya sitiran yang lebih awal dan lebih hebat dari karya yang diterbitkan. (Lihat Efek Akses Terbuka).