Kajian Data Mining untuk Klasifikasi Gender Menggunakan Data Wajah dengan Algoritma Naive Bayes dan K Nearest Neighbor (KNN)

Penulis

  • Adittia Fathah Sekolah Tinggi Manajemen Informatika dan Komputer (STMIK) LIKMI Bandung, Bandung
  • Christina Juliane Sekolah Tinggi Manajemen Informatika dan Komputer (STMIK) LIKMI Bandung, Bandung

DOI:

https://doi.org/10.25126/jtiik.20251218724

Kata Kunci:

Data Mining, Klasifikasi, Gender, Wajah, Naive Bayes, KNN, Cross Validation, Confusion Matrix

Abstrak

Identifikasi gender saat ini lebih sulit dilakukan. Penyebabnya antara lain banyaknya klasifikasi gender, penggunaan identitas palsu di media sosial dan semakin maraknya foto palsu. Peristiwa nyata yang terjadi adalah banyaknya klasifikasi di negara Thailand yang memiliki 18 gender. Peristiwa lainnya adalah penambahan gender “X” pada aplikasi permohonan passport di Amerika dan beredarnya foto palsu yang diedit dengan aplikasi FaceApp. Kejadian tersebut menyebabkan perlunya membuat model yang bisa melakukan klasifikasi gender agar gender asli dari seseorang bisa diketahui. Penelitian dilakukan dengan mencari model yang bisa mengklasifikasikan gender. Caranya adalah dengan membandingkan hasil akurasi dua algoritma yaitu Naïve Bayes dan KNN (K Nearest Neighbor). Metode yang digunakan mengikuti tahapan dalam KDD (Knowledge Discovery in Database). Atribut yang dipakai adalah bagian-bagian pada wajah yaitu lebar dahi, lebar hidung, panjang hidung, bibir dan jarak hidung ke bibir. Akurasi kedua algoritma diuji dengan metode Cross Validation dan Confusion Matrix. Tujuan penelitian ini adalah memastikan apakah atribut wajah dapat digunakan untuk klasifikasi gender serta menentukan model yang lebih baik antara Naïve Bayes atau KNN. Hasil pengujian menunjukkan, kedua algoritma memiliki akurasi yang sangat baik. Namun algoritma Naïve Bayes memiliki nillai AUC yang lebih tinggi yaitu 0,996 dibanding algoritma KNN yang memiliki nilai AUC sebesar 0,992. Berdasarkan nilai tersebut, atribut bagian-bagian pada wajah yaitu lebar dahi, lebar hidung, panjang hidung, bibir dan jarak hidung ke bibir dapat digunakan untuk klasifiikasi gender, karena bisa menghasilkan akurasi yang baik. Namun, model Naïve Bayes lebih direkomendasikan karena nilai akurasinya lebih tinggi dan stabil. 

Downloads

Download data is not yet available.

Referensi

ADMINLP2M. 2023, February 16. Algoritma K-Nearest Neighbors (KNN) – Pengertian dan Penerapan. https://lp2m.uma.ac.id/2023/02/16/algoritma-k-nearest-neighbors-knn-pengertian-dan-penerapan/

(Diakes tanggal 23 November 2023)

AJIJAH, N., & KURNIAWAN, A. 2023. Klasifikasi Teks Mining Terhadap Analisa Isu Kegiatan Tenaga Lapangan Menggunakan Algoritma K-Nearest Neighbor (KNN). In Jurnal Sains Komputer & Informatika (J-SAKTI (Vol. 7, Issue 1). http://dx.doi.org/10.30645/j-sakti.v7i1.589

APRILIA, T. 2024. Klasifikasi Kanker Payudara Menggunakan Algoritma K-Nearest Neighbor dan Metode Naive Bayes. SATESI (Jurnal Sains Teknologi Dan Sistem Informasi), 4(2), 156–163. https://doi.org/10.54259/satesi.v4i2.3167

ARMANDHANI, R., CAHYA WIHANDIKA, R., & RAHMAN, M. A. 2019. Klasifikasi Gender berbasis Wajah menggunakan Metode Local Binary Pattern dan Random KNN (Vol. 3, Issue 8). http://j-ptiik.ub.ac.id

AZIZAH, N. 2021. Aliran Feminis dan Teori Kesetaraan Gender dalam Hukum. In SPECTRUM: Journal of Gender and Children Studies (Vol. 1, Issue 1). http://journal.iain-manado.ac.id/index.php/SPECTRUM https://doi.org/10.30984/spectrum.v1i1.163

BAHTIAR, R. 2023. Implementasi Data Mining Untuk Prediksi Penjualan Kusen Terlaris Menggunakan Metode K-Nearest Neighbor. In Jurnal Informatika MULTI (Vol. 1, Issue 3). https://jurnal.publikasitecno.id/index.php/jim203

BUULOLO, E. 2020. Data Mining untuk Perguruan Tinggi. Deepublish .

CARRINGTON, A. M., MANUEL, D. G., FIEGUTH, P. W., RAMSAY, T., OSMANI, V., WERNLY, B., BENNETT, C., HAWKEN, S., MAGWOOD, O., SHEIKH, Y., MCINNES, M., & HOLZINGER, A. 2023. Deep ROC Analysis and AUC as Balanced Average Accuracy, for Improved Classifier Selection, Audit and Explanation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 45(1), 329–341. https://doi.org/10.1109/TPAMI.2022.3145392

DANAR. 2019. Tragis! Aplikasi FaceApp Abal-Abal Tipu Ribuan Pengguna di Indonesia - Krjogja. https://www.krjogja.com/teknologi/1242545082/tragis-aplikasi-faceapp-abalabal-tipu-ribuan-pengguna-di-indonesia

(Diakes tanggal 21 September 2023)

DEVIAN, SABRINA, P. N., & KOMARUDIN, A. 2024. Prediksi Penyakit Diabetes Dengan Metode K-Nearest Neighbor (KNN) Dan Seleksi Fitur Information Gain. JATI (Jurnal Mahasiswa Teknik Informatika), 8(6), 11320–11326. https://doi.org/10.36040/jati.v8i6.11364

DEVITO, D., CAHYA WIHANDIKA, R., & WIDODO, A. W. 2019. Ekstraksi Ciri Untuk Klasifikasi Gender Berbasis Citra Wajah Menggunakan Metode Histogram of Oriented Gradients (Vol. 3, Issue 8). http://j-ptiik.ub.ac.id

DW. 2022. AS Perkenalkan Paspor “X” yang Netral Gender. https://www.dw.com/id/as-perkenalkan-paspor-x-yang-netral-gender/a-61325255

(Diakses tanggal 11 Oktober 2023)

FANSYURI, M., & YUNITA, D. 2024. Analisa Citra Wajah Untuk Identifikasi Klasifikasi Jenis Kelamin Menggunakan Algoritma Naive Bayes. LOGIC : Jurnal Ilmu Komputer Dan Pendidikan, 2(3), 594–606. https://journal.mediapublikasi.id/index.php/logic

FAUZIAH, S. 2023. 18 Gender di Thailand yang Belum Banyak Diketahui, Apa Saja? https://lifestyle.sindonews.com/read/1024453/166/18-gender-di-thailand-yang-belum-banyak-diketahui-apa-saja-1676534541

(Diakses tanggal 21 September 2023)

FEBRINAMAS, D. R., HIDAYATI, R., & NIRMALA, I. 2023. Klasifikasi Buah Pinang Berdasarkan Data Sensor Menggunakan Metode K-Nearest Neighbor Berbasis Web. Journal of Computer System and Informatics (JoSYC), 4(4). https://doi.org/10.47065/josyc.v4i4.3805

FITRI AYUNING TYAS, MAHDA NURAYUNI, & HIDAYATUR RAKHMAWATI. 2024. Optimasi Algoritma K-Nearest Neighbors Berdasarkan Perbandingan Analisis Outlier (Berbasis Jarak, Kepadatan, LOF). Jurnal Nasional Teknik Elektro Dan Teknologi Informasi, 13(2), 108–115. https://doi.org/10.22146/jnteti.v13i2.9579

GOENAWAN, N, R., CHANRICO, W., SUHARTONO, D., & PURNOMO, F. 2019. Gender demography classification on instagram based on user’s comments section. Procedia Computer Science, 157, 64–71. https://doi.org/10.1016/j.procs.2019.08.142

HUSSEIN, S., FAROUK, M., & HEMAYED, E. S. 2019. Gender identification of egyptian dialect in twitter. Egyptian Informatics Journal, 20(2), 109–116. https://doi.org/10.1016/j.eij.2018.12.002

ISSADEN, J. 2020. Gender Classification Dataset |Kaggle. https://www.kaggle.com/datasets/elakiricoder/gender-classification-dataset

(Diakses tanggal 30 Juni 2023)

KUCUKYILMAZ, T., DENIZ, A., & KIZILOZ, H. E. 2020. Boosting gender identification using author preference. Pattern Recognition Letters, 140, 245–251. https://doi.org/10.1016/j.patrec.2020.10.002

KURNIAWAN, C., & IRSYAD, H. 2022. Perbandingan Metode K-Nearest Neighbor Dan Naïve Bayes Untuk Klasifikasi Gender Berdasarkan Mata. Jurnal Algoritme, 2(2).

https://doi.org/10.35957/algoritme.v2i2.2358

MUHADI, A., & OCTAVIANO, A. 2023. Penerapan Data Mining Untuk Prediksi Hasil Keuntungan Lelang Mesin X-Ray Tahun 2020 Dengan Metode K-Nearest Neighbor (Studi Kasus : PT.Ramadika Mandiri). In Jurnal Informatika MULTI (Vol. 1, Issue 2). https://jurnal.publikasitecno.id/index.php/jim126

ONIKOYI, B., NNAMOKO, N., & KORKONTZELOS, I. 2023. Gender prediction with descriptive textual data using a Machine Learning approach. Natural Language Processing Journal, 4, 100018. https://doi.org/10.1016/j.nlp.2023.100018

PRAYOGO, A. A. T. 2022. Penerapan Model Klasifikasi Untuk Prediksi Gender Berdasrakan Wajah Dengan Menggunakan Metode Naïve Bayes. JURNAL INDUSTRI KREATIF DAN INFORMATIKA SERIES (JIKIS), 02(02).

PUTRI, V. A. P., PRASETIJO, A. B., & ERIDANI, D. 2022. Perbandingan Kinerja Algoritme Naïve Bayes Dan K-Nearest Neighbor (Knn) Untuk Prediksi Harga Rumah. Jurnal Ilmiah Teknik Elektro, 24(2), 162–171. https://ejournal.undip.ac.id/index.php/transmisi

https://doi.org/10.14710/transmisi.24.4.162-171

ROY, S., MITTAL, M., KIM, T. H., DHAYAL, K., BHATTACHARYYA, D., & PATEL, B. 2021. Demographical gender prediction of Twitter users using big data analytics: an application of decision marketing. International Journal of Reasoning-Based Intelligent Systems, 13(2), 41. https://doi.org/10.1504/ijris.2021.10036801

SUGIYONO. 2017. Statistika untuk Penelitian. Alfabeta.

TABASSUM, H., IQBAL, M. M., MAHMOOD, Z., PARVEEN, M., & ULLAH, I. 2023. Gender classification from anthropometric measurement by boosting decision tree: A novel machine learning approach. Journal of the National Medical Association, 115(3), 273–282. https://doi.org/10.1016/j.jnma.2022.12.005

UTAMI, M., & AYUMI, V. 2024. Prediksi Penjualan Produk Terlaris Menggunakan Algoritma K-Nearest Neighboard ( KNN ). JCOSIS (Journal Computer Science and Information Syetem), 43–47. https://doi.org/10.61567/jcosis.v1i2.214

WAHYU, M., SANTOSO, B., CAHYA WIHANDIKA, R., & RAHMAN, M. A. 2019. Ekstraksi Ciri untuk Klasifikasi Jenis Kelamin berbasis Citra Wajah menggunakan Metode Compass Local Binary Patterns (Vol. 3, Issue 11). http://j-ptiik.ub.ac.id

WANI, M. A., BOURS, P., AGRAWAL, N., & JABIN, S. 2019. Emotion-based Mining for Gender Prediction in Online Social Networks. ACM International Conference on Machine Learning and Data Science (ICMLDS)-2019, 56–60. https://doi.org/10.1145/1234567890

WIDAYATI, Y. T., PRIHATI, Y., & WIDJAJA, S. 2021. Pelanggan Mnc Play Kota Semarang. TRANSFORMTIKA, 18(2), 161–172. http://dx.doi.org/10.26623/transformatika.v18i2.2541

WINDANU, L. S., WIGUNA, A. S., & BUDIANTO, A. E. 2024. Optimasi Metode K-Nearest Neighbor Berbasis Particle Swarm Optimization Untuk Analisis Sentimen Pemilihan Presiden Indonesia Tahun 2024-2029. JATI (Jurnal Mahasiswa Teknik Informatika), 8(1), 35–42. https://doi.org/10.36040/jati.v8i1.6874

Diterbitkan

27-02-2025

Terbitan

Bagian

Ilmu Komputer

Cara Mengutip

Kajian Data Mining untuk Klasifikasi Gender Menggunakan Data Wajah dengan Algoritma Naive Bayes dan K Nearest Neighbor (KNN). (2025). Jurnal Teknologi Informasi Dan Ilmu Komputer, 12(1), 99-110. https://doi.org/10.25126/jtiik.20251218724