PENENTUAN JUMLAH KLASTER TERBAIK PADA K-MEANS DALAM MELIHAT POLA KLASTERING DATA MAHASISWA YANG TELAH LULUS

Penulis

  • Aisya Basri Program Studi Teknik Informatika, Fakultas Teknik, Universitas Khairun Jl. Jati Metro, Kota Ternate Selatan
  • Abdul Mubarak Program Studi Teknik Informatika, Fakultas Teknik, Universitas Khairun Jl. Jati Metro, Kota Ternate Selatan
  • Hairil Kurniadi Sirajuddin Program Studi Teknik Informatika, Fakultas Teknik, Universitas Khairun Jl. Jati Metro, Kota Ternate Selatan
  • Saiful Do. Abdullah Program Studi Teknik Informatika, Fakultas Teknik, Universitas Khairun Jl. Jati Metro, Kota Ternate Selatan

Kata Kunci:

klastering, k-means, elbpw, sse, waktu kelulusan

Abstrak

Keberhasilan K-Means dalam menganalisa data dapat terlihat dari pengelompokan yang terbentuk berdasarkan pada jumlah klaster yang ditentukan. Algoritma yang digunakan K-Means dalam menentukan banyak nya jumlah klaster dilakukan secara acak, hal ini dapat menyebabkan hasil klaster yang terbentuk tidak optimal. Untuk menentukan jumlah klaster yang optimal maka dilakukan penelitian dengan menggunakan metode Elbow. Elbow merupakan salah satu metode yang dapat digunakan dalam menentukan jumlah klaster terbaik dengan representasi grafik hasil dari perhitungan Sum of Square Error (SSE). Adapun penelitian yang dilakukan menggunakan dataset dengan parameter nilai IPK dan jumlah SKS dalam melakukan klastering waktu kelulusan dengan jangkauan jumlah klaster sebanyak 9 klaster. Pengelompokan data dengan jangkauan jumlah 9 klaster menggunakan K-Means menghasilkan data berubah-ubah klaster, bergantung pada jumlah klaster yang ditentukan. Setiap klaster yang terbentuk dari jangkauan 9 klaster digunakan dalam perhitungan SSE untuk menentukan jumlah klaster terbaik dengan representasi menggunakan grafik Elbow. Berdasarkan hasil perhitungan SSE maka didapatkan bahwa jumlah klaster terbaik pada penelitian ini ialah 2 klaster dengan nilai selisih SSE sebesar 4611.379920 dan berhasil membentuk garis siku pada grafik. Pengelompokan data berdasarkan jumlah klaster optimal dalam melakukan klastering waktu kelulusan terdiri dari klaster 1 sebanyak 199 data sebagai klaster tepat waktu dan klaster 2 sebanyak 41 data sebagai klaster tidak tepat waktu.

Referensi

Waworuntu, M. N. V., & Amin, M. F. (2018). Penerapan Metode K-Means Untuk Pemetaan Calon Penerima Jamkesda. KLIK- Kumpulan Jurnal Ilmu Komputer, 5(2), 190- 200. (http://dx.doi.org/10.20527/klik.v5i2.157) diakses 12 januari 2022.

Trayasiwi, G. P. (2017). Penerapan Metode Klastering dengan Algoritma k-Means Untuk Prediksi Kelulusan Mahasiswa Pada Program Studi Teknik Informatika Strata Satu. UDiNus Repos, 1(1), 1-11.

KeyUA, 2021. “10 Popular Data Mining Algorithms”. Tersedia

[https://keyua.org/blog/top-10-data-mining- algorithms/] diakses 20 Desember 2021.

Syakur, M. A., Khotimah, B. K., Rochman,

E. M. S., & Satoto, B. D. (2018, April). Integration k-means clustering method and elbow method for identification of the best customer profile cluster. In IOP conference series: materials science and engineering (Vol. 336, p. 012017). IOP Publishing.(10.1088/1757- 899X/336/1/012017) diakses 12 januari 2022.

Dubey, A. K., Gupta, U., & Jain, S. (2018). Comparative study of K-means and fuzzy C- means algorithms on the breast cancer data. International Journal on Advanced Science, Engineering and Information Technology, 8(1), 18-29.

(http://dx.doi.org/10.18517/ijaseit.8.1.3490) diakses tanggal 12 januari 2022.

Jannah, A. R., Arifianto, D., & Kom, M. 2017. “Penerapan Metode Clustering dengan Algoritma K-Means untuk Prediksi Kelulusan Mahasiswa Jurusan Teknik Informatika di Universitas Muhammadiyah Jember”. Jurnal Manajemen Sistem Informasi an Teknologi, 1(1210651237), 1–10.

<http://repository.unmuhjember.ac.id/id/eprin t/589>

Studio, M. (2018). Pengelompokan Data Penjualan Aksesoris Menggunakan Algoritma K-Means. vol. IV, (2), 401-411.

Aditya, K. B., Puspitaningrum, D., & Setiawan, Y. (2017). Sistem Informasi Geografis Pemetaan Faktor-Faktor Yang Mempengaruhi Angka Kematian Ibu (Aki) Dan Angka Kematian Bayi (AKB) Dengan Metode K-Means Clustering (Studi Kasus: Provinsi Bengkulu). Jurnal Teknik

Informatika UIN Syarif Hidayatullah, 10(1), 133712.

(http://dx.doi.org/10.15408/jti.v10i1.6817) diakses 21 januari 2022.

Duong, M. Q., Lam, B. L. H., Tu, G. Q. H., & Hieu, N. H. (2019). Combination of K- Mean clustering and elbow technique in mitigating losses of distribution network. GMSARN International, 13, 153-158.

Priyatman, H., Sajid, F., & Haldivany, D. (2019). Klasterisasi Menggunakan Algoritma K-Means Clustering untuk Memprediksi Waktu Kelulusan Mahasiswa. Jurnal Edukasi Dan Penelitian Informatika (JEPIN), 5(1), 62. (http://dx.doi.org/10.26418/jp.v5i1.29611) diakses 21 januari 2022.

Eldo, H. (2020). Penentuan Cluster Terbaik K-Means Menggunakan Algoritma Silhouette (Doctoral dissertation, Universitas Sumatera Utara) http://repositori.usu.ac.id/handle/123456789/ 27537.

Santoso, T., & Saftarina, F. 2020. “Klasterisasi Petani Padi Sawah di Kota Metro Provinsi Lampung Menggunakan Algoritma K-Means Cluster dan Elbow Method”. Journal of Agribusiness and Community Empowerment, 3(1), 37–43. http:doi.org/2655- 4526/26552965/jace/11.10.2019.

Putu, N., Merliana, E., & Santoso, A. J. (2015). “Analisa Penentuan Jumlah Cluster Terbaik pada Metode K-Means”. 978–979. https://doi.org/10.22146/ijccs.6641

Dewi, D. A. I. C., & Pramita, D. A. K. (2019). Analisis Perbandingan Metode Elbow dan Silhouette pada Algoritma Clustering K- Medoids dalam Pengelompokan Produksi Kerajinan Bali. Matrix: Jurnal Manajemen Teknologi Dan Informatika, 9 (3), 102–109 http://dx.doi.org/10.31940/matrix.v9i3.1662.

Nainggolan, R., Perangin-Angin, R., “Simarmata, E., & Tarigan, A. F. 2019. Improved the Performance of the K-Means Cluster Using the Sum of Squared Error (SSE) optimized by using the Elbow Method”. Journal of Physics: Conference Series, 1361(1). https://doi.org/10.1088/1742- 6596/1361/1/012015.

Qi, J., Yu, Y., Wang, L., & Liu, J. (2016, October). K-means: An effective and efficient K-means clustering algorithm. In 2016 IEEE international conferences on big data and cloud computing (BDCloud), social computing and networking (SocialCom), sustainable computing and communications (SustainCom)(BDCloud-SocialCom- SustainCom) (pp. 242-249). IEEE 10.1109/BDCloud-SocialCom- SustainCom.2016.46.

Unduhan

Diterbitkan

2023-07-19

Cara Mengutip

Basri, A., Mubarak, A., Kurniadi Sirajuddin, H., & Do. Abdullah, S. (2023). PENENTUAN JUMLAH KLASTER TERBAIK PADA K-MEANS DALAM MELIHAT POLA KLASTERING DATA MAHASISWA YANG TELAH LULUS. Jurnal Jaringan Dan Teknologi Informasi, 2(1), 80–86. Diambil dari https://e-journal.unkhair.ac.id/index.php/jati/article/view/60

Artikel paling banyak dibaca berdasarkan penulis yang sama

1 2 > >>