Aplikasi Pengelompokan Data Runtun Waktu dengan Algoritma K-Medoids

  • Zen M
  • Wahyuningsih S
  • Dani A
N/ACitations
Citations of this article
17Readers
Mendeley users who have this article in their library.

Abstract

ABSTRAK ⎯ Teknologi informasi yang terus berkembang selalu diiringi dengan informasi digital yang secara terus menerus tersimpan dan terkumpul dalam jumlah yang sangat besar. Pemilihan suatu algoritma yang sesuai menjadi sangat penting dalam menangani permasalahan big data salah satunya dengan menggunakan analisis klaster. Analisis klaster merupakan serangkaian metode yang digunakan untuk mempartisi sekumpulan objek pengamatan ke dalam suatu himpunan. Himpunan-himpunan yang terbentuk disebut dengan klaster. Analisis klaster dapat diimplementasikan pada data runtun waktu, di mana dalam pemrosesan data sedikit berbeda dengan tipe data cross-section. Time series clustering merupakan salah satu pendekatan yang dapat digunakan dalam pemrosesan data runtun waktu multivariabel. Algoritma pengelompokan yang digunakan pada time series clustering adalah K-Medoids. Tujuan penelitian ini dilakukan untuk memperoleh nilai K optimal dalam menentukan banyaknya klaster berdasarkan koefisien silhouette dan memperoleh hasil pengelompokan menggunakan algoritma K-Medoids. Pada penelitian ini, ukuran kemiripan yang digunakan adalah jarak dynamic time warping. Data pada penelitian adalah data harga minyak goreng 34 provinsi di Indonesia dari Oktober 2017-Oktober 2022. Berdasarkan hasil analisis, diperoleh nilai K optimal sebesar 2 klaster dengan 19 provinsi bergabung pada klaster 1 di mana klaster dengan harga minyak goreng dibawah klaster 2 dan 15 provinsi bergabung pada klaster 2 yang merupakan klaster dengan harga minyak goreng tertinggi. ABSTRACT ⎯ The development of information technology will always be accompanied by the storage and accumulation of massive quantities of digital information. Cluster analysis is one of many data processing problems that require the selection of an appropriate algorithm when dealing with large data sets. Cluster analysis is a collection of techniques for dividing a set of observation objects into clusters. Cluster analysis is applicable to time series data, the processing of which differs slightly from that of cross-section data. Clustering time series is a technique for processing multivariable time series data. K-Medoids is the clustering algorithm used for time series clustering. The objective of this study is to obtain optimal K-values in determining the number of clusters based on silhouette coefficients and grouping outcomes using the K-Medoids algorithm. In this study, the dynamic time-warping distance is utilized as the similarity metric. This study provides cooking oil price data for 34 Indonesian provinces from October 2017 to October 2022. The optimal K value is determined for two clusters based on the results of the analysis, with 19 provinces joining cluster 1, where the cluster with cooking oil prices was below cluster 2 and 15 provinces joining cluster 2 which is the cluster with the highest cooking oil prices.

Cite

CITATION STYLE

APA

Zen, M. A., Wahyuningsih, S., & Dani, A. T. R. (2023). Aplikasi Pengelompokan Data Runtun Waktu dengan Algoritma K-Medoids. Inferensi, 6(2), 117. https://doi.org/10.12962/j27213862.v6i2.15864

Register to see more suggestions

Mendeley helps you to discover research relevant for your work.

Already have an account?

Save time finding and organizing research with Mendeley

Sign up for free