K-Means adalah teknik yang cukup sederhana
dan cepat dalam pekerjaan pengelompokkan data (clustering). Prinsip
utama dari teknik ini adalah menyusun k buah prototipe/pusat massa (centroid)/rata-rata (mean) dari sekumpulan data berdimensi n. Teknik ini mensyaratkan nilai k sudah diketahui sebelumnya (a priori).
Algoritma k-means dimulai dengan pembentukan prototipe cluster di awal
kemudian secara iteratif prototipe cluster ini diperbaiki hingga
konvergen (tidak terjadi perubahan yang signifikan pada prototipe
cluster). Perubahan ini diukur menggunakan fungsi objektif J yang
umumnya didefinisikan sebagai jumlah atau rata-rata jarak tiap item data
dengan pusat massa kelompoknya. Secara lebih detil algoritma k-means
adalah seperti berikut :
- inisialisasi nilai J (misal MAXINT)
- Tentukan prototipe cluster awal (bisa secara acak ataupun dipilih salah satu secara acak dari koleksi data)
- Masukkan tiap satuan data ke dalam kelompok yang jarak dengan pusat massa-nya paling dekat
- ubah nilai pusat massa tiap cluster sebagai rata-rata (mean) dari seluruh anggota kelompok tersebut
- Hitung fungsi objektif J
- jika nilai J sama dengan sebelumnya, berhenti atau ulangi langkah 3
Tidak ada komentar:
Posting Komentar