Klaster adalah sebuah grup yang memiliki kemiripan tertentu. Pengklasteran adalah sebuah metode machine learning unsupervised untuk mengelompokkan objek-objek yang memiliki kemiripan, ke dalam sebuah klaster. Karena termasuk kategori unsupervised, maka dataset yang digunakan model clustering tidak memiliki label.
Contoh pengklasteran adalah ketika kita memiliki data pengunjung blog pribadi kita seperti gambar di bawah. Kemudian kita ingin mengembangkan sebuah model yang bisa mengelompokkan pengunjung yang memiliki kemiripan sama. Tujuannya agar kita bisa menulis konten yang sesuai untuk setiap kelompok.
Sebuah model pengklasteran, akan membandingkan atribut setiap pengunjung lalu membuat sebuah cluster yang diisi oleh pengunjung yang memiliki kemiripan karakteristik/atribut yang tinggi.
Contoh di atas dikenal juga sebagai customer segmentation, salah satu kasus yang populer di industri, di mana bisnis mengelompokkan pelanggan agar bisa memberikan penawaran yang sesuai untuk setiap kelompok. Metode clustering yang paling populer adalah pengklasteran K-Means.
Posting Komentar