Andrey Bu’nın tanımı ile K-means algoritması ‘K-araçlarının amacı basit: benzer veri noktalarını birlikte gruplamak ve altta yatan kalıpları keşfetmek. Bu amaca ulaşmak için K-, bir veri kümesinde sabit sayıda (k) küme arar. ” demiştir.

Bir küme, belirli benzerliklerden dolayı bir araya toplanmış veri noktalarının toplanması anlamına gelir. Veri kümesinde ihtiyaç duyduğunuz centroid sayısını ifade eden bir hedef k'yi tanımlayacaksınız. Bir centroid, kümenin merkezini temsil eden hayali veya gerçek konumdur. Her veri noktası, küme içi toplam karelerin azaltılmasıyla kümelerin her birine tahsis edilir.
 

Daha detaylı olarak adım adım inceleyelim.

Başlatma

K -'nin yaptığı ilk şey rastgele olarak, ilk küme merkezi olarak veri setinden K örneklerini (veri noktaları) seçmektir ve bunun nedeni her kümenin merkezinin nerede olduğunu henüz bilmemesidir. (bir centroid kümenin merkezidir).

Küme Atama

Daha sonra ki adım merkeze en yakın noktalardan oluşan bir küme yaratmaktır. Veri noktaları ve her centroid arasındaki Öklid mesafesini kullanırız. Oluşan sınıflar bir hat gibi aradan çizgi çekilerek ayrılır. Sınıflar, belli olur.

Merkezi(centroid) Hareket Ettirme

Yeni oluşan kümenin merkezlerini buluyoruz. Yeni merkezleri belirledikten sonra diğer üyelerden bazıları merkezlerin diğerine daha yakın olacaktır. Bu durumda kümeleri tekrar güncelliyoruz.

Daha kararlı bir hale gelene kadar bu aşamalar devam etmektedir.