Mnogi od nas čuli su izraz "klaster analiza", ali ono što to znači nije sve. Štoviše, zvuči više nego tajanstveno! Zapravo, ovo je samo naziv metode podjele uzorka podataka u kategorije elemenata prema određenim kriterijima. Na primjer, klaster analiza omogućuje ljudima da se podijele u skupine s visokim, srednjim i niskim samopoštovanjem. Jednostavno rečeno, klaster je tip objekata koji su slični u određenom atributu.
Klaster analiza: problemi u uporabi
Nakon što ste odlučili primijeniti ovu metodu u svom istraživanju, morate zapamtiti da su klasteri odabrani u tijeku mogu biti nestabilni. Stoga, kao iu slučaju faktorske analize, trebate provjeriti rezultate na drugoj skupini objekata ili, nakon određenog vremenskog razdoblja, izračunati pogrešku mjerenja. Štoviše, najbolje je koristiti klaster analizu na velikim uzorcima, odabranim randomizacijom ili stratifikacijom, jer samo na taj način možemo napraviti znanstveni zaključak pomoću indukcije. Najbolje od svega, pokazao se da testira hipoteze, a ne da ih kreira od nule.
Hijerarhijska analiza klastera
Ako trebate brzo klasificirati slučajne elemente, tada možete početi razmatrati svaku od njih u početnoj fazi kao zasebni klaster. To je suština jednog od najlakših za razumijevanje tipova klaster analize. Koristeći ga, istraživač u drugoj fazi formira parove elemenata koji su po svojim karakteristikama slični, a zatim ih međusobno povezuju potreban broj puta. Klasteri koji se nalaze na minimalnoj udaljenosti između sebe određeni su integrativnim postupkom. Ponavlja se sve dok ne zadovolji jedan od sljedećih kriterija:
Kako bi ispravno izračunali udaljenost između klastera, oni često koriste sljedeće tehnike:
Sljedeći se kriteriji koriste za procjenu rezultata klasteriranja:
Metode klaster analize
Najčešće se pri analizi uzorka objekata koristi metoda minimalne udaljenosti. To je u činjenici da klaster kombinira elemente s koeficijentom sličnosti, koji je veći od praga vrijednosti. Kada se koristi metoda lokalne udaljenosti, razlikuju se dva klastera: udaljenost između točaka prvog je maksimalna, a druga je minimalna. Metoda centroidnog klasteriranja uključuje izračunavanje udaljenosti između prosječnih vrijednosti pokazatelja u skupinama. A Wardova metoda je najracionalnija za grupiranje klastera u blizini parametra koji se proučava.