Klaster analiza: njezina metoda i opseg

14. 5. 2019.

Mnogi od nas čuli su izraz "klaster analiza", ali ono što to znači nije sve. Štoviše, zvuči više nego tajanstveno! Zapravo, ovo je samo naziv metode podjele uzorka podataka u kategorije elemenata prema određenim kriterijima. Na primjer, klaster analiza omogućuje ljudima da se podijele u skupine s visokim, srednjim i niskim samopoštovanjem. Jednostavno rečeno, klaster je tip objekata koji su slični u određenom atributu.

Klaster analiza: problemi u uporabi

klaster analiza Nakon što ste odlučili primijeniti ovu metodu u svom istraživanju, morate zapamtiti da su klasteri odabrani u tijeku mogu biti nestabilni. Stoga, kao iu slučaju faktorske analize, trebate provjeriti rezultate na drugoj skupini objekata ili, nakon određenog vremenskog razdoblja, izračunati pogrešku mjerenja. Štoviše, najbolje je koristiti klaster analizu na velikim uzorcima, odabranim randomizacijom ili stratifikacijom, jer samo na taj način možemo napraviti znanstveni zaključak pomoću indukcije. Najbolje od svega, pokazao se da testira hipoteze, a ne da ih kreira od nule.

Hijerarhijska analiza klastera

hijerarhijska analiza klastera Ako trebate brzo klasificirati slučajne elemente, tada možete početi razmatrati svaku od njih u početnoj fazi kao zasebni klaster. To je suština jednog od najlakših za razumijevanje tipova klaster analize. Koristeći ga, istraživač u drugoj fazi formira parove elemenata koji su po svojim karakteristikama slični, a zatim ih međusobno povezuju potreban broj puta. Klasteri koji se nalaze na minimalnoj udaljenosti između sebe određeni su integrativnim postupkom. Ponavlja se sve dok ne zadovolji jedan od sljedećih kriterija:

  • dobivanje unaprijed planiranog broja klastera;
  • svaki klaster sadrži potreban broj elemenata;
  • svaka grupa ima potreban omjer heterogenosti i homogenosti unutar njega.

Kako bi ispravno izračunali udaljenost između klastera, oni često koriste sljedeće tehnike:

  • jednostavna i potpuna komunikacija;
  • međupovezivanje srednjeg kralja;
  • metoda centroida;
  • prosječan broj prijemnih skupina.

Sljedeći se kriteriji koriste za procjenu rezultata klasteriranja:

  • indeks definicije;
  • faktor podjele;
  • normalna, normalizirana i modificirana entropija;
  • drugi i treći Rubens funkcionalan.

Metode klaster analize

metode klaster analize Najčešće se pri analizi uzorka objekata koristi metoda minimalne udaljenosti. To je u činjenici da klaster kombinira elemente s koeficijentom sličnosti, koji je veći od praga vrijednosti. Kada se koristi metoda lokalne udaljenosti, razlikuju se dva klastera: udaljenost između točaka prvog je maksimalna, a druga je minimalna. Metoda centroidnog klasteriranja uključuje izračunavanje udaljenosti između prosječnih vrijednosti pokazatelja u skupinama. A Wardova metoda je najracionalnija za grupiranje klastera u blizini parametra koji se proučava.