Koncept korelacijsko-regresijske analize podrazumijeva niz operacija, odnosno određivanje bliskosti odnosa, njegovog smjera i uspostave jednadžbe koja opisuje oblik odnosa. Ova vrsta analize sadrži dvije odvojene komponente: korelacijsku i regresijsku analizu.
Korelacijska i regresijska analiza jedan je od načina rješavanja problema i traženja informacija. To vam omogućuje da odredite zajednički utjecaj mnogih međusobno povezanih i istodobno djelujućih znakova, kao i odvojeni utjecaj svakog atributa na ekonomski fenomen (proces). Zahvaljujući takvoj vrsti analize moguće je procijeniti stupanj međusobne povezanosti između nekoliko karakteristika, karakteristika i dobivenog rezultata, kao i modelirati regresijsku jednadžbu koja opisuje oblik međuodnosa.
Korelacijska i regresijska analiza ekonomskih procesa podijeljena je u nekoliko faza:
Homogenost statističkih informacija može se odrediti pomoću dvije tehnike. Za početak, potrebno je odrediti i odbaciti vrijednost čimbenika koji se značajno razlikuju od svih količina. Zatim se provodi statistička studija homogenosti provjerom neovisnosti uzorka i njegove pripadnosti jednom skupu s normalnom distribucijom.
Regresijski model određen je metodom najmanjih kvadrata, koja daje najbolje aproksimacije procjene rezultata, određene pomoću regresijske jednadžbe, njezinim faktorima.
Najvažniji čimbenici koji određuju karakteristike modela smatraju se:
Glavni zadaci korelacijsko-regresijske analize su identifikacija čimbenika koji značajno utječu na ekonomski ishod fenomena ili procesa, te korištenje dobivenih informacija za poboljšanje planiranja ekonomskog procesa ili fenomena.
Svi proizvodni procesi su usko povezani. Taj je odnos stohastičan (rezultat ovisi o mnogim čimbenicima) i funkcionalan (rezultat se mijenja za isti iznos kao i faktor). Stohastička ovisnost je često korelativna u prirodi, odnosno vrijednost faktora istodobno odgovara nekoliko vrijednosti rezultata, koje imaju potpuno različite smjerove.
Korelacijski odnos može imati jedan ili više faktora-znakova, imati pozitivnu ili negativnu usmjerenost, biti ravan ili krivocrtan (ovisno o izrazu). Moguće je odrediti koji je odnos povezan s pomoću korelacijske rešetke. Izgrađena je unutar pravokutnih osi koordinata.
Frekvencije postavljene blizu dijagonala ukazuju na visoku korelaciju znakova. Frekvencije postavljene blizu dijagonale koja prolazi kroz donji lijevi i desni gornji kut ukazuju na pozitivan smjer, dok oni koji prolaze kroz gornji lijevi i desni donji kut ukazuju na suprotan smjer. Frekvencije smještene u obliku luka ukazuju na krivocrtni odnos i nasumce su raspršene - o odsutnosti odnosa.
Osnovna metoda korelacijske analize je linearna. koeficijent korelacije. Može imati vrijednosti od -1 do +1. Što je vrijednost bliža 1, to je jača veza između faktora i rezultata. Pozitivne vrijednosti ukazuju na izravnu vezu, a negativne vrijednosti na inverznu. Koeficijent uzima vrijednost "nula" ako ne postoji veza između znakova.
Brojne metode omogućuju procjenu odnosa pojava bez kvantitativnog izražavanja osobine i, sukladno tome, parametara raspodjele. Nazivaju se neparametrijski. Među njima su:
U statistici i ekonomiji koristi se širok raspon tipova i objekata analize. Statističke metode analize usmjerene su na proučavanje repetitivnih procesa kako bi se napravila dugoročna predviđanja ponašanja ekonomskih fenomena.
Na primjer, kako bi se analizirao društveno-ekonomski razvoj nekog područja, potrebno je proučiti pokazatelje životnog standarda stanovništva. Korelacijska i regresijska analiza u statistici omogućuje stvaranje regresijska jednadžba te identificirati koeficijente korelacije koji pokazuju odnos između životnog standarda i razvoja teritorija. Životni standard određen je dohotkom, a glavni izvor prihoda je plaća. U ovom slučaju, faktor je razina plaća, a rezultat je stanovništvo s niskim primanjima.
Da biste olakšali izračunavanje, možete provesti analizu korelacije u Excelu. U ovom programu postoje brojni alati koji olakšavaju izračune. Među njima, funkcija "Korelacija", koja omogućuje da se formira matrica koeficijenata i različitih parametara. Prikazana je u obliku tablice. Koeficijenti korelacije koriste se kao stupci i redovi. Na temelju podataka iz tablice bit će potrebno provesti korelacijsku analizu. Primjer niza analiza:
Rezultat je korelacijska matrica koja se nalazi u izlaznom rasponu. Unutar koeficijenta linearne korelacije će se ukazati, procjenjujući nepropusnost i oblik odnosa između pokazatelja.
U MS Excel-u, funkcija "Korelacija" koristi se za provođenje korelacijske i regresijske analize. Primjer izračuna koeficijenata razmotrit će se kasnije. Ova funkcija formira matricu s koeficijentima bliskosti odnosa između različitih parametara. Kao rezultat, formira se kvadratna tablica koja sadrži koeficijente korelacije na presjeku redaka i stupaca.
Za analizu će trebati provesti niz specifičnih radnji:
Kao rezultat izračuna, pojavit će se kvadratni stol s koeficijentima korelacije.
Da biste izračunali linearna jednadžba Regresije koje opisuju odnos između čimbenika i rezultata u MS Excel-u koriste se statističkom funkcijom "Linean". Da biste ga mogli koristiti, morate:
Na vrhu prethodno odabranog područja pojavit će se početni element tablice. Da biste otkrili sve podatke, morate pritisnuti F2, a zatim istovremeno kombinaciju tipki Ctrl + Shift + Enter.
Kao rezultat toga, podaci o regresiji bit će prikazani kao tablica s dva stupca i pet redaka:
Stupac 1 | Stupac 2 | |
Redak 1 | Koeficijent b | Koeficijent a |
Redak 2 | Standardna devijacija b | Standardna devijacija a |
Redak 3 | Koeficijent određivanja | Standardna devijacija y |
Redak 4 | F-statistika | Broj stupnjeva slobode |
Redak 5 | Zbroj regresijskih kvadrata | Preostala suma kvadrata |
Rezultate treba zamijeniti u jednadžbu linearne regresije, koja izgleda ovako: y = a + bx. Vrijednost iz ćelije na sjecištu retka 1 i stupca 2 zamjenjuje koeficijent a. Vrijednost na sjecištu retka 1 i stupca 1 koristi se kao koeficijent b.
Koeficijent determinacije ukazuje na to koji je dio rezultata objašnjen uz pomoć istraživanog faktora. Preostali dio rezultata određen je faktorima koji se ne vode u linearnom modelu.