Šta karakteriše parcijalni koeficijent višestruke korelacije? Koeficijent korelacije i uzročno-posledična veza: formule i njihova interpretacija. Medijska pristrasnost

Do sada smo razmatrali korelacije između dvije karakteristike: efektivne ( at) i faktor (X). Na primjer, proizvodnja proizvoda zavisi ne samo od veličine osnovnog kapitala, već i od nivoa vještina radnika, stanja opreme, dostupnosti i kvaliteta sirovina, organizacije rada itd. S tim u vezi, postoji potreba da se prouči i izmjeri veza između rezultirajuće karakteristike i dvije ili više faktorskih. To je ono što čini višestruka korelacija.

Višestruka korelacija rješava tri problema. Definiše:

1) oblik komunikacije;

2) bliskost komunikacije;

3) uticaj pojedinačnih faktora na ukupan rezultat.

Određivanje oblika veze obično se svodi na pronalaženje jednačine veze y sa faktorima x,z,w,...y. Dakle, linearna jednačina zavisnosti efektivne karakteristike od dva faktora faktora određena je formulom

Za definiranje parametara a 0 , a ) I a 2, Metodom najmanjih kvadrata potrebno je riješiti sljedeći sistem od tri normalne jednadžbe:

(8.29.)

Prilikom određivanja bliskosti veze za višestruku zavisnost koristi se koeficijent višestruke (kumulativne) korelacije, nakon što su prethodno izračunati koeficijenti parne korelacije. Dakle, kada se proučava odnos između efektivne karakteristike at i dva faktorska znaka - X I z, potrebno je prvo utvrditi bliskost veze između at I X, između at I z, one. izračunajte koeficijente korelacije parova, a zatim, da biste odredili bliskost odnosa između rezultirajuće karakteristike i dva faktora, izračunajte koeficijent višestruke korelacije prema sljedećoj formuli:

(8.30.)

gdje je r xy , r zy , r xz - koeficijenti parne korelacije.

Koeficijent višestruke korelacije kreće se od 0 do 1. Što je bliži 1, više faktora koji određuju konačni rezultat se uzima u obzir.

Ako se koeficijent višestruke korelacije kvadrira, dobijamo ukupni koeficijent determinacije, koji karakterizira udio varijacije u rezultujućoj karakteristici at pod uticajem svih proučavanih faktorskih karakteristika.

Kumulativni koeficijent determinacije, kao i kod parne korelacije, može se izračunati pomoću sljedeće formule:

gdje je disperzija faktorskih karakteristika, a disperzija rezultirajuće karakteristike. Međutim, izračunavanje teoretskih vrijednosti Y sa višestrukom korelacijom to je i teško i glomazno. Zbog toga faktorska varijansa izračunato pomoću sljedeće formule.

Praktični značaj jednačine višestruke regresije procjenjuje se pomoću indikatora višestruke korelacije i njegovog kvadrata - koeficijenta determinacije.

Koeficijent determinacije pokazuje udio varijacije u rezultantnoj karakteristici koja je pod uticajem faktorskih karakteristika, tj. određuje koliki je udio varijacije u osobini at uzeti u obzir u modelu i nastaje zbog uticaja faktora uključenih u model:

Koeficijent višestruke korelacije može se naći kao kvadratni korijen koeficijenta determinacije. Što je koeficijent korelacije bliži jedinici, to je bliži odnos između rezultata i svih faktora, a jednačina regresije bolje opisuje stvarne podatke. Ako je koeficijent višestruke korelacije blizu nule, tada jednačina regresije loše opisuje stvarne podatke, a faktori imaju mali uticaj na rezultat. Ovaj koeficijent, za razliku od koeficijenta parne korelacije, ne može se koristiti za tumačenje smjera odnosa.

Vrijednost koeficijenta višestruke korelacije veća je ili jednaka vrijednosti maksimalnog koeficijenta korelacije para:

Za linearnu višestruku regresiju, koeficijent višestruke korelacije može se izračunati pomoću sljedeće formule:

Prema tome, višestruki koeficijent determinacije je:

Postoji još jedna formula za izračunavanje koeficijenta višestruke korelacije za linearnu regresiju:

gdje je determinanta kompletne matrice linearnih parnih koeficijenata korelacije (tj. uključujući uparene linearne koeficijente korelacije faktora s rezultatom i međusobno):

Odrednica matrice linearnih koeficijenata korelacije para između faktora:

Također se izračunava prilagođeni koeficijent determinacije:

Gdje n– broj zapažanja;

m– broj parametara jednadžbe regresije bez uzimanja u obzir slobodnog člana (za linearnu regresiju, na primjer, ovaj broj je jednak broju faktora uključenih u model).

Prilagođeni koeficijent determinacije se koristi za rješavanje dva problema: procjena stvarne bliskosti odnosa između rezultata i faktora i poređenje modela sa različitim brojem parametara. U prvom slučaju pažnja se obraća na bliskost prilagođenih i neprilagođenih koeficijenata determinacije. Ako su ovi pokazatelji veliki i neznatno se razlikuju, model se smatra dobrim.

Prilikom poređenja različitih modela, ceteris paribus, prednost se daje onom sa većim prilagođenim koeficijentom determinacije.

Treba napomenuti da je opseg primjene prilagođenog koeficijenta determinacije ograničen samo na ove zadatke. Ne može se koristiti u formulama u kojima se koristi uobičajeni koeficijent determinacije. Prilagođeni koeficijent determinacije ne može se tumačiti kao udio varijacije u ishodu objašnjen varijacijom faktora uključenih u regresijski model.


Da biste provjerili značaj koeficijenta višestruke korelacije, koristite F-Fišerov kriterijum koji se određuje formulom:

Gdje R 2– višestruki koeficijent determinacije;

m– broj parametara za faktore x u jednačini višestruke regresije (u parnoj regresiji m=1).

Rezultirajuća vrijednost F-testa se upoređuje sa vrijednošću tablice na određenom nivou značajnosti i m I n-m-1 stepena slobode. Ako je izračunata vrijednost F-kriterijum je veći od tabelarnog, jednačina višestruke regresije se smatra značajnom.

Praktični značaj jednačine višestruke regresije procjenjuje se pomoću indikatora višestruke korelacije i njegovog kvadrata - koeficijenta determinacije.

Indikator višestruke korelacije karakteriše bliskost veze između skupa faktora koji se razmatra i karakteristike koja se proučava, ili, drugim rečima, procenjuje bliskost zajedničkog uticaja faktora na rezultat.

Bez obzira na oblik odnosa, indikator višestruke korelacije može se naći kao indeks višestruke korelacije:

Gdje – ukupna disperzija rezultujućeg atributa;

– rezidualna varijansa za jednačinu
.

Tehnika za konstruisanje indeksa višestruke korelacije slična je konstruisanju indeksa korelacije za zavisnost u paru. Granice njegove promjene su iste: od 0 do 1. Što je njegova vrijednost bliža 1, to je bliža veza između efektivne karakteristike i cjelokupnog skupa faktora koji se proučava. Vrijednost indeksa višestruke korelacije mora biti veća ili jednaka maksimalnom indeksu parne korelacije:

.

Ako su faktori ispravno uključeni u regresionu analizu, vrijednost indeksa višestruke korelacije će se značajno razlikovati od indeksa parne korelacije. Ako su faktori koji su dodatno uključeni u jednadžbu višestruke regresije tercijarni, onda se indeks višestruke korelacije praktično može poklapati sa indeksom parne korelacije (razlike u trećoj i četvrtoj znamenki). Iz ovoga je jasno da poređenjem indeksa višestruke i parne korelacije možemo zaključiti da je preporučljivo uključiti jedan ili drugi faktor u jednadžbu regresije. Sta ako tretirati kao funkciju I i dobio indeks višestruke korelacije
, a indeksi korelacije parova su bili
I
, onda je apsolutno jasno da je jednadžba regresije para
pokriva 67,2% varijabilnosti rezultujuće karakteristike pod uticajem faktora , te dodatno uključivanje u analizu faktora povećao udio objašnjene varijacije na 72,3%, odnosno udio preostale varijacije smanjen je za 5,1 posto. bodova (sa 32,8 na 27,7%).

Izračunavanje indeksa višestruke korelacije uključuje određivanje jednačine višestruke regresije i, na osnovu nje, preostale varijanse:

.

Možete koristiti sljedeću formulu indeksa višestruke korelacije:

Uz linearnu ovisnost karakteristika, formula indeksa korelacije može se predstaviti sljedećim izrazom:

,

Gdje – standardizovani koeficijenti regresije;

– upareni koeficijenti korelacije rezultata sa svakim faktorom.

Ili, na drugi način:

Poziva se formula indeksa višestruke korelacije za linearnu regresiju linearni koeficijent višestruke korelacije , ili, šta je isto, kumulativni koeficijent korelacije .

Također je moguće, uz linearni odnos, odrediti ukupni koeficijent korelacije kroz matricu uparenih koeficijenata korelacije:

Gdje
– determinanta matrice koeficijenata korelacije parova;

– determinanta matrice međufaktorske korelacije.

Za jednačinu, determinanta matrice koeficijenata korelacije parova imat će oblik:

Odrednica nižeg reda
ostaje kada se prvi stupac i prvi red izbrišu iz matrice koeficijenata parne korelacije, što odgovara matrici koeficijenata parne korelacije između faktora:

Kao što vidimo, vrijednost koeficijenta višestruke korelacije ne zavisi samo od korelacije rezultata sa svakim od faktora, već i od međufaktorske korelacije. Razmatrana formula vam omogućava da odredite ukupni koeficijent korelacije bez pribjegavanja jednadžbi višestruke regresije, već koristeći samo uparene koeficijente korelacije.

Sa tri varijable za jednadžbu regresije s dva faktora, ova formula za kumulativni koeficijent korelacije može se lako svesti na sljedeći oblik:

Indeks višestruke korelacije jednak je ukupnom koeficijentu korelacije ne samo za linearnu zavisnost karakteristika koje se razmatraju. Identitet ovih indikatora, kao u parnoj regresiji, takođe se javlja za krivolinijski odnos koji je nelinearan u varijablama.

Razmatrani indikatori višestruke korelacije (indeks i koeficijent) koriste rezidualnu varijansu, koja ima sistematsku grešku prema potcenjivanju. Ova greška je značajnija što je više parametara određeno u regresijskoj jednadžbi za dati volumen zapažanja . Ako je broj parametara na jednaki
i približava se obimu posmatranja, tada će rezidualna varijansa biti blizu nule, a koeficijent korelacije (indeks) će se približiti jedinici čak i sa slabom vezom između faktora i rezultata. Kako bi se spriječilo moguće preuveličavanje bliskosti veze, koristi se prilagođeni indeks višestruke korelacije (koeficijent) .

Prilagođeni indeks višestruke korelacije sadrži korekciju za broj stupnjeva slobode, odnosno rezidualni zbir kvadrata
podijeljeno brojem stupnjeva slobode preostale varijacije
, i ukupan zbroj kvadrata odstupanja
– o broju stepena slobode u ukupnosti
.

Formula za prilagođeni indeks višestruke determinacije je:

Gdje
– broj parametara za varijable ;

– broj zapažanja.

Zbog
, tada se vrijednost prilagođenog indeksa determinacije može predstaviti kao

Što je vrijednost veća
, to su jače razlike
I
.

Za linearnu zavisnost karakteristika, prilagođeni koeficijent višestruke korelacije određuje se po istoj formuli kao i indeks višestruke korelacije, tj. kao kvadratni korijen od
. Jedina razlika je u tome što je u linearnoj zavisnosti pod
implicira broj faktora uključenih u regresijski model, i to u krivolinijskom odnosu
– broj parametara na i njihove transformacije ( ,
itd.), koji može biti veći od broja faktora kao ekonomskih varijabli.

Primjer. Pretpostavimo da kada
za jednačinu linearne regresije sa četiri faktora
, i uzimajući u obzir podešavanje za broj stupnjeva slobode

Što je veći obim populacije za koju se izračunava regresija, indikatori se manje razlikuju
I
. Dakle, već kod
na istoj vrijednosti
i t vrijednost
biće 0,673.

U paketima statističkih aplikacija, postupak višestruke regresije obično daje prilagođeni koeficijent (indeks) višestruke korelacije (određivanja). Vrijednost koeficijenta višestruke determinacije koristi se za procjenu kvaliteta regresionog modela. Niska vrijednost koeficijenta višestruke korelacije (indeksa) znači da regresijski model ne uključuje značajne faktore - s jedne strane, as druge strane - oblik povezanosti koji se razmatra ne odražava stvarne odnose između varijabli uključenih u model. Potrebna su dalja istraživanja kako bi se poboljšao kvalitet modela i povećao njegov praktični značaj.

Ako se parcijalni koeficijenti korelacije modela višestruke regresije pokažu značajnim, odnosno zaista postoji korelacijski odnos između varijabli ishoda i varijabli faktorskog modela, tada se u ovom slučaju smatra prikladnom konstrukcija koeficijenta višestruke korelacije.

Koristeći koeficijent višestruke korelacije, karakterizira se kombinovani utjecaj svih faktorskih varijabli na varijablu ishoda u modelu višestruke regresije.

Koeficijent višestruke korelacije za linearni model višestruke regresije sa n faktorskih varijabli izračunava se kroz standardizirane parcijalne koeficijente regresije i koeficijente parne korelacije koristeći formulu:

gdje je r (yxi)– upareni (ne parcijalni) koeficijent korelacije između varijable ishoda at i faktor varijabla xi

Koeficijent višestruke korelacije varira od nule do jedan. Uz njegovu pomoć nemoguće je okarakterizirati smjer odnosa između varijabli ishoda i faktora. Što je vrijednost koeficijenta višestruke korelacije bliža jedinici, to je jača veza između ishoda i nezavisnih varijabli, i obrnuto, što je vrijednost koeficijenta višestruke korelacije bliža nuli, slabiji je odnos između ishoda i neovisnih varijabli. varijable.

Koeficijent višestruke determinacije R2 naziva se kvadrat koeficijenta višestruke korelacije:

Koeficijent višestruke determinacije karakterizira postotak na koji konstruirani regresijski model objašnjava varijaciju vrijednosti varijable ishoda u odnosu na njen prosječni nivo, odnosno pokazuje udio ukupne varijanse varijable ishoda objašnjen varijacijom u faktorskim varijablama uključenim u regresijski model.

Koeficijent višestruke determinacije naziva se i kvantitativna karakteristika varijanse varijable ishoda objašnjene konstruiranim regresijskim modelom. Što je veća vrijednost koeficijenta višestruke determinacije, to bolje konstruirani regresijski model karakterizira odnos između varijabli.

Za koeficijent višestruke determinacije uvijek vrijedi nejednakost oblika:

Stoga je uključivanje dodatne faktorske varijable u model linearne regresije xn ne smanjuje vrijednost koeficijenta višestruke determinacije.

Koeficijent višestruke determinacije može se odrediti ne samo kao kvadrat koeficijenta višestruke korelacije, već i korištenjem teoreme o dekompoziciji suma kvadrata prema formuli:

Gdje ESS (Kvadrat sume greške)– suma kvadrata reziduala modela višestruke regresije sa n nezavisnih varijabli:

TSS (TotalSumSquare)– ukupan zbir kvadrata modela višestruke regresije sa n nezavisnih varijabli:

Međutim, klasični koeficijent višestruke determinacije nije uvijek u mogućnosti da odredi utjecaj dodatne faktorske varijable na kvalitetu regresijskog modela. Stoga se uz uobičajeni koeficijent izračunava i prilagođeni koeficijent višestruke determinacije, koji uzima u obzir broj faktorskih varijabli uključenih u regresijski model:

Gdje n– broj opservacija u populaciji uzorka;

IMPLEMENTACIJA ZADATAKA MULTIDIMENZIONALNE KORELACIONE ANALIZE

UPOTREBA MS EXCEL PAKET

Pogledajmo analizu korelacije koristeći primjer.

U cilju analize odnosa između pokazatelja efikasnosti proizvodnje, razmatrani su parametri proizvodno-privrednih aktivnosti 30 mašinskih preduzeća.

Potrebno je analizirati odnos između sljedećih ekonomskih pokazatelja:

Efikasan znak:

Y 1 – produktivnost rada

Znakovi faktora:

X 10 - kapitalna produktivnost;

X 14 - odnos kapitala i rada;

X 15 - promet normiranih obrtnih sredstava;

X 16 -

Izvorni podaci su predstavljeni u datoteci Correl. analiza.xls.

Pretpostavimo da su karakteristike koje se razmatraju u populaciji podliježu normalnoj distribuciji, a dati podaci predstavljaju uzorak iz ove populacije. Za rješavanje ovog problema koristit ćemo softverski proizvod MS EXCEL.

1. Kopirajte datoteku u svoju fasciklu ili radnu površinu Correl. analiza.xls sa pogona U:\General Information\Econometrics;

2. Otvorite datoteku Correl. analiza.xls i idi na list Vježba;

3. Povežite paket analize sa Excelom:

Izbornik SERVIS – Dodaci – Paket analiza – OK;

SERVIS meni – Analiza podataka – Korelacija – OK;

4. Navedite sljedeće opcije u dijaloškom okviru Korelacija:

1. Interval unosa

Odredite niz početnih indikatora odabirom mišem svih vrijednosti varijabli koje se proučavaju ( Y 1, X 10, X 14, X 15, X 16).

2. Grupisanje

Postavite prekidač u položaj po kolonama.

Oznake u prvom redu

Provjerite opciju Oznake u prvom redu da dodate gornji red u ulazni opseg koji sadrži imena varijabli, tada će se matrica korelacije ispisati sa imenima varijabli.

Izlazni interval

Stavite tačku na opciju Izlazni interval, zatim kliknite mišem u liniju nasuprot natpisa Izlazni interval i kliknite na ćeliju G1 na listu Vježbajte.



Nakon podešavanja navedenih parametara, kliknite na dugme uredu.

Dobijamo matricu korelacije u sljedećem obliku:

Tabela 1

Y1 X10 X14 X15 X16
Y1
X10 -0,02152
X14 0,577299 -0,03604
X15 0,334637 0,153663 0,077981
X16 -0,2042 -0,34832 -0,16676 -0,25017

5. Za dalje proračune potrebno je korelacionoj matrici dovesti u uobičajeni oblik popunjavanjem gornjeg trougla tabele. Treba uzeti u obzir da je matrica koeficijenata parne korelacije simetrična, a koeficijenti r ij = r ji. Kopirajte željene koeficijente parne korelacije u odgovarajuće ćelije.

Kao rezultat, dobijamo matricu 5x5 parnih koeficijenata korelacije:

tabela 2

Y1 X10 X14 X15 X16
Y1 -0,02152 0,577299 0,334637 -0,2042
X10 -0,02152 -0,03604 0,153663 -0,34832
X14 0,577299 -0,03604 0,077981 -0,16676
X15 0,334637 0,153663 0,077981 -0,25017
X16 -0,2042 -0,34832 -0,16676 -0,25017

6. Zatim je potrebno provjeriti značajnost dobijenih koeficijenata korelacije, tj. hipoteza Ali: r ij = 0. Da bismo to učinili, izračunavamo uočene vrijednosti t-statistika za sve koeficijente korelacije prema formuli:

Da biste to učinili, kopirajte prethodnu tabelu i zalijepite je ispod nje, uvlačeći dva reda. Uklonite sve numeričke podatke iz tabele i postavite kursor u ćeliju na preseku varijabli Y 1 I X 10. Dok ste u navedenoj ćeliji, unesite izraz u traku formule da biste napisali gornju formulu na sljedeći način:

=(H3/ROOT(1-H3*H3))*ROOT(49).

Prilikom unosa ovog izraza morate kliknuti na ćeliju sa odgovarajućim koeficijentom za koji se izračunava vrijednost t-statistika, u ovom slučaju u ćeliji H3. Nakon unosa navedenog izraza, pritisnite ENTER. Razvucite unesenu formulu pomoću crnog križa preko susjednih ćelija, kao rezultat bi trebali dobiti sljedeću matricu promatranih vrijednosti t-statistika:

Tabela 3

t obs. Y1 X10 X14 X15 X16
Y1
X10 -0,15071
X14 4,949094 -0,25242
X15 2,485769 1,088567 0,547536
X16 -1,4602 -2,60115 -1,18391 -1,80872

Izračunali smo uočene vrijednosti t-statistika samo za donji trougao tabele, pošto je matrica parnih koeficijenata korelacije simetrična.

7. Uočene vrijednosti t t cr, pronađeno za nivo značajnosti α=0,05 i broj stepena slobode ν =n-2. Da bismo to učinili, koristimo ugrađenu Excel funkciju INSERTFunkcija – Statistička – STUDAR.

Za obračun t cr označite praznu ćeliju i pozovite funkciju STUDISPOBR, unesite u polje Vjerovatnoća broj je 0,05, au polju Stepeni_slobode– broj 49, pošto imamo ukupno 51 zapažanje, dakle ν =n-2=51-2=49. Klikom na dugme uredu, dobićemo sljedeću vrijednost t cr= 2,009574.

Hajde da uporedimo posmatrane vrednosti koje smo izračunali t-statistiku sa kritičnim (tabelarnim) i utvrditi koji su koeficijenti značajni, a koji nisu. Koeficijent je značajan ako je | t obs.|>t cr.

8. Označite značajne koeficijente korelacije podebljanim slovima u tabeli:

Tabela 4

Matrica parnih koeficijenata korelacije proučavanih indikatora sa isticanjem značajnih koeficijenata (na α=0,05)

Y1 X10 X14 X15 X16
Y1 -0,02152 0,577299 0,334637 -0,2042
X10 -0,02152 -0,03604 0,153663 -0,34832
X14 0,577299 -0,03604 0,077981 -0,16676
X15 0,334637 0,153663 0,077981 -0,25017
X16 -0,2042 -0,34832 -0,16676 -0,25017

9. Za značajne uparene koeficijente korelacije, konstruisaćemo sa datom pouzdanošću γ=0,95 intervalna procjena r min< r < r тах koristeći Fisher Z-transformaciju (vidi formule u predavanju). Z" možete pronaći pomoću Excel funkcije:

INSERT Funkcija – Statistička – FISCHER, kao argument se unosi vrijednost odgovarajućeg koeficijenta korelacije uzorka r.

10. Značenje t γ Izračunajmo koristeći Excel funkciju: INSERT – Funkcija – Statistički – NORMSINV, gde na terenu Vjerovatnoća unosi se vrijednost 0,95.

Zmin = ; Z max=

Za obrnutu konverziju koristite Excel funkciju: INSERT Funkcija – Statistička –FISHEROBR, gde na terenu Y unose se ćelije sa vrijednošću Z min , Z max , one. za obračun rmin enter Zmin, i za obračun r max enter Z max.

Izračune predstavljamo u obliku sljedeće tabele:

Tabela 5

Proračun intervala povjerenja za uparene opšte koeficijente korelacije proučavanih ekonomskih indikatora sa pouzdanošću γ = 0,95

r Z' Zmin Z max rmin r max
Y1X14 0,577299 0,658403 0,413403 0,903403 0,3913583 0,71795081
Y1X15 0,334637 0,348041 0,103041 0,593041 0,10267786 0,5320792
H10H16 -0,34832 -0,36353 -0,60853 -0,11853 -0,5430915 -0,11797801

Dakle, intervali povjerenja s pouzdanošću γ = 0,95 za sve značajne koeficijente parne korelacije.

Na osnovu dobijenih podataka mogu se izvesti sljedeći zaključci:

Utvrđene su značajne korelacije između proučavanih indikatora.

1). Utvrđena je značajna inverzna korelacija između ispitivane osobine X 10 - produktivnost kapitala i faktorski atribut X 16 - promet nestandardizovanih obrtnih sredstava.

2). Između produktivnosti rada (Y 1) i odnos kapitala i rada (X 14) između produktivnosti rada (Y 1) i promet standardizovanih obrtnih sredstava ( X 15) postoji direktna veza.

3). Najjača veza postoji između pokazatelja učinka produktivnost rada (Y 1) i faktor pokazatelja omjer kapitala i rada (X 14), a označena veza je direktna.

Proračun parcijalnih koeficijenata korelacije. Poređenje parcijalnih i par koeficijenata korelacije.

Parcijalni koeficijenti korelacije karakterišu odnos između dve odabrane varijable isključujući uticaj drugih indikatora (tj. karakterišu „čistu” vezu samo između ovih karakteristika) i važni su za razumevanje interakcije čitavog skupa indikatora, jer omogućavaju utvrđivanje mehanizama jačanja i slabljenja uticaja varijabli jedne na drugu.

Parcijalni koeficijent (k-2)- red između varijabli, na primjer, između Y 1 I X 10, jednak:

,

Gdje R ij- algebarski komplement elementa r ij korelacione matrice R, jednako , Gdje M ij je sporedna determinanta matrice dobijene iz matrice R precrtavanjem ja- ta linija i j- th column.

11. Da biste izračunali parcijalne koeficijente korelacije, potrebno je da generišete odgovarajuće 4*4 matrice u Excel-u.

Na primjer, algebarski komplement od R 12 se izračunava brisanjem prvog reda i drugog stupca iz naše korelacijske matrice:

Y1 X10 X14 X15 X16
Y1 -0,02152 0,577299 0,334637 -0,2042
X10 -0,02152 -0,036036 0,153663 -0,34832
X14 0,577299 -0,03604 0,077981 -0,16676
X15 0,334637 0,153663 0,077981 -0,25017
X16 -0,2042 -0,34832 -0,166761 -0,25017
0,577299 0,334637 -0,2042
0,577299 0,077981 -0,16676
0,334637 0,077981 -0,25017
-0,2042 -0,166761 -0,25017

Da bismo pronašli determinante ovih matrica koristimo Excel funkciju: INSERT - Funkcija - Matematički - MOPRED(navedite odgovarajuću matricu varijabli kao niz). Koristeći funkciju dobijamo:

-(-0,05438)

0,786557

0,528443

Zamjenom vrijednosti u formulu, dobijamo = - 0,084348

Proračuni se vrše na sličan način za sve ostale parcijalne koeficijente korelacije:

R 13 =(-1) 1+3 * M 13 = - 0,42585 R 34 =(-1) 3+4 * M 34 = - (-0,1)

R 14 =(-1) 1+4 * M 14 = - 0,225305 R 35 =(-1) 3+5 * M 35 = 0,063223

R 15 =(-1) 1+5 * M 15 = 0,05218 R 45 =(-1) 4+5 * M 45 = - (-0,08965)

R 23 =(-1) 2+3 * M 23 = - (-0,02282) R 33 =(-1) 3+3 * M 33 = 0,702903

R 24 =(-1) 2+4 * M 24 = - 0,05483 R 44 =(-1) 4+4 * M 44 = 0,551944

R 25 =(-1) 2+5 * M 25 = - (-0,18526) R 55 =(-1) 5+5 * M 55 = 0,561651

r 13/245 = 0,572722 r 25/134 = - 0,340055

r 14/235 = 0,341947 r 34/125 = - 0,160548

r 15/234 = - 0,078507 r 35/124 = - 0,100622

r 23/145 = - 0,037443 r 45/123 = - 0,161016

r 24/135 = 0,101525


Kao rezultat, dobijamo matricu sledećeg oblika:

Tabela 6 Matrica parcijalnih koeficijenata korelacije proučavanih ekonomskih pokazatelja

Y1 X10 X14 X15 X16
Y1 - 0,084348 0,572722 0,341947 - 0,078507
X10 - 0,084348 - 0,037443 0,101525 - 0,340055
X14 0,572722 - 0,037443 - 0,160548 - 0,100622
X15 0,341947 0,101525 - 0,160548 - 0,161016
X16 - 0,078507 - 0,340055 - 0,100622 - 0,161016

Gdje l- red parcijalnog koeficijenta korelacije, koji se poklapa sa brojem fiksnih varijabli slučajnih varijabli (u našem slučaju l=3),

n- broj zapažanja.

Hajde da napravimo matricu posmatranih vrednosti t-statistika za sve koeficijente r ij:

Tabela 7

Matrica posmatranih vrednosti t-statistike za parcijalne koeficijente korelacije proučavanih ekonomskih pokazatelja

t obs. Y1 X10 X14 X15 X16
Y1
X10 -0,574122
X14 4,7385072 -0,254129
X15 2,4679682 0,692152 -1,103200
X16 -0,534109 -2,452522 -0,685933 -1,106502

Uočene vrijednosti t-statistika se mora porediti sa kritičnom vrednošću t cr, pronađeno za nivo značajnosti α =0,05 i broj stepeni slobode v=n-l-2.

Da bismo to učinili, koristimo ugrađenu statističku funkciju Excel STUDISPOBR, α =0,05 i broj stepeni slobode v=n-l-2=51-3-2=46.

13. Uporedimo izračunate vrijednosti sa kritičnim i odredimo koji su koeficijenti značajni. Dobijamo matricu parcijalnih koeficijenata korelacije sa odabranim značajnim koeficijentima:

Tabela 8

Matrica parcijalnih koeficijenata korelacije proučavanih indikatora sa isticanjem značajnih koeficijenata (na α=0,05)

Y1 X10 X14 X15 X16
Y1 -0,084348 0,572722 0,341947 -0,078507
X10 -0,084348 -0,037443 0,101525 -0,34006
X14 0,572722 -0,037443 -0,160548 -0,100622
X15 0,341947 0,101525 -0,160548 -0,161016
X16 -0,078507 -0,34006 -0,100622 -0,161016

14. Za značajne parcijalne koeficijente korelacije ćemo konstruisati sa datom pouzdanošću γ intervalna procjena r min< r < r тах koristeći Fisher Z-transformaciju (vidi formule u predavanju). Dobijamo sljedeći rezultat:

Tabela 9

Proračun intervala povjerenja za parcijalne opšte koeficijente korelacije proučavanih ekonomskih pokazatelja sa pouzdanošću γ = 0,95

r Z' Zmin Z max rmin r max
Y1X14 0,572722 0,651564 0,406564 0,896564 0,385551 0,714621
Y1X15 0,341947 0,356296 0,111296 0,601296 0,110838 0,537971
H10H16 -0,340055 -0,354155 -0,599155 -0,109155 -0,536448 -0,108723

15. Napravimo tabelu u kojoj upoređujemo uparene uzorke i parcijalne koeficijente korelacije za sve varijable.

Tabela 10

Tabela poređenja procjena uzoraka parnih i parcijalnih koeficijenata korelacije proučavanih indikatora sa isticanjem značajnih koeficijenata (pri α = 0,05)

Između varijable Koeficijent korelacije
dubl privatni
Y1X10 -0,0215248 -0,084348
Y1X14 0,5772995 0,572722
Y1X15 0,3346368 0,341947
Y1X16 -0,2042044 -0,078507
H10H14 -0,03604 -0,037443
H10H15 0,153663 0,101525
H10H16 -0,34832 -0,34006
H14H15 0,077981 -0,160548
H14H16 -0,166761 -0,100622
H15H16 -0,25017 -0,161016

Na osnovu dobijenih podataka mogu se izvesti sljedeći zaključci:

1. Značajne korelacije dobijene u fazi izračunavanja parnih koeficijenata korelacije potvrđene su prilikom izračunavanja parcijalnih koeficijenata korelacije. Istovremeno, identifikovani su sledeći mehanizmi uticaja varijabli jedne na druge: uočena je najbliža veza između proučavanih karakteristika. Y 1 – produktivnost rada i faktorske karakteristike X 14 - odnos kapitala i rada i X 15 - promet standardizovanog obrtnog kapitala (direktne zavisnosti) i između faktorskih karakteristika X 10 – kapitalna produktivnost i X 16 - promet nestandardizovanih obrtnih sredstava (obrnuti odnos).

2. Uticaj drugih varijabli, što je tipično za parcijalni koeficijent korelacije (za koeficijent korelacije u paru, razmatraju se samo dvije varijable bez drugih vanjskih), donekle slabi pozitivnu vezu između produktivnosti rada. (Y 1) i odnos kapitala i rada (X 14), jer vrijednost koeficijenta korelacije količnika r y 1 x 14 / x 10 x 15 x 16 = 0,573 manje od vrijednosti koeficijenta korelacije para r y 1 x 14 = 0,577.

3. Slična situacija je uočena i za povratnu informaciju između kapitalne produktivnosti ( X 10) I
promet nestandardizovanih obrtnih sredstava ( X 16) - isključujući uticaj drugih
varijabli apsolutna vrijednost (uzeta po modulu) koeficijenta korelacije para prelazi apsolutnu
vrijednost parcijalnog koeficijenta korelacije.

4. Za vezu između produktivnosti rada ( Y 1) i promet normiranih obrtnih sredstava (X 15) tipična je suprotna situacija: uticaj drugih varijabli pojačava ovaj odnos (vrijednost parcijalnog koeficijenta korelacije je veća od vrijednosti koeficijenta korelacije para).

5. Najjača veza identifikovana u fazi izračunavanja koeficijenata parne korelacije je
između produktivnosti rada (Y 1) i odnos kapitala i rada (X 14) ostaje najbliži i najznačajniji pri izračunavanju parcijalnih koeficijenata korelacije. Smjer odnosa između ovih indikatora, kao iu slučajevima sa druga dva značajna koeficijenta, isti je za parne i parcijalne koeficijente korelacije.

Proračun višestrukih koeficijenata korelacije

Višestruki koeficijenti korelacije služe kao mjera odnosa jedne varijable sa kombinovanim efektom svih ostalih indikatora.

16. Izračunajmo bodovne procjene višestrukih koeficijenata korelacije. Višestruki koeficijent korelacije, na primjer, za 1. indikator Y 1 izračunato po formuli:

gdje | R| - determinanta korelacione matrice R;

R ij - algebarski komplement elementa r ij korelacione matrice R.

Svi algebarski dodaci R ij pronađeni su ranije, u fazi izračunavanja parcijalnih koeficijenata korelacije, pa ostaje da se izračuna samo determinanta same korelacione matrice.

Da bismo pronašli determinantu korelacione matrice, koristićemo ugrađenu matematičku funkciju Excel MOPRED. Dobijamo |R|= 0,453494.

Zamjenom rezultirajuće vrijednosti determinante u formulu, dobivamo vrijednosti višestrukih koeficijenata korelacije:

= 0,650726

Višestruki koeficijent determinacije dobija se kvadriranjem koeficijenta korelacije.

17. Provjerimo značajnost dobijenih višestrukih koeficijenata korelacije i determinacije. Provjera se vrši pomoću F-kriterijumi:

Gdje k- broj faktora koji se razmatraju (u našem slučaju k = 5),

P - broj zapažanja.

Nakon izračunavanja dobijamo sledeću tabelu:

Tabela 11

Višestruki koeficijenti korelacije i određivanje proučavanih indikatora uz isticanje značajnih koeficijenata (na nivou značajnosti α = 0,05)

18. Da biste odredili značaj višestruke korelacije i koeficijenata determinacije, potrebno je pronaći kritičnu vrijednost F-distribucije za dati nivo značajnosti α i broj stepena slobode brojioca v1=k-1 i imenilac v2=n-k.

Za utvrđivanje F cr Koristimo ugrađenu Excel funkciju: INSERT - Funkcija - Statistički - BRŽE, unosom vjerovatnoće u dijaloški okvir funkcije α = 0,05 i broj stepena slobode v1=k-1=5-1=4 I v2=n-k=51-5-46.

Dobijamo F cr = 2,574033

Ako je uočena vrijednost F-statistika prelazi svoju kritičnu vrijednost, tada se odbacuje hipoteza da je odgovarajući koeficijent višestruke korelacije jednak nuli.

Stoga su u razmatranom primjeru značajni višestruki koeficijenti korelacije r y 1/ x10 x14 x15 x16, r x 14/ y1 x10 x15 x16, r x 16/ y1 x10 x14 x15. Višestruki koeficijenti korelacije r x 10/ y1 x14 x15 x16 i r x 15/ y1 x10 x14 x16 su beznačajni.

Rezultati analize nam omogućavaju da izvučemo sljedeće zaključke:

1. Koeficijent višestruke korelacije r y 1/ x10 x14 x15 x16 = 0,651 je značajan i ima prilično visoku vrijednost, što ukazuje da je indikator Y 1 – produktivnost rada je usko povezana sa višedimenzionalnim nizom faktorskih karakteristika X 10 - kapitalna produktivnost, X 14 - odnos kapitala i rada, X 15 - promet normiranih obrtnih sredstava i X 16 - promet nestandardizovanih obrtnih sredstava. Ovo daje osnovu za dalju regresijsku analizu.

2. Višestruki koeficijent determinacije r y 1/ x10 x14 x15 x16 2 = 0,423 pokazuje da 42,3% udjela varijanse Y 1 – produktivnost rada određena je promjenama faktorskih karakteristika.

3. Faktorske karakteristike X 14 - odnos kapitala i rada i X 16 - Obrt nestandardizovanih obrtnih sredstava takođe ima značajne vrednosti višestrukih koeficijenata korelacije i determinacije, što ukazuje na njihovu prilično jaku povezanost sa karakteristikama koje se razmatraju. Međutim, iako višestruki faktorski koeficijenti X 16 i značajne su, ali samo 19,3% udjela njegove varijanse je posljedica promjena varijabli uključenih u model koji se razmatra, a shodno tome, 80,7% njegove varijanse je posljedica utjecaja drugih faktora koji nisu uključeni u model .

4. Rezultati korelacione analize su pokazali da indikator Y 1 – produktivnost rada, ima blisku vezu sa višedimenzionalnim nizom faktorskih karakteristika, omogućava nam da pređemo na drugu fazu statističkog istraživanja – izgradnju regresijskog modela.

Nastavak teme:
U redu

Izvanredna ličnost Ruske Federacije, German Gref je istaknuta državna ličnost, predsjednik Sberbanke Ruske Federacije i bivši ministar ekonomije i...