Koeficijent korelacije. Pearsonov test korelacije Što je koeficijent korelacije bliži 1

Ovo je vrijednost koja može varirati od +1 do -1. U slučaju potpune pozitivne korelacije, ovaj koeficijent je jednak plus 1 (kažu da se povećanjem vrijednosti jedne varijable povećava vrijednost druge varijable), a sa potpunom negativnom - minus 1 (navesti povratne informacije, tj. Kako se vrijednost jedne varijable povećava, vrijednost druge opada.)

Grafikon zavisnosti stidljivosti i depresije. Kao što vidite, tačke (subjekti) nisu raspoređene nasumično, već se poređaju oko jedne linije, i, gledajući ovu liniju, možemo reći da što je stidljivost veća kod osobe, to su depresivnije, tj. ove pojave. su međusobno povezani.

Primjer 2: Grafikon stidljivosti i društvenosti. Vidimo da kako stidljivost raste, društvenost se smanjuje. Njihov koeficijent korelacije je 0,43. Dakle, koeficijent korelacije veći od 0 do 1 ukazuje na direktno proporcionalnu vezu (što više ... više ...), a koeficijent od -1 do 0 označava obrnuto proporcionalnu vezu (što više ... to manje . ..)

Ako je koeficijent korelacije 0, obje varijable su potpuno nezavisne jedna od druge.

korelacija- ovo je odnos u kojem se uticaj pojedinačnih faktora javlja samo kao trend (u prosjeku) uz masovno posmatranje stvarnih podataka. Primeri korelacione zavisnosti mogu biti zavisnost između veličine aktive banke i visine dobiti banke, rasta produktivnosti rada i radnog staža.

Koriste se dva sistema klasifikacije korelacija prema njihovoj snazi: opšti i partikularni.

Opća klasifikacija korelacija:

1) jaka ili bliska sa koeficijentom korelacije r > 0,70;

2) prosjek 0,50< r < 0,69;

3) umjeren na 0,30< r < 0,49;

4) slab na 0,20< r < 0,29;5) очень слабая при r < 0,19.

Privatna klasifikacija korelacija:

1) visoka značajna korelacija na r koja odgovara nivou statističke značajnosti ρ ≤ 0,01

2) značajna korelacija na r koja odgovara nivou statističke značajnosti ρ ≤ 0,05;

3) trend značajnog odnosa na r koji odgovara nivou statističke značajnosti ρ ≤ 0,10;

4) beznačajna korelacija kod r koja ne dostiže nivo statističke značajnosti. Ove dvije klasifikacije se ne podudaraju.

Prvi je fokusiran samo na vrijednost koeficijenta korelacije, a drugi određuje koji nivo značajnosti dostiže data vrijednost koeficijenta korelacije za datu veličinu uzorka. Što je veličina uzorka veća, to je manja vrijednost koeficijenta korelacije dovoljna da se korelacija prepozna kao pouzdana. Kao rezultat toga, uz malu veličinu uzorka, može se ispostaviti da je jaka korelacija nepouzdana. U isto vrijeme, s velikim veličinama uzorka, čak i slaba korelacija može biti značajna. Obično je prihvaćeno fokusiranje na drugu klasifikaciju, budući da ona uzima u obzir veličinu uzorka. Međutim, mora se imati na umu da je jaka ili visoka korelacija korelacija sa r > 0,70, a ne samo korelacija. visoki nivo značaj.


U sljedećoj tabeli navedeni su nazivi koeficijenata korelacije za razne vrste vage.

Dihotomna skala (1/0) Rang (redna) skala
Dihotomna skala (1/0) Pearsonov koeficijent asocijacije, Pearsonov koeficijent konjugacije četiri ćelije. Biserijska korelacija
Rang (redna) skala Rang-biserijska korelacija. Spearmanov ili Kendallov koeficijent korelacije ranga.
Interval i apsolutna skala Biserijska korelacija Vrijednosti skale intervala se pretvaraju u rangove i koristi se koeficijent ranga Pearsonov koeficijent korelacije (linearni koeficijent korelacije)

At r= 0 nema linearne korelacije. U ovom slučaju, srednje vrijednosti grupe varijabli poklapaju se sa njihovim općim srednjim vrijednostima, a linije regresije su paralelne sa koordinatnim osa.

Jednakost r= 0 govori samo o odsustvu linearne korelacione zavisnosti (nekorelisane varijable), ali ne uopšte o odsustvu korelacije, a još više, statističke zavisnosti.

Ponekad je zaključak da nema korelacije važniji od prisustva jake korelacije. Nulta korelacija dve varijable može ukazivati ​​na to da nema uticaja jedne varijable na drugu, pod uslovom da verujemo rezultatima merenja.

U SPSS-u: 11.3.2 Koeficijenti korelacije

Do sada smo saznali samo samu činjenicu postojanja statističke veze između dvije karakteristike. Zatim ćemo pokušati saznati koji se zaključci mogu izvući o snazi ​​ili slabosti ove zavisnosti, kao io njenom obliku i smjeru. Kriterijumi za kvantifikaciju odnosa između varijabli nazivaju se koeficijenti korelacije ili mjere povezanosti. Dvije varijable su u pozitivnoj korelaciji ako između njih postoji direktna, jednosmjerna veza. U jednosmjernom odnosu, male vrijednosti jedne varijable odgovaraju malim vrijednostima druge varijable, velike vrijednosti odgovaraju velikim. Dvije varijable su u negativnoj korelaciji ako između njih postoji inverzna veza. Sa višesmjernim odnosom, male vrijednosti jedne varijable odgovaraju velikim vrijednostima druge varijable i obrnuto. Vrijednosti koeficijenata korelacije su uvijek u rasponu od -1 do +1.

Kao koeficijent korelacije između varijabli koje pripadaju ordinalnoj skali koristi se Spearmanov koeficijent, a za varijable koje pripadaju intervalnoj skali, Pirsonov koeficijent korelacije (moment proizvoda). U ovom slučaju treba napomenuti da se svaka dihotomna varijabla, odnosno varijabla koja pripada nominalnoj skali i ima dvije kategorije, može smatrati ordinalnom.

Prvo ćemo provjeriti postoji li korelacija između varijabli spola i psihe iz datoteke studium.sav. Pri tome vodimo računa da se dihotomna varijabla spol može smatrati ordinalnom varijablom.

Uradite sljedeće:

· Izaberite iz komandnog menija Analiza (Analiza) Deskriptivna statistika (Deskriptivna statistika) Unakrsne tabele. (Tabele za nepredviđene situacije)

· Premjestite varijablu spol na listu redova, a varijablu psihu na listu kolona.

· Kliknite na dugme Statistika.... U dijalogu Crosstabs: Statistics, označite polje Korelacije. Potvrdite svoj izbor dugmetom Nastavi.

· U dijalogu Crosstabs, zaustavite prikazivanje tabela tako što ćete označiti polje za potvrdu Supress tables. Kliknite na dugme OK.

Prilikom studiranja korelacije pokušajte utvrditi postoji li veza između dva indikatora u istom uzorku (na primjer, između visine i težine djece ili između nivoa IQ i školski uspjeh) ili između dva različita uzorka (na primjer, kada se porede parovi blizanaca), i ako taj odnos postoji, da li je povećanje jednog indikatora praćeno povećanjem (pozitivna korelacija) ili smanjenjem (negativna korelacija) ostalo.

Drugim riječima, korelacijska analiza pomaže da se utvrdi da li je moguće predvidjeti moguće vrijednosti jednog indikatora, znajući vrijednost drugog.

Do sada, kada smo analizirali rezultate našeg iskustva u proučavanju efekata marihuane, namjerno smo ignorirali takav pokazatelj kao što je vrijeme reakcije. U međuvremenu, bilo bi zanimljivo provjeriti postoji li veza između efikasnosti reakcija i njihove brzine. To bi, na primjer, omogućilo da se tvrdi da što je osoba sporija, to će njene akcije biti tačnije i djelotvornije i obrnuto.

U tu svrhu mogu se koristiti dvije različite metode: parametarska metoda za izračunavanje Bravais-Pearsonovog koeficijenta (r) i izračunavanje koeficijenta korelacije Spearmanovih rangova (r s ), koji se odnosi na redne podatke, tj. nije parametarski. Međutim, hajde da prvo shvatimo šta je koeficijent korelacije.

Koeficijent korelacije

Koeficijent korelacije je vrijednost koja može varirati od -1 do 1. U slučaju potpune pozitivne korelacije, ovaj koeficijent je plus 1, a sa potpunom negativnom - minus 1. Na grafikonu to odgovara pravolinijskom prolazu kroz tačke preseka vrednosti svakog para podataka:

Varijabilna

Ako se ove tačke ne poredaju u pravu liniju, već formiraju "oblak", apsolutna vrijednost koeficijenta korelacije postaje manja od jedan i približava se nuli kako se oblak zaokružuje:

Ako je koeficijent korelacije 0, obje varijable su potpuno nezavisne jedna od druge.

U humanističkim naukama korelacija se smatra jakom ako je njen koeficijent veći od 0,60; ako prelazi 0,90, tada se korelacija smatra veoma jakom. Međutim, da bi se mogli izvući zaključci o odnosima između varijabli, veličina uzorka je od velike važnosti: što je uzorak veći, to je pouzdanija vrijednost dobijenog koeficijenta korelacije. Postoje tablice s kritičnim vrijednostima koeficijenata korelacije Bravais-Pearson i Spearman za različit broj stupnjeva slobode (jednako je broju parova minus 2, tj. n-2). Samo ako su koeficijenti korelacije veći od ovih kritičnih vrijednosti mogu se smatrati pouzdanim. Dakle, da bi koeficijent korelacije od 0,70 bio pouzdan, u analizu treba uzeti najmanje 8 parova podataka ( = P - 2 = 6) prilikom obračuna r(Tabela B.4) i 7 parova podataka (= n - 2 = 5) prilikom izračunavanja r s (Tabela 5 u Dodatku B. 5).

Bravais–Pearsonov koeficijent

Za izračunavanje ovog koeficijenta koristi se sljedeća formula (može izgledati drugačije za različite autore):

gdje je  XY je zbir proizvoda podataka iz svakog para;

n - broj parova;

- prosjek za varijabilne podatke X;

Prosjek za varijabilne podatke Y;

S X - x;

s Y - standardna devijacija za distribuciju y.

Sada možemo koristiti ovaj koeficijent da odredimo postoji li veza između vremena reakcije ispitanika i efikasnosti njihovih akcija. Uzmimo, na primjer, nivo pozadine kontrolne grupe.

n= 15  15,8  13,4 = 3175,8;

(n 1)S x S y = 14  3,07  2,29 = 98,42;

r =

Negativna vrijednost koeficijenta korelacije može značiti da što je duže vrijeme reakcije, to je niža efikasnost. Međutim, njegova vrijednost je premala da bi se moglo govoriti o značajnom odnosu između ove dvije varijable.

nXY=………

(n- 1)S X S Y = ……

Kakav zaključak se može izvući iz ovih rezultata? Ako mislite da postoji veza između varijabli, šta je to - direktna ili obrnuta? Da li je pouzdan [usp. tab. 4 (u Dodatku B. 5) sa kritičnim vrijednostima r]?

Koeficijent korelacije Spearmanovog rangar s

Ovaj koeficijent je lakše izračunati, ali rezultati su manje tačni od korištenja r. To je zbog činjenice da se pri izračunavanju Spearmanovog koeficijenta koristi redoslijed podataka, a ne njihove kvantitativne karakteristike i intervali između klasa.

Poenta je da kada se koristi koeficijent korelacije ranga Spearman(r s ) oni samo provjeravaju da li će rangiranje podataka za neki uzorak biti isto kao i u nizu drugih podataka za ovaj uzorak uparen s prvim (na primjer, da li će učenici biti jednako "rangirani" kada polože i psihologiju i matematiku, ili čak i sa dva različita profesora psihologije?). Ako je koeficijent blizu + 1, onda to znači da se oba niza praktički poklapaju, a ako je ovaj koeficijent blizu - 1, možemo govoriti o potpunom inverznom odnosu.

Koeficijent r s izračunato prema formuli

gdje d- razlika između rangova vrijednosti konjugiranih karakteristika (bez obzira na njegov znak), i n- broj parova.

Obično se ovaj neparametarski test koristi u slučajevima kada trebate izvući neke zaključke ne toliko o tome intervalima između podataka, koliko o njima činovi, kao i kada su krive distribucije previše asimetrične i ne dozvoljavaju korištenje parametarskih kriterija kao što je koeficijent r(u tim slučajevima može biti potrebno konvertovati kvantitativne podatke u redne podatke).

Budući da je to slučaj sa distribucijom vrijednosti efikasnosti i vremena reakcije u eksperimentalnoj grupi nakon izlaganja, možete ponoviti proračune koje ste već uradili za ovu grupu, samo sada ne za koeficijent r, i za indikator r s . Ovo će vam omogućiti da vidite koliko su ova dva indikatora različita*.

* Treba to zapamtiti

1) po broju pogodaka, rang 1 odgovara najvećoj, a rang 15 najnižoj izvedbi, dok za vrijeme reakcije rang 1 odgovara najkraćem vremenu, a rang 15 najdužem;

2) ex aequo podacima se daje prosječan rang.

Dakle, kao iu slučaju koeficijenta r, dobio pozitivan, iako nepouzdan rezultat. Koji je od ova dva rezultata vjerodostojniji: r=-0,48 ili r s = +0,24? Takvo pitanje može se postaviti samo ako su rezultati pouzdani.

Još jednom želim da naglasim da je suština ova dva koeficijenta nešto drugačija. Negativan koeficijent r ukazuje da je efikasnost najčešće što je veća, što je brže vreme reakcije, dok pri izračunavanju koeficijenta r s bilo je potrebno provjeriti da li brži subjekti uvijek tačnije, a sporiji manje tačnije.

Budući da je u eksperimentalnoj grupi nakon izlaganja dobijen koeficijent r s , jednak 0,24, takav trend se očigledno ovdje ne prati. Pokušajte da sami shvatite smisao podataka za kontrolnu grupu nakon izlaganja, znajući da  d 2 = 122,5:

; je li pouzdan?

Koji je vaš zaključak?……………………………………………………………………………………………………………

…………………………………………………………………………………………………………………….

Dakle, razmotrili smo različite parametarske i neparametarske statističke metode koje se koriste u psihologiji. Naš pregled je bio vrlo površan, a glavni zadatak mu je bio da čitatelju natjera da shvati da statistika nije toliko strašna kako se čini i da zahtijeva uglavnom zdrav razum. Podsjećamo da su podaci o "iskustvu" kojima smo se ovdje bavili fiktivni i ne mogu poslužiti kao osnova za bilo kakve zaključke. Međutim, takav eksperiment bi bio vrijedan izvođenja. Budući da je za ovaj eksperiment odabrana čisto klasična tehnika, ista statistička analiza mogla bi se koristiti u mnogim različitim eksperimentima. U svakom slučaju, čini nam se da smo zacrtali neke glavne pravce koji bi mogli biti korisni onima koji ne znaju odakle početi statističku analizu rezultata.

Postoje tri glavne grane statistike: deskriptivna statistika, induktivna statistika i analiza korelacije.

Koeficijent korelacije je stepen povezanosti između dvije varijable. Njegov izračun daje ideju o tome postoji li veza između dva skupa podataka. Za razliku od regresije, korelacija ne dozvoljava predviđanje vrijednosti. Međutim, izračunavanje koeficijenta je važan korak u preliminarnoj fazi Statistička analiza. Na primjer, utvrdili smo da je koeficijent korelacije između nivoa direktnih stranih investicija i rasta BDP-a visok. To nam daje ideju da je za osiguranje prosperiteta potrebno stvoriti povoljnu klimu za strane poduzetnike. Na prvi pogled ne tako očigledan zaključak!

Korelacija i uzročnost

Možda ne postoji niti jedna oblast statistike koja bi bila tako čvrsto uspostavljena u našim životima. Koeficijent korelacije se koristi u svim oblastima javnog znanja. Njegova glavna opasnost leži u činjenici da se često nagađa o njegovim visokim vrijednostima kako bi se ljudi uvjerili i natjerali da povjeruju u neke zaključke. Međutim, u stvari, jaka korelacija uopće ne ukazuje na uzročnu vezu između količina.

Koeficijent korelacije: Pirsonova i Spirmanova formula

Postoji nekoliko glavnih indikatora koji karakterišu odnos između dvije varijable. Istorijski gledano, prvi je Pirsonov koeficijent linearne korelacije. Polaže se u školi. Razvili su ga K. Pearson i J. Yule na osnovu rada Fr. Galton. Ovaj omjer vam omogućava da vidite odnos između racionalni brojevi koje se menjaju racionalno. Uvijek je veći od -1 i manji od 1. Negativan broj ukazuje na obrnuto proporcionalnu vezu. Ako je koeficijent jednak nuli, onda nema veze između varijabli. Gavran pozitivan broj- postoji direktno proporcionalna veza između proučavanih veličina. Spearmanov koeficijent korelacije ranga omogućava pojednostavljenje proračuna konstruiranjem hijerarhije varijabilnih vrijednosti.

Odnosi između varijabli

Korelacija pomaže da se odgovori na dva pitanja. Prvo, da li je odnos između varijabli pozitivan ili negativan. Drugo, koliko je jaka ovisnost. Korelaciona analiza je moćan alat pomoću kojeg to možete dobiti važna informacija. Lako je uočiti da prihodi i rashodi domaćinstava rastu i padaju proporcionalno. Takav odnos se smatra pozitivnim. Naprotiv, kada cijena proizvoda raste, potražnja za njim opada. Takav odnos se naziva negativnim. Vrijednosti koeficijenta korelacije su između -1 i 1. Nula znači da nema veze između proučavanih vrijednosti. Što je indikator bliži ekstremnim vrijednostima, to je jača veza (negativna ili pozitivna). O odsustvu zavisnosti svjedoči koeficijent od -0,1 do 0,1. Mora se shvatiti da takva vrijednost samo ukazuje na odsustvo linearnog odnosa.

Karakteristike aplikacije

Upotreba oba indikatora podliježe određenim pretpostavkama. Prvo, prisustvo jake veze ne određuje činjenicu da jedna vrijednost određuje drugu. Možda postoji treća veličina koja definira svaku od njih. Drugo, visok Pirsonov koeficijent korelacije ne ukazuje na uzročnu vezu između proučavanih varijabli. Treće, pokazuje isključivo linearna zavisnost. Korelacija se može koristiti za procjenu značajnih kvantitativnih podataka (na primjer, atmosferski pritisak, temperatura zraka), a ne kategorije kao što su spol ili omiljena boja.

Višestruki koeficijent korelacije

Pearson i Spearman su istraživali odnos između dvije varijable. Ali šta učiniti ako ih ima tri ili čak više. Ovdje dolazi do izražaja koeficijent višestruke korelacije. Na primjer, na bruto nacionalni proizvod utiču ne samo direktne strane investicije, već i monetarna i fiskalna politika države, kao i nivo izvoza. Stopa rasta i obim BDP-a rezultat su interakcije brojnih faktora. Međutim, treba shvatiti da se model višestruke korelacije zasniva na brojnim pojednostavljenjima i pretpostavkama. Prvo, multikolinearnost između veličina je isključena. Drugo, pretpostavlja se da je odnos između zavisne varijable i varijabli koje utiču na nju linearan.

Oblasti upotrebe korelacione i regresione analize

Ova metoda pronalaženja odnosa između veličina se široko koristi u statistici. Najčešće se pribjegava u tri glavna slučaja:

  1. Za testiranje uzročno-posledičnih veza između vrijednosti dvije varijable. Kao rezultat toga, istraživač se nada da će pronaći linearni odnos i izvesti formulu koja opisuje ove odnose između veličina. Njihove mjerne jedinice mogu biti različite.
  2. Za provjeru odnosa između vrijednosti. U ovom slučaju, niko ne određuje koja je varijabla zavisna. Može se ispostaviti da vrijednost obje veličine određuje neki drugi faktor.
  3. Da izvedemo jednačinu. U ovom slučaju, možete jednostavno zamijeniti brojeve u njega i saznati vrijednosti nepoznate varijable.

Muškarac u potrazi za uzročno-posledičnom vezom

Svijest je tako uređena da svakako moramo objasniti događaje koji se dešavaju okolo. Čovjek uvijek traži vezu između slike svijeta u kojem živi i informacija koje prima. Često mozak stvara red iz haosa. On lako može uočiti uzročno-posledične veze tamo gdje ih nema. Naučnici moraju posebno naučiti da prevladaju ovaj trend. Sposobnost evaluacije odnosa između podataka objektivno je neophodna u akademskoj karijeri.

Medijska pristrasnost

Razmotrite kako se prisustvo korelacije može pogrešno protumačiti. Grupa britanskih studenata lošeg ponašanja upitana je da li njihovi roditelji puše. Zatim je test objavljen u novinama. Rezultat je pokazao snažnu korelaciju između pušenja roditelja i delinkvencije njihove djece. Profesor koji je vodio ovu studiju čak je predložio da se o tome stavi upozorenje na kutijama cigareta. Međutim, postoji cela linija problema sa ovim zaključkom. Prvo, korelacija ne pokazuje koja je od veličina nezavisna. Stoga je sasvim moguće pretpostaviti da je pogubna navika roditelja uzrokovana neposlušnošću djece. Drugo, nemoguće je sa sigurnošću reći da oba problema nisu nastala zbog nekog trećeg faktora. Na primjer, porodice sa niskim primanjima. Treba napomenuti emocionalni aspekt početni nalazi profesora koji je vodio studiju. Bio je vatreni protivnik pušenja. Stoga ne čudi što je na ovaj način tumačio rezultate svog istraživanja.

zaključci

Pogrešno tumačenje korelacije kao uzročne veze između dvije varijable može dovesti do neugodnih grešaka u istraživanju. Problem je u tome što je to u srži ljudska svijest. Mnogi marketinški trikovi temelje se na ovoj osobini. Razumijevanje razlike između uzročnosti i korelacije omogućava vam da racionalno analizirate informacije kao u Svakodnevni život kao iu profesionalnim karijerama.


Koeficijenti korelacije

Do sada smo saznali samo samu činjenicu postojanja statističke veze između dvije karakteristike. Zatim ćemo pokušati saznati koji se zaključci mogu izvući o snazi ​​ili slabosti ove zavisnosti, kao io njenom obliku i smjeru. Kriterijumi za kvantifikaciju odnosa između varijabli nazivaju se koeficijenti korelacije ili mjere povezanosti. Dvije varijable su u pozitivnoj korelaciji ako između njih postoji direktna, jednosmjerna veza. U jednosmjernom odnosu, male vrijednosti jedne varijable odgovaraju malim vrijednostima druge varijable, velike vrijednosti odgovaraju velikim. Dvije varijable su u negativnoj korelaciji ako između njih postoji inverzna veza. Sa višesmjernim odnosom, male vrijednosti jedne varijable odgovaraju velikim vrijednostima druge varijable i obrnuto. Vrijednosti koeficijenata korelacije su uvijek u rasponu od -1 do +1.

Kao koeficijent korelacije između varijabli koje pripadaju redni primijenjena skala Spearmanov koeficijent, i za varijable koje pripadaju interval skala - Pearsonov koeficijent korelacije(trenutak radova). Treba napomenuti da se svaka dihotomna varijabla, odnosno varijabla koja pripada nominalnoj skali i ima dvije kategorije, može smatrati kao redni.

Prvo ćemo provjeriti postoji li korelacija između varijabli spola i psihe iz datoteke studium.sav. U ovom slučaju, dihotomna varijabla sex može se smatrati ordinalnim. Uradite sljedeće:

    Izaberite iz komandnog menija Analiza (Analiza) Deskriptivna statistika (Deskriptivna statistika) Unakrsne tabele... (Tabele kontingentnosti)

    Premjesti varijablu sex na listu stringova i varijablu psiha- na listu kolona.

    Kliknite na dugme Statistika... (Statistika). U dijalogu Crosstabs: Statistics, označite polje Korelacije. Potvrdite svoj izbor dugmetom Nastavi.

    U dijalogu unakrsne tabele Zaustavite prikazivanje tabela tako što ćete potvrditi izbor u polju za potvrdu Suzbiti tabele. Kliknite na dugme OK.

Izračunat će se Spearman i Pearson koeficijenti korelacije, a njihova će se značajnost testirati:

Simetrične mjere

vrijednost Asympt. Std. Greška(a) (Asimptotska standardna greška) Pribl. T (b) (Približno T) Pribl. Sig. (približan značaj)
Interval po intervalu (Interval - interval) Pearson's R
(R Pearson)
,441 ,081 5,006 .000 (s)
Ordinal po rednom (Ordinal - Ordinal) Spearmanova korelacija (Spearmanova korelacija) ,439 ,083 4,987 .000 (s)
N važećih slučajeva 106

Budući da ovdje nema intervalno skaliranih varijabli, razmotrit ćemo Spearmanov koeficijent korelacije. Ona iznosi 0,439 i najznačajnija je (str<0,001).

Sljedeća tabela se koristi za verbalno opisivanje vrijednosti koeficijenta korelacije:

Na osnovu gornje tabele mogu se izvesti sljedeći zaključci: Postoji slaba korelacija između varijabli spol i psiha (zaključak o jačini zavisnosti), varijable koreliraju pozitivno (zaključak o smjeru zavisnosti).

U varijabli psihe, manje vrijednosti odgovaraju negativnom mentalnom stanju, a veće vrijednosti odgovaraju pozitivnom. U varijabli spola, zauzvrat, vrijednost "1" odgovara ženskom rodu, a "2" - muškom.

Shodno tome, jednosmjerni odnos se može tumačiti na sljedeći način: studentice negativno procjenjuju svoje psihičko stanje od kolega ili, najvjerovatnije, češće pristaju na takvu ocjenu prilikom sprovođenja ankete. imajte na umu da korelacija između dvije osobine nije nužno ista kao njihova funkcionalna ili uzročna veza, pogledajte odjeljak 15.3 za više o tome.

Sada provjerimo korelaciju između alter i semestarskih varijabli. Primijenimo gore opisanu metodu. Dobićemo sledeće koeficijente:

Simetrične mjere

Asympt. Std. greška(a)

Interval po interval

Ordinal od Ordinal

Spearmanova korelacija

N važećih slučajeva

a. Ne pretpostavljajući nultu hipotezu (Nulta hipoteza nije prihvaćena).

e. Korištenje asimptotske standardne greške uz pretpostavku nulte hipoteze.

od. Zasnovano na normalnoj aproksimaciji.

Budući da su alter i semestar metričke varijable, razmotrićemo Pearsonov koeficijent (moment proizvoda). To je 0,807. Postoji jaka korelacija između alter i semestarskih varijabli. Varijable su u pozitivnoj korelaciji. Shodno tome, stariji studenti uče na višim kursevima, što, zapravo, nije neočekivan zaključak.

Provjerimo varijable sozial (procjena društvenog položaja) i psiha na korelaciju. Dobićemo sledeće koeficijente:

Simetrične mjere

Asympt. Std. greška(a)

Interval po interval

Ordinal od Ordinal

Spearmanova korelacija

N važećih slučajeva

a. Ne pretpostavljajući nultu hipotezu (Nulta hipoteza nije prihvaćena).

b. Korištenje asimptotske standardne greške uz pretpostavku nulte hipoteze.

od. Zasnovano na normalnoj aproksimaciji.

U ovom slučaju ćemo uzeti u obzir Spearmanov koeficijent korelacije; iznosi -0,703. Postoji umjerena do jaka korelacija između socijalne i psihe (granična vrijednost 0,7). Varijable su u negativnoj korelaciji, odnosno što je veća vrijednost prve varijable, to je niža vrijednost druge i obrnuto. Budući da male vrijednosti varijable sozial karakteriziraju pozitivno stanje (1 = vrlo dobro, 2 = dobro), a velike vrijednosti psihe karakteriziraju negativno stanje (1 = ekstremno nestabilno, 2 = nestabilno), stoga se javljaju psihičke poteškoće uglavnom zbog društvenih problema.

NASTAVNI RAD

Tema: Korelaciona analiza

Uvod

1. Analiza korelacije

1.1 Koncept korelacije

1.2 Opća klasifikacija korelacija

1.3 Korelaciona polja i svrha njihove konstrukcije

1.4 Faze korelacione analize

1.5 Koeficijenti korelacije

1.6 Normalizovani Bravais-Pearson koeficijent korelacije

1.7 Spearmanov koeficijent korelacije ranga

1.8 Osnovna svojstva koeficijenata korelacije

1.9 Provjera značajnosti koeficijenata korelacije

1.10 Kritične vrijednosti koeficijenta korelacije para

2. Planiranje multivarijatnog eksperimenta

2.1 Stanje problema

2.2 Određivanje centra plana (glavni nivo) i nivoa varijacije faktora

2.3 Izgradnja matrice planiranja

2.4 Provjera homogenosti disperzije i jednake tačnosti mjerenja u različitim serijama

2.5 Koeficijenti regresione jednadžbe

2.6 Disperzija reproduktivnosti

2.7 Provjera značajnosti koeficijenata regresione jednačine

2.8 Provjera adekvatnosti jednačine regresije

Zaključak

Bibliografija

UVOD

Planiranje eksperimenta je matematičko-statistička disciplina koja proučava metode racionalne organizacije eksperimentalnog istraživanja - od optimalnog izbora proučavanih faktora i utvrđivanja stvarnog plana eksperimenta u skladu sa njegovom svrhom do metoda za analizu rezultata. Početak planiranja eksperimenata postavili su radovi engleskog statističara R. Fišera (1935), koji je naglasio da racionalno planiranje eksperimenata daje ne manje značajan dobitak u tačnosti procjena od optimalne obrade rezultata mjerenja. Šezdesetih godina 20. stoljeća pojavila se moderna teorija planiranja eksperimenata. Njegove metode su usko povezane sa teorijom aproksimacije funkcija i matematičkim programiranjem. Izrađuju se optimalni planovi i istražuju njihova svojstva za široku klasu modela.

Planiranje eksperimenta je izbor plana eksperimenta koji ispunjava navedene zahtjeve, skup radnji usmjerenih na razvoj strategije eksperimentiranja (od dobijanja a priori informacija do dobijanja izvodljivog matematičkog modela ili određivanja optimalnih uslova). Ovo je svrsishodna kontrola eksperimenta, sprovedena u uslovima nepotpunog poznavanja mehanizma fenomena koji se proučava.

U procesu mjerenja, naknadne obrade podataka, kao i formalizacije rezultata u obliku matematičkog modela, dolazi do grešaka i gubi se dio informacija sadržanih u originalnim podacima. Upotreba metoda planiranja eksperimenata omogućava određivanje greške matematičkog modela i procjenu njegove adekvatnosti. Ako je tačnost modela nedovoljna, tada korištenje metoda planiranja eksperimenata omogućava modernizaciju matematičkog modela dodatnim eksperimentima bez gubitka prethodnih informacija i uz minimalne troškove.

Svrha planiranja eksperimenta je pronaći takve uslove i pravila za izvođenje eksperimenata pod kojima je moguće dobiti pouzdane i pouzdane informacije o objektu uz najmanje troškove rada, kao i predstaviti ove informacije u kompaktnom i prikladnom obliku s kvantitativnim procjena tačnosti.

Među glavnim metodama planiranja koje se koriste u različitim fazama studije, koriste se sljedeće:

Planiranje skrining eksperimenta, čije je glavno značenje odabir grupe značajnih faktora iz ukupnosti faktora koji su predmet daljeg detaljnog proučavanja;

Dizajniranje eksperimenta za analizu varijanse, tj. izrada planova objekata sa kvalitativnim faktorima;

Planiranje regresijskog eksperimenta koji vam omogućava da dobijete regresijske modele (polinomske i druge);

Planiranje ekstremnog eksperimenta, u kojem je glavni zadatak eksperimentalna optimizacija predmeta proučavanja;

Planiranje u proučavanju dinamičkih procesa itd.

Svrha izučavanja discipline je osposobljavanje studenata za proizvodno-tehničke aktivnosti u specijalnosti korištenjem metoda teorije planiranja i savremenih informacionih tehnologija.

Ciljevi discipline: proučavanje savremenih metoda planiranja, organizovanja i optimizacije naučnih i industrijskih eksperimenata, izvođenja eksperimenata i obrade rezultata.

1. KORELACIONA ANALIZA

1.1 Koncept korelacije

Istraživača često zanima kako su dvije ili više varijabli međusobno povezane u jednom ili više proučavanih uzoraka. Na primjer, može li visina utjecati na težinu osobe ili pritisak može utjecati na kvalitetu proizvoda?

Ova vrsta odnosa između varijabli naziva se korelacija ili korelacija. Korelacija je konzistentna promjena u dvije karakteristike, koja odražava činjenicu da je varijabilnost jedne karakteristike u skladu sa varijabilnosti druge.

Poznato je, na primjer, da u prosjeku postoji pozitivan odnos između visine ljudi i njihove težine, i to takav da što je visina veća, to je veća težina osobe. Međutim, postoje izuzeci od ovog pravila kada relativno niski ljudi imaju prekomjernu tjelesnu težinu, a, obrnuto, astenici, s visokim rastom, su lagani. Razlog za takva isključenja je što je svaka biološka, ​​fiziološka ili psihološka osobina određena utjecajem mnogih faktora: okolišnih, genetskih, društvenih, ekoloških itd.

Korelacije su probabilističke promjene koje se mogu proučavati samo na reprezentativnim uzorcima metodama matematičke statistike. Oba termina - korelacija i korelacija - često se koriste naizmjenično. Zavisnost znači uticaj, povezanost - bilo koje koordinirane promene koje se mogu objasniti stotinama razloga. Korelacije se ne mogu smatrati dokazom uzročne veze, one samo ukazuju na to da su promjene u jednom svojstvu, po pravilu, praćene određenim promjenama u drugom.

Korelaciona zavisnost - To su promjene koje vrijednosti jedne karakteristike čine u vjerovatnoći pojavljivanja različitih vrijednosti druge karakteristike.

Zadatak korelacione analize svodi se na utvrđivanje pravca (pozitivnog ili negativnog) i oblika (linearnog, nelinearnog) odnosa između različitih karakteristika, merenje njegove čvrstoće i, konačno, proveru nivoa značajnosti dobijenih koeficijenata korelacije. .

Korelacije se razlikuju po obliku, smjeru i stupnju (snazi) .

Oblik korelacije može biti pravolinijski ili krivolinijski. Na primjer, odnos između broja treninga na simulatoru i broja ispravno riješenih problema u kontrolnoj sesiji može biti jednostavan. Krivolinijski može biti, na primjer, odnos između nivoa motivacije i efektivnosti zadatka (slika 1). Sa povećanjem motivacije prvo raste efikasnost zadatka, zatim se postiže optimalni nivo motivacije, koji odgovara maksimalnoj efikasnosti zadatka; dalje povećanje motivacije je praćeno smanjenjem efikasnosti.

Slika 1 – Odnos između efektivnosti rješavanja problema i snage motivacijske tendencije

U pravcu, korelacija može biti pozitivna („direktna“) i negativna („obrnuta“). Sa pozitivnom pravolinijskom korelacijom, veće vrijednosti jednog atributa odgovaraju višim vrijednostima drugog, a niže vrijednosti jednog atributa niskim vrijednostima drugog (slika 2). Uz negativnu korelaciju, omjeri su obrnuti (slika 3). Kod pozitivne korelacije koeficijent korelacije ima pozitivan predznak, a kod negativne korelacije negativan predznak.

Slika 2 – Direktna korelacija

Slika 3 - Inverzna korelacija


Slika 4 - Nema korelacije

Stepen, jačina ili čvrstoća korelacije određena je vrijednošću koeficijenta korelacije. Jačina veze ne zavisi od njenog pravca i određena je apsolutnom vrednošću koeficijenta korelacije.

1.2 Opća klasifikacija korelacija

Ovisno o koeficijentu korelacije razlikuju se sljedeće korelacije:

Jaka ili bliska sa koeficijentom korelacije r>0,70;

Srednji (na 0,50

Umjereno (u 0.30

Slab (na 0,20

Veoma slab (na r<0,19).

1.3 Korelaciona polja i svrha njihove konstrukcije

Korelacija se proučava na osnovu eksperimentalnih podataka, a to su izmerene vrednosti (x i , y i) dve karakteristike. Ako ima malo eksperimentalnih podataka, onda je dvodimenzionalna empirijska raspodjela predstavljena kao dvostruki niz vrijednosti x i i y i. U ovom slučaju, korelacija između karakteristika može se opisati na različite načine. Korespondencija između argumenta i funkcije može se dati tabelom, formulom, grafikonom itd.

Korelaciona analiza, kao i druge statističke metode, zasniva se na korištenju vjerojatnosnih modela koji opisuju ponašanje proučavanih karakteristika u određenoj općoj populaciji, iz kojih se dobijaju eksperimentalne vrijednosti x i i y i. Kada se istražuje korelacija između kvantitativnih karakteristika čije se vrijednosti mogu precizno izmjeriti u jedinicama metričke skale (metri, sekunde, kilogrami, itd.), vrlo se često koristi model dvodimenzionalne normalno raspoređene opće populacije. usvojeno. Takav model grafički prikazuje odnos između varijabli x i i y i kao lokus tačaka u pravougaonom koordinatnom sistemu. Ova grafička zavisnost se takođe naziva dijagramom raspršenja ili korelacionom poljem.
Ovaj model dvodimenzionalne normalne distribucije (korelacijsko polje) omogućava vam da date vizuelnu grafičku interpretaciju koeficijenta korelacije, jer distribucija u zbiru zavisi od pet parametara: μ x , μ y – prosječne vrijednosti (matematička očekivanja); σ x ,σ y su standardne devijacije slučajnih varijabli X i Y, a p je koeficijent korelacije, koji je mjera odnosa između slučajnih varijabli X i Y.
Ako je p = 0, tada se vrijednosti, x i , y i , dobivene iz dvodimenzionalnog normalnog skupa, nalaze na grafu u koordinatama x, y unutar područja ograničenog krugom (slika 5, a). U ovom slučaju ne postoji korelacija između slučajnih varijabli X i Y i one se nazivaju nekoreliranim. Za dvodimenzionalnu normalnu distribuciju, nekorelacija znači istovremeno i nezavisnost slučajnih varijabli X i Y.

Dijeli