Coeficient de corelație. Testul de corelație al lui Pearson Cu cât coeficientul de corelație este mai aproape de 1

Aceasta este o valoare care poate varia de la +1 la -1. În cazul unei corelații pozitive complete, acest coeficient este egal cu plus 1 (se spune că odată cu creșterea valorii unei variabile, valoarea unei alte variabile crește), iar cu un negativ complet - minus 1 (indicați părere, adică Pe măsură ce valoarea unei variabile crește, valoarea celeilalte scade.)

Graficul dependenței de timiditate și depresie. După cum puteți vedea, punctele (subiecții) nu sunt situate aleatoriu, ci se aliniază în jurul unei linii și, privind această linie, putem spune că cu cât timiditatea este mai mare exprimată la o persoană, cu atât mai depresive, adică aceste fenomene. sunt interconectate.

Ex 2: Grafic pentru timiditate și sociabilitate. Vedem că pe măsură ce timiditatea crește, sociabilitatea scade. Coeficientul lor de corelare este 0,43. Astfel, un coeficient de corelație mai mare de la 0 la 1 indică o relație direct proporțională (cu cât mai mult ... cu atât mai mult ...), iar un coeficient de la -1 la 0 indică o relație invers proporțională (cu cât mai mult ... cu atât mai puțin . ..)

Dacă coeficientul de corelație este 0, ambele variabile sunt complet independente una de cealaltă.

corelație- aceasta este o relație în care impactul factorilor individuali apare doar ca tendință (în medie) cu observarea în masă a datelor reale. Exemple de dependență de corelare pot fi dependența dintre mărimea activelor băncii și valoarea profitului băncii, creșterea productivității muncii și vechimea în muncă a angajaților.

Se folosesc două sisteme de clasificare a corelațiilor în funcție de puterea lor: general și particular.

Clasificarea generală a corelațiilor:

1) puternic, sau apropiat cu un coeficient de corelație r > 0,70;

2) medie la 0,50< r < 0,69;

3) moderat la 0.30< r < 0,49;

4) slab la 0,20< r < 0,29;5) очень слабая при r < 0,19.

Clasificarea privată a corelațiilor:

1) corelație semnificativă mare la r corespunzătoare nivelului de semnificație statistică ρ ≤ 0,01

2) corelație semnificativă la r corespunzătoare nivelului de semnificație statistică ρ ≤ 0,05;

3) tendința unei relații semnificative la r corespunzătoare nivelului de semnificație statistică ρ ≤ 0,10;

4) corelație nesemnificativă la r neatingând nivelul de semnificație statistică. Aceste două clasificări nu se potrivesc.

Primul se concentrează doar pe valoarea coeficientului de corelație, iar al doilea determină ce nivel de semnificație atinge valoarea dată a coeficientului de corelație pentru o anumită dimensiune a eșantionului. Cu cât dimensiunea eșantionului este mai mare, cu atât valoarea coeficientului de corelație este mai mică pentru ca corelația să fie recunoscută ca fiind fiabilă. Ca rezultat, cu o dimensiune mică a eșantionului, se poate dovedi că o corelație puternică nu este de încredere. În același timp, cu dimensiuni mari ale eșantionului, chiar și o corelație slabă poate fi semnificativă. De obicei, este acceptat să se concentreze asupra celei de-a doua clasificări, deoarece ia în considerare dimensiunea eșantionului. Cu toate acestea, trebuie amintit că o corelație puternică sau ridicată este o corelație cu un r > 0,70 și nu doar o corelație. nivel inalt semnificaţie.


Următorul tabel listează denumirile coeficienților de corelație pentru tipuri variate cântare.

Scară dihotomică (1/0) Scala de rang (ordinal).
Scară dihotomică (1/0) Coeficientul de asociere al lui Pearson, coeficientul de conjugare cu patru celule al lui Pearson. Corelație biserială
Scala de rang (ordinal). Corelația rang-biseriala. Coeficientul de corelare a rangului lui Spearman sau Kendall.
Interval și scară absolută Corelație biserială Valorile scalei intervalului sunt convertite în ranguri și se utilizează coeficientul de rang Coeficientul de corelație Pearson (coeficientul de corelație liniară)

La r= 0 nu există o corelație liniară. În acest caz, mediile de grup ale variabilelor coincid cu mediile generale ale acestora, iar liniile de regresie sunt paralele cu axele de coordonate.

Egalitate r= 0 vorbește doar despre absența unei dependențe de corelație liniară (variabile necorelate), dar nu în general despre absența unei corelații, și cu atât mai mult, a unei dependențe statistice.

Uneori concluzia că nu există o corelație este mai importantă decât prezența unei corelații puternice. O corelație zero a două variabile poate indica că nu există nicio influență a unei variabile asupra celeilalte, cu condiția să avem încredere în rezultatele măsurătorilor.

În SPSS: 11.3.2 Coeficienți de corelație

Până acum am aflat doar faptul însuși al existenței unei relații statistice între două trăsături. În continuare, vom încerca să aflăm ce concluzii se pot trage despre puterea sau slăbiciunea acestei dependențe, precum și despre forma și direcția ei. Criteriile de cuantificare a relației dintre variabile se numesc coeficienți de corelație sau măsuri de conectivitate. Două variabile sunt corelate pozitiv dacă există o relație directă, unidirecțională între ele. Într-o relație unidirecțională, valorile mici ale unei variabile corespund unor valori mici ale celeilalte variabile, valorile mari corespund celor mari. Două variabile sunt corelate negativ dacă există o relație inversă între ele. Cu o relație multidirecțională, valorile mici ale unei variabile corespund unor valori mari ale celeilalte variabile și invers. Valorile coeficienților de corelație sunt întotdeauna în intervalul de la -1 la +1.

Ca coeficient de corelație între variabilele aparținând scării ordinale se folosește coeficientul Spearman, iar pentru variabilele aparținând scării de intervale, coeficientul de corelație Pearson (momentul produselor). În acest caz, trebuie menționat că fiecare variabilă dihotomică, adică o variabilă aparținând scării nominale și având două categorii, poate fi considerată ordinală.

În primul rând, vom verifica dacă există o corelație între variabilele sex și psihic din fișierul studium.sav. În acest sens, luăm în considerare faptul că variabila dihotomică sex poate fi considerată o variabilă ordinală.

Urmează următoarele instrucțiuni:

· Selectați din meniul de comandă Analiză (Analiză) Statistici descriptive (Statistici descriptive) Tabele încrucișate. (Tabelele de urgență)

· Mutați variabila sex într-o listă de rânduri și variabila psihic într-o listă de coloane.

· Faceți clic pe butonul Statistici.... În caseta de dialog Crosstabs: Statistics, bifați caseta Corelations. Confirmați alegerea cu butonul Continuare.

· În dialogul Tabele încrucișate, opriți afișarea tabelelor bifând caseta de selectare Suprimare tabele. Faceți clic pe butonul OK.

Când studiezi corelațiiîncercați să stabiliți dacă există vreo relație între doi indicatori din același eșantion (de exemplu, între înălțimea și greutatea copiilor sau între nivelul IQși performanța școlară) sau între două eșantioane diferite (de exemplu, la compararea perechilor de gemeni), și dacă această relație există, dacă o creștere a unui indicator este însoțită de o creștere (corelație pozitivă) sau o scădere (corelație negativă) a alte.

Cu alte cuvinte, analiza corelației ajută la stabilirea dacă este posibil să se prezică valorile posibile ale unui indicator, cunoscând valoarea altuia.

Până acum, când analizăm rezultatele experienței noastre în studiul efectelor marijuanei, am ignorat în mod deliberat un astfel de indicator precum timpul de reacție. Între timp, ar fi interesant de verificat dacă există o relație între eficiența reacțiilor și viteza lor. Acest lucru ar permite, de exemplu, să argumentăm că cu cât o persoană este mai lentă, cu atât acțiunile sale vor fi mai precise și mai eficiente și invers.

În acest scop se pot folosi două metode diferite: metoda parametrică de calcul al coeficientului Bravais-Pearson (r)și calcularea coeficientului de corelație al rândurilor Spearman (r s ), care se aplică datelor ordinale, adică este neparametric. Cu toate acestea, să înțelegem mai întâi ce este un coeficient de corelație.

Coeficient de corelație

Coeficientul de corelație este o valoare care poate varia de la -1 la 1. În cazul unei corelații pozitive complete, acest coeficient este plus 1, iar cu un negativ complet - minus 1. Pe grafic, aceasta corespunde unei linii drepte care trece prin punctele de intersecție a valorilor fiecărei perechi de date:

Variabil

Dacă aceste puncte nu se aliniază într-o linie dreaptă, ci formează un „nor”, ​​valoarea absolută a coeficientului de corelație devine mai mică de unu și se apropie de zero pe măsură ce norul se rotunjește:

Dacă coeficientul de corelație este 0, ambele variabile sunt complet independente una de cealaltă.

În științe umaniste, o corelație este considerată puternică dacă coeficientul ei este mai mare de 0,60; dacă depășește 0,90, atunci corelația este considerată foarte puternică. Cu toate acestea, pentru a putea trage concluzii despre relațiile dintre variabile, dimensiunea eșantionului este de mare importanță: cu cât eșantionul este mai mare, cu atât valoarea coeficientului de corelație obținut este mai fiabilă. Există tabele cu valori critice ale coeficienților de corelație Bravais-Pearson și Spearman pentru un număr diferit de grade de libertate (este egal cu numărul de perechi minus 2, adică n-2). Numai dacă coeficienții de corelație sunt mai mari decât aceste valori critice pot fi considerați de încredere. Deci, pentru ca coeficientul de corelație de 0,70 să fie de încredere, cel puțin 8 perechi de date ar trebui luate în analiză ( = P - 2 = 6) la calcul r(Tabelul B.4) și 7 perechi de date (= n - 2 = 5) la calcul r s (Tabelul 5 din Anexa B. 5).

Coeficientul Bravais-Pearson

Pentru a calcula acest coeficient, se folosește următoarea formulă (poate arăta diferit pentru diferiți autori):

unde  X Y este suma produselor datelor din fiecare pereche;

n - numărul de perechi;

- medie pentru date variabile X;

Media pentru date variabile Y;

S X - X;

s Y - abaterea standard pentru distribuție y.

Acum putem folosi acest coeficient pentru a determina dacă există o relație între timpul de reacție al subiecților și eficacitatea acțiunilor lor. Luați, de exemplu, nivelul de fundal al grupului de control.

n= 15  15,8  13,4 = 3175,8;

(n 1)S X S y = 14  3,07  2,29 = 98,42;

r =

O valoare negativă a coeficientului de corelare poate însemna că cu cât timpul de reacție este mai lung, cu atât eficiența este mai mică. Cu toate acestea, valoarea sa este prea mică pentru a putea vorbi despre o relație semnificativă între aceste două variabile.

nXY=………

(n- 1) S X S Y = ……

Ce concluzie se poate trage din aceste rezultate? Dacă credeți că există o relație între variabile, atunci ce este - directă sau inversă? Este de încredere [cf. fila. 4 (în Anexa B. 5) cu valori critice r]?

Coeficientul de corelare a rangului Spearmanr s

Acest coeficient este mai ușor de calculat, dar rezultatele sunt mai puțin precise decât utilizarea r. Acest lucru se datorează faptului că la calcularea coeficientului Spearman se utilizează ordinea datelor, și nu caracteristicile cantitative și intervalele dintre clase ale acestora.

Ideea este că atunci când se utilizează coeficientul de corelație de rang Spearman(r s ) ei verifică doar dacă clasarea datelor pentru un eșantion va fi aceeași ca într-o serie de alte date pentru acest eșantion asociat cu primul (de exemplu, dacă studenții vor fi „clasați” în mod egal atunci când promovează atât psihologie, cât și matematică, sau chiar și cu doi profesori de psihologie diferiți?). Dacă coeficientul este aproape de + 1, atunci aceasta înseamnă că ambele serii practic coincid, iar dacă acest coeficient este aproape de - 1, putem vorbi despre o relație inversă completă.

Coeficient r s calculate după formula

Unde d- diferența dintre rândurile valorilor caracteristicilor conjugate (indiferent de semnul acesteia) și n- numărul de perechi.

De obicei, acest test non-parametric este folosit în cazurile în care trebuie să trageți niște concluzii nu atât de mult intervaleîntre date, cât despre ele grade,și, de asemenea, atunci când curbele de distribuție sunt prea asimetrice și nu permit utilizarea unor criterii parametrice precum coeficientul r(în aceste cazuri, poate fi necesară convertirea datelor cantitative în date ordinale).

Deoarece acesta este cazul distribuției valorilor de eficiență și timp de reacție în grupul experimental după expunere, puteți repeta calculele pe care le-ați făcut deja pentru acest grup, doar că acum nu pentru coeficient r, iar pentru indicator r s . Acest lucru vă va permite să vedeți cât de diferiți sunt acești doi indicatori*.

* Trebuie amintit că

1) pentru numărul de lovituri, rangul 1 corespunde celui mai mare și rangul 15 celui mai scăzut performanță, în timp ce pentru timpul de reacție, rangul 1 corespunde celui mai scurt timp, iar rangul 15 celui mai lung;

2) datele ex aequo primesc un rang mediu.

Astfel, ca și în cazul coeficientului r, a primit un rezultat pozitiv, deși nesigur. Care dintre cele două rezultate este mai plauzibil: r=-0,48 sau r s = +0,24? O astfel de întrebare poate apărea numai dacă rezultatele sunt de încredere.

Aș dori să subliniez încă o dată că esența acestor doi coeficienți este oarecum diferită. Coeficient negativ r indică faptul că eficiența este cel mai adesea cu atât mai mare, cu atât timpul de reacție este mai rapid, în timp ce la calcularea coeficientului r s a fost necesar să se verifice dacă subiecții mai rapidi reacționează întotdeauna mai precis, iar cei mai lenți mai puțin precis.

Întrucât în ​​lotul experimental, după expunere, s-a obţinut un coeficient r s , egal cu 0,24, o astfel de tendință nu este evident urmărită aici. Încercați să înțelegeți singur datele pentru grupul de control după expunere, știind că  d 2 = 122,5:

; este de incredere?

Care este concluzia ta?…………………………………………………………………………………………………………

…………………………………………………………………………………………………………………….

Deci, am luat în considerare diverse metode statistice parametrice și neparametrice utilizate în psihologie. Recenzia noastră a fost foarte superficială, iar sarcina sa principală a fost de a face cititorul să înțeleagă că statisticile nu sunt atât de înfricoșătoare pe cât par și necesită în mare parte bun simț. Vă reamintim că datele de „experiență” cu care ne-am ocupat aici sunt fictive și nu pot servi drept bază pentru nicio concluzie. Cu toate acestea, un astfel de experiment ar merita făcut. Deoarece pentru acest experiment a fost aleasă o tehnică pur clasică, aceeași analiză statistică ar putea fi utilizată în multe experimente diferite. În orice caz, ni se pare că am conturat câteva direcții principale care pot fi utile celor care nu știu de unde să înceapă analiza statistică a rezultatelor.

Există trei ramuri principale ale statisticii: statistica descriptivă, statistica inductivă și analiza corelației.

Coeficientul de corelație este gradul de asociere între două variabile. Calculul său oferă o idee dacă există o relație între două seturi de date. Spre deosebire de regresie, corelația nu permite prezicerea valorilor. Cu toate acestea, calculul coeficientului este un pas important în preliminar analize statistice. De exemplu, am constatat că coeficientul de corelație dintre nivelul investițiilor străine directe și creșterea PIB este ridicat. Acest lucru ne dă o idee că pentru a asigura prosperitatea este necesară crearea unui climat favorabil pentru antreprenorii străini. Concluzie nu chiar atât de evidentă la prima vedere!

Corelație și cauzalitate

Poate că nu există o singură zonă de statistică care să fie atât de ferm stabilită în viața noastră. Coeficientul de corelație este utilizat în toate domeniile de cunoaștere publică. Principalul său pericol constă în faptul că deseori se speculează valorile sale mari pentru a convinge oamenii și a-i face să creadă în unele concluzii. Cu toate acestea, de fapt, o corelație puternică nu indică deloc o relație cauzală între cantități.

Coeficient de corelație: formula Pearson și Spearman

Există mai mulți indicatori principali care caracterizează relația dintre două variabile. Din punct de vedere istoric, primul este coeficientul de corelație liniară al lui Pearson. Se trece la scoala. A fost dezvoltat de K. Pearson și J. Yule pe baza lucrării pr. Galton. Acest raport vă permite să vedeți relația dintre numere rationale care se schimbă rațional. Este întotdeauna mai mare decât -1 și mai mic decât 1. Un număr negativ indică o relație invers proporțională. Dacă coeficientul este zero, atunci nu există nicio relație între variabile. Corb număr pozitiv- există o relaţie direct proporţională între mărimile studiate. Coeficientul de corelare a rangului lui Spearman face posibilă simplificarea calculelor prin construirea unei ierarhii de valori variabile.

Relații între variabile

Corelația ajută la răspunsul la două întrebări. În primul rând, dacă relația dintre variabile este pozitivă sau negativă. În al doilea rând, cât de puternică este dependența. Analiza corelației este un instrument puternic cu care puteți obține acest lucru Informații importante. Este ușor de observat că veniturile și cheltuielile gospodăriei cresc și scad proporțional. O astfel de relație este considerată pozitivă. Dimpotrivă, atunci când prețul unui produs crește, cererea pentru acesta scade. O astfel de relație se numește negativă. Valorile coeficientului de corelație sunt cuprinse între -1 și 1. Zero înseamnă că nu există nicio relație între valorile studiate. Cu cât indicatorul obținut este mai aproape de valorile extreme, cu atât relația (negativă sau pozitivă) este mai puternică. Absența dependenței este evidențiată de un coeficient de la -0,1 la 0,1. Trebuie înțeles că o astfel de valoare indică doar absența unei relații liniare.

Caracteristicile aplicației

Utilizarea ambilor indicatori este supusă anumitor ipoteze. În primul rând, prezența unei relații puternice nu determină faptul că o valoare o determină pe cealaltă. S-ar putea să existe o a treia cantitate care să definească fiecare dintre ele. În al doilea rând, un coeficient de corelație Pearson ridicat nu indică o relație cauzală între variabilele studiate. În al treilea rând, arată exclusiv dependență liniară. Corelația poate fi utilizată pentru a evalua date cantitative semnificative (de exemplu, presiune atmosferică, temperatura aerului), și nu categorii precum genul sau culoarea preferată.

Coeficient de corelație multiplă

Pearson și Spearman au investigat relația dintre două variabile. Dar ce să faci dacă sunt trei sau chiar mai mulți. Aici intervine coeficientul de corelație multiplă. De exemplu, produsul național brut este afectat nu numai de investițiile străine directe, ci și de politicile monetare și fiscale ale statului, precum și de nivelul exporturilor. Rata de creștere și volumul PIB sunt rezultatul interacțiunii mai multor factori. Cu toate acestea, trebuie înțeles că modelul de corelație multiplă se bazează pe o serie de simplificări și ipoteze. În primul rând, multicoliniaritatea între cantități este exclusă. În al doilea rând, se presupune că relația dintre variabila dependentă și variabilele care o afectează este liniară.

Domenii de utilizare ale analizei de corelație și regresie

Această metodă de găsire a relației dintre cantități este utilizată pe scară largă în statistică. Cel mai adesea se recurge la el în trei cazuri principale:

  1. Pentru testarea relațiilor cauzale dintre valorile a două variabile. Drept urmare, cercetătorul speră să găsească o relație liniară și să obțină o formulă care să descrie aceste relații între cantități. Unitățile lor de măsură pot fi diferite.
  2. Pentru a verifica existența unei relații între valori. În acest caz, nimeni nu stabilește care variabilă este dependentă. Se poate dovedi că valoarea ambelor cantități determină un alt factor.
  3. Pentru a deduce o ecuație. În acest caz, puteți pur și simplu să înlocuiți numere în el și să aflați valorile variabilei necunoscute.

Un bărbat în căutarea unei relații cauzale

Conștiința este aranjată în așa fel încât trebuie neapărat să explicăm evenimentele care au loc în jur. O persoană caută mereu o legătură între imaginea lumii în care trăiește și informațiile pe care le primește. Adesea, creierul creează ordine din haos. El poate vedea cu ușurință o relație cauzală acolo unde nu există. Oamenii de știință trebuie să învețe în mod special să depășească această tendință. Capacitatea de a evalua relațiile dintre date este obiectiv esențială într-o carieră academică.

Prejudecăți media

Luați în considerare modul în care prezența unei corelații poate fi interpretată greșit. Un grup de studenți britanici care se comportau rău au fost întrebați dacă părinții lor fumau. Apoi testul a fost publicat în ziar. Rezultatul a arătat o corelație puternică între fumatul părinților și delincvența copiilor lor. Profesorul care a efectuat acest studiu a sugerat chiar să se pună un avertisment în acest sens pe pachetele de țigări. Cu toate acestea, există întreaga linie probleme cu această concluzie. În primul rând, corelația nu indică care dintre cantități este independentă. Prin urmare, este foarte posibil să presupunem că obiceiul pernicios al părinților este cauzat de neascultarea copiilor. În al doilea rând, este imposibil să spunem cu certitudine că ambele probleme nu au apărut din cauza unui al treilea factor. De exemplu, familiile cu venituri mici. Ar trebui notat aspect emoțional constatările inițiale ale profesorului care a efectuat studiul. Era un oponent înflăcărat al fumatului. Prin urmare, nu este de mirare că a interpretat rezultatele studiului său în acest fel.

concluzii

Interpretarea greșită a corelației ca relație cauzală între două variabile poate duce la erori de cercetare jenante. Problema este că este la bază constiinta umana. Multe trucuri de marketing se bazează pe această caracteristică. Înțelegerea diferenței dintre cauzalitate și corelație vă permite să analizați rațional informațiile ca în Viata de zi cu zi cât şi în carierele profesionale.


Coeficienți de corelare

Până acum am aflat doar faptul însuși al existenței unei relații statistice între două trăsături. În continuare, vom încerca să aflăm ce concluzii se pot trage despre puterea sau slăbiciunea acestei dependențe, precum și despre forma și direcția ei. Criteriile de cuantificare a relației dintre variabile se numesc coeficienți de corelație sau măsuri de conectivitate. Două variabile sunt corelate pozitiv dacă există o relație directă, unidirecțională între ele. Într-o relație unidirecțională, valorile mici ale unei variabile corespund unor valori mici ale celeilalte variabile, valorile mari corespund celor mari. Două variabile sunt corelate negativ dacă există o relație inversă între ele. Cu o relație multidirecțională, valorile mici ale unei variabile corespund unor valori mari ale celeilalte variabile și invers. Valorile coeficienților de corelație sunt întotdeauna în intervalul de la -1 la +1.

Ca coeficient de corelație între variabilele aparținând ordinal scară aplicată Coeficientul lui Spearman, iar pentru variabilele aparținând interval scara - Coeficientul de corelație Pearson(momentul lucrărilor). De remarcat că fiecare variabilă dihotomică, adică o variabilă aparținând scării nominale și având două categorii, poate fi considerată ca ordinal.

În primul rând, vom verifica dacă există o corelație între variabilele sex și psihic din fișierul studium.sav. În acest caz, variabila dihotomică sex poate fi considerat ca fiind ordinal. Urmează următoarele instrucțiuni:

    Selectați din meniul de comandă Analizați (Analiză) Statistici descriptive (Statistici descriptive) Tabele încrucișate... (Tabelele de urgență)

    Mutați variabila sex la o listă de șiruri și o variabilă psihicul- la lista de coloane.

    Faceți clic pe butonul Statistici... (Statistici). În caseta de dialog Crosstabs: Statistics, bifați caseta Corelations. Confirmați alegerea cu butonul Continuare.

    În dialog tabele încrucișate Opriți afișarea tabelelor bifând caseta de selectare Suprimați tabele. Faceți clic pe butonul OK.

Se vor calcula coeficienții de corelație Spearman și Pearson, iar semnificația acestora va fi testată:

Măsuri simetrice

valoare Asimpt. Std. Eroare(a) (Eroare standard asimptotică) Aproximativ. T (b) (aproximativ T) Aproximativ. Sig. (Semnificație aproximativă)
Interval cu interval (Interval - interval) R. lui Pearson
(R Pearson)
,441 ,081 5,006 .000 (s)
Ordinal cu ordinal (Ordinal - Ordinal) Corelația Spearman (Corelarea Spearman) ,439 ,083 4,987 .000 (s)
N de cazuri valide 106

Deoarece aici nu există variabile la scară de interval, vom lua în considerare coeficientul de corelație Spearman. Este 0,439 și este cea mai semnificativă (p<0,001).

Următorul tabel este utilizat pentru a descrie verbal valorile coeficientului de corelație:

Pe baza tabelului de mai sus se pot trage următoarele concluzii: Există o corelație slabă între variabilele sex și psihic (concluzie despre puterea dependenței), variabilele corelează pozitiv (concluzie despre direcția dependenței).

În variabila psihic, valorile mai mici corespund unei stări mentale negative, iar valorile mai mari corespund uneia pozitive. În sexul variabil, la rândul său, valoarea „1” corespunde genului feminin, iar „2” - masculin.

În consecință, relația unidirecțională poate fi interpretată astfel: elevele își evaluează starea mentală mai negativ decât colegii de sex masculin sau, cel mai probabil, sunt mai susceptibile de a fi de acord cu o astfel de evaluare atunci când efectuează un sondaj.La construirea unor astfel de interpretări, ar trebui să se ia în considerare Ținând cont de faptul că corelația dintre două trăsături nu este neapărat aceeași cu relația lor funcțională sau cauzală, vezi Secțiunea 15.3 pentru mai multe despre aceasta.

Acum să verificăm corelația dintre variabilele alter și semestriale. Să aplicăm metoda descrisă mai sus. Vom obține următorii coeficienți:

Măsuri simetrice

Asimpt. Std. eroare (a)

Interval cu interval

Ordinal cu Ordinal

Corelația Spearman

N de cazuri valide

A. Neasumarea ipotezei nule (Ipoteza nulă nu este acceptată).

e. Folosind eroarea standard asimptotică presupunând ipoteza nulă.

din. Pe baza aproximării normale.

Deoarece alter și semestru sunt variabile metrice, vom lua în considerare coeficientul Pearson (momentul produselor). Este 0,807. Există o corelație puternică între variabilele alter și semestriale. Variabilele sunt corelate pozitiv. În consecință, studenții mai mari învață în cursuri de seniori, ceea ce, de fapt, nu este o concluzie neașteptată.

Să verificăm variabilele sozial (evaluarea poziţiei sociale) şi psihicul pentru corelare. Vom obține următorii coeficienți:

Măsuri simetrice

Asimpt. Std. eroare (a)

Interval cu interval

Ordinal cu Ordinal

Corelația Spearman

N de cazuri valide

A. Neasumarea ipotezei nule (Ipoteza nulă nu este acceptată).

b. Folosind eroarea standard asimptotică presupunând ipoteza nulă.

din. Pe baza aproximării normale.

În acest caz, vom lua în considerare coeficientul de corelație Spearman; este -0,703. Există o corelație moderată până la puternică între sozial și psihic (limită 0,7). Variabilele corelează negativ, adică cu cât valoarea primei variabile este mai mare, cu atât valoarea celei de-a doua este mai mică și invers. Deoarece valorile mici ale variabilei sozial caracterizează o stare pozitivă (1 = foarte bună, 2 = bună), iar valorile mari ale psihicului caracterizează o stare negativă (1 = extrem de instabilă, 2 = instabilă), prin urmare, dificultăți psihologice se datorează în mare parte problemelor sociale.

LUCRARE DE CURS

Tema: Analiza corelației

Introducere

1. Analiza corelației

1.1 Conceptul de corelare

1.2 Clasificarea generală a corelațiilor

1.3 Câmpuri de corelație și scopul construcției lor

1.4 Etapele analizei corelației

1.5 Coeficienți de corelație

1.6 Coeficientul de corelație Bravais-Pearson normalizat

1.7 Coeficientul de corelare a rangului lui Spearman

1.8 Proprietăți de bază ale coeficienților de corelație

1.9 Verificarea semnificației coeficienților de corelație

1.10 Valori critice ale coeficientului de corelație de pereche

2. Planificarea unui experiment multivariat

2.1 Starea problemei

2.2 Determinarea centrului planului (nivelul principal) și a nivelului de variație a factorilor

2.3 Construirea unei matrice de planificare

2.4 Verificarea omogenității dispersiei și a preciziei egale a măsurătorilor în diferite serii

2.5 Coeficienții ecuației de regresie

2.6 Dispersia reproductibilității

2.7 Verificarea semnificației coeficienților ecuației de regresie

2.8 Verificarea adecvării ecuaţiei de regresie

Concluzie

Bibliografie

INTRODUCERE

Planificarea experimentului este o disciplină matematică și statistică care studiază metodele de organizare rațională a cercetării experimentale - de la alegerea optimă a factorilor studiați și determinarea planului propriu-zis al experimentului în conformitate cu scopul acestuia până la metodele de analiză a rezultatelor. Începutul planificării experimentelor a fost pus de lucrările statisticianului englez R. Fisher (1935), care a subliniat că planificarea rațională a experimentului oferă un câștig nu mai puțin semnificativ în acuratețea estimărilor decât prelucrarea optimă a rezultatelor măsurătorilor. În anii 60 ai secolului XX, a apărut o teorie modernă a planificării experimentelor. Metodele sale sunt strâns legate de teoria aproximării funcțiilor și de programare matematică. Sunt construite planuri optime și proprietățile lor sunt investigate pentru o clasă largă de modele.

Planificarea experimentului este alegerea unui plan de experiment care să îndeplinească cerințele specificate, un set de acțiuni care vizează dezvoltarea unei strategii de experimentare (de la obținerea de informații a priori până la obținerea unui model matematic funcțional sau determinarea condițiilor optime). Acesta este un control intenționat al experimentului, implementat în condiții de cunoaștere incompletă a mecanismului fenomenului studiat.

În procesul de măsurători, prelucrarea ulterioară a datelor, precum și formalizarea rezultatelor sub forma unui model matematic, apar erori și se pierde o parte din informațiile conținute în datele originale. Utilizarea metodelor de planificare a experimentelor face posibilă determinarea erorii modelului matematic și evaluarea adecvării acestuia. Dacă acuratețea modelului este insuficientă, atunci utilizarea metodelor de planificare a experimentelor face posibilă modernizarea modelului matematic cu experimente suplimentare fără a pierde informațiile anterioare și la un cost minim.

Scopul planificării experimentelor este de a găsi astfel de condiții și reguli pentru desfășurarea experimentelor în care este posibil să se obțină informații fiabile și de încredere despre obiectul cu cele mai mici costuri cu forța de muncă, precum și să se prezinte aceste informații într-o formă compactă și convenabilă cu o formă cantitativă. evaluarea preciziei.

Printre principalele metode de planificare utilizate în diferitele etape ale studiului, se folosesc următoarele:

Planificarea unui experiment de screening, a cărui semnificație principală este selectarea unui grup de factori semnificativi din totalitatea factorilor care fac obiectul unui studiu detaliat suplimentar;

Proiectarea unui experiment pentru analiza varianței, de ex. întocmirea de planuri pentru obiecte cu factori calitativi;

Planificarea unui experiment de regresie care vă permite să obțineți modele de regresie (polinom și altele);

Planificarea unui experiment extrem, în care sarcina principală este optimizarea experimentală a obiectului de studiu;

Planificarea în studiul proceselor dinamice etc.

Scopul studierii disciplinei este pregătirea studenților pentru activități de producție și tehnice din specialitate folosind metodele teoriei planificării și tehnologiile informaționale moderne.

Obiectivele disciplinei: studiul metodelor moderne de planificare, organizare și optimizare a experimentelor științifice și industriale, efectuarea experimentelor și prelucrarea rezultatelor.

1. ANALIZA CORELATIEI

1.1 Conceptul de corelare

Cercetătorul este adesea interesat de modul în care două sau mai multe variabile sunt legate între ele în unul sau mai multe dintre eșantioanele studiate. De exemplu, înălțimea poate afecta greutatea unei persoane sau presiunea poate afecta calitatea produsului?

Acest tip de relație între variabile se numește corelație sau corelație. O corelație este o schimbare consistentă a două caracteristici, reflectând faptul că variabilitatea unei caracteristici este în concordanță cu variabilitatea celeilalte.

Se știe, de exemplu, că, în medie, există o relație pozitivă între înălțimea oamenilor și greutatea lor și astfel încât cu cât înălțimea este mai mare, cu atât greutatea unei persoane este mai mare. Cu toate acestea, există excepții de la această regulă atunci când persoanele relativ scunde sunt supraponderale și, dimpotrivă, astenicii, cu creștere mare, sunt ușoare. Motivul pentru astfel de excluderi este că fiecare trăsătură biologică, fiziologică sau psihologică este determinată de influența mai multor factori: de mediu, genetici, sociali, ecologici etc.

Corelațiile sunt modificări probabilistice care pot fi studiate numai pe eșantioane reprezentative prin metode de statistică matematică. Ambii termeni - corelație și dependență de corelație - sunt adesea folosiți în mod interschimbabil. Dependența înseamnă influență, conexiune - orice schimbare coordonată care poate fi explicată prin sute de motive. Corelațiile nu pot fi considerate ca dovezi ale unei relații cauzale, ele indică doar că schimbările într-o trăsătură, de regulă, sunt însoțite de anumite schimbări în alta.

Dependența de corelație - Acestea sunt modificările pe care valorile unei caracteristici le fac asupra probabilității de apariție a diferitelor valori ale altei caracteristici.

Sarcina analizei corelației se reduce la stabilirea direcției (pozitive sau negative) și a formei (liniară, neliniară) a relației dintre diferitele caracteristici, măsurarea etanșeității acesteia și, în final, verificarea nivelului de semnificație al coeficienților de corelație obținuți. .

Corelațiile diferă ca formă, direcție și grad (putere) .

Forma corelației poate fi rectilinie sau curbilinie. De exemplu, relația dintre numărul de sesiuni de antrenament pe simulator și numărul de probleme rezolvate corect în sesiunea de control poate fi simplă. Curbiliniu poate fi, de exemplu, relația dintre nivelul de motivație și eficacitatea sarcinii (Figura 1). Odată cu creșterea motivației, eficiența sarcinii crește mai întâi, apoi se atinge nivelul optim de motivație, care corespunde eficienței maxime a sarcinii; o creștere suplimentară a motivației este însoțită de o scădere a eficienței.

Figura 1 - Relația dintre eficiența rezolvării problemelor și puterea tendinței motivaționale

În direcție, corelația poate fi pozitivă ("directă") și negativă ("invers"). Cu o corelație dreaptă pozitivă, valorile mai mari ale unui atribut corespund valorilor mai mari ale altuia, iar valorile mai mici ale unui atribut corespund valorilor scăzute ale altuia (Figura 2). Cu o corelație negativă, rapoartele sunt inversate (Figura 3). Cu o corelație pozitivă, coeficientul de corelație are semn pozitiv, cu o corelație negativă - un semn negativ.

Figura 2 - Corelație directă

Figura 3 - Corelație inversă


Figura 4 - Fără corelație

Gradul, rezistența sau etanșeitatea corelației este determinată de valoarea coeficientului de corelație. Rezistența conexiunii nu depinde de direcția acesteia și este determinată de valoarea absolută a coeficientului de corelație.

1.2 Clasificarea generală a corelaţiilor

În funcție de coeficientul de corelație, se disting următoarele corelații:

Puternic sau apropiat cu coeficient de corelație r>0,70;

Medie (la 0,50

Moderat (la 0.30

Slab (la 0,20

Foarte slab (la r<0,19).

1.3 Câmpuri de corelație și scopul construcției lor

Corelația este studiată pe baza datelor experimentale, care sunt valorile măsurate (x i , y i) a două caracteristici. Dacă există puține date experimentale, atunci distribuția empirică bidimensională este reprezentată ca o serie dublă de valori x i și y i. În acest caz, corelația dintre caracteristici poate fi descrisă în moduri diferite. Corespondența dintre un argument și o funcție poate fi dată de un tabel, formulă, grafic etc.

Analiza corelației, ca și alte metode statistice, se bazează pe utilizarea modelelor probabilistice care descriu comportamentul caracteristicilor studiate într-o anumită populație generală, din care se obțin valorile experimentale x i și y i. Atunci când se investighează corelația dintre caracteristicile cantitative, ale căror valori pot fi măsurate cu precizie în unități de scări metrice (metri, secunde, kilograme etc.), modelul unei populații generale bidimensionale distribuite normal este foarte des. adoptat. Un astfel de model afișează grafic relația dintre variabilele x i și y i ca loc de puncte într-un sistem de coordonate dreptunghiular. Această dependență grafică este numită și diagramă de dispersie sau câmp de corelație.
Acest model al unei distribuții normale bidimensionale (câmp de corelație) vă permite să oferiți o interpretare vizuală grafică a coeficientului de corelație, deoarece distribuția în agregat depinde de cinci parametri: μ x , μ y – valori medii (așteptări matematice); σ x ,σ y sunt abaterile standard ale variabilelor aleatoare X și Y și p este coeficientul de corelație, care este o măsură a relației dintre variabilele aleatoare X și Y.
Dacă p \u003d 0, atunci valorile, x i , y i , obținute dintr-o mulțime normală bidimensională, sunt situate pe grafic în coordonatele x, y în zona delimitată de un cerc (Figura 5, a). În acest caz, nu există o corelație între variabilele aleatoare X și Y și se numesc necorelate. Pentru o distribuție normală bidimensională, necorelare înseamnă în același timp independența variabilelor aleatoare X și Y.

Acțiune