O caracteristică a dispersiei valorilor este aleatorie. Caracteristici de împrăștiere Dispersia și proprietățile sale Inegalitatea lui Chebyshev

Caracteristicile poziției descriu centrul de distribuție. În același timp, valorile unei variante pot fi grupate în jurul acesteia atât într-o bandă largă, cât și într-o bandă îngustă. Prin urmare, pentru a descrie distribuția, este necesar să se caracterizeze intervalul de modificare a valorilor atributului. Caracteristicile de împrăștiere sunt utilizate pentru a descrie intervalul de variație a caracteristicilor. Cele mai utilizate sunt intervalul de variație, dispersie, deviație standardși coeficientul de variație.

Variație de interval este definită ca diferența dintre valoarea maximă și minimă a trăsăturii în populația studiată:

R=X max- X min.

Avantajul evident al acestui indicator este ușurința de calcul. Cu toate acestea, deoarece intervalul de variație depinde de valorile doar ale valorilor extreme ale atributului, domeniul de aplicare al acestuia este limitat la distribuții destul de omogene. În alte cazuri, conținutul de informații al acestui indicator este foarte mic, deoarece există o mulțime de distribuții care diferă foarte mult ca formă, dar au aceeași gamă. În studiile practice, intervalul de variație este uneori utilizat pentru dimensiuni mici (nu mai mult de 10) eșantion. Deci, de exemplu, prin intervalul de variație este ușor de estimat cât de mult diferă cele mai bune și cele mai proaste rezultate într-un grup de sportivi.

În acest exemplu:

R\u003d 16,36 - 13,04 \u003d 3,32 (m).

A doua caracteristică de împrăștiere este dispersie. Varianta este pătratul mediu al abaterii unei valori variabilă aleatorie din valoarea sa medie. Dispersia este o caracteristică a dispersiei, dispersia valorilor unei cantități în jurul valorii sale medii. Cuvântul „dispersie” în sine înseamnă „împrăștiere”.

Atunci când se efectuează studii prin eșantion, este necesar să se stabilească o estimare a varianței. Varianța calculată din datele eșantionului se numește varianța eșantionului și se notează S 2 .

La prima vedere, cea mai naturală estimare a varianței este varianța statistică calculată din definiție folosind formula:

În această formulă, suma abaterilor pătrate ale valorilor atributelor x i din media aritmetică . Această sumă este împărțită la dimensiunea eșantionului pentru a obține abaterile pătrate medii. P.

Cu toate acestea, această estimare nu este imparțială. Se poate demonstra că suma abaterilor pătrate ale valorilor atributelor pentru media aritmetică a eșantionului este mai mică decât suma abaterilor pătrate de la orice altă valoare, inclusiv media adevărată ( așteptări matematice). Prin urmare, rezultatul obținut prin formula de mai sus va conține o eroare sistematică, iar valoarea estimată a varianței va fi subestimată. Pentru a elimina părtinirea, este suficient să introduceți un factor de corecție. Rezultatul este următoarea relație pentru varianța estimată:

Pentru valori mari n, desigur, ambele estimări - părtinitoare și nepărtinitoare - vor diferi foarte puțin și introducerea unui factor de corecție devine lipsită de sens. De regulă, formula de estimare a varianței ar trebui să fie rafinată când n<30.

În cazul datelor grupate, ultima formulă de simplificare a calculelor poate fi redusă la următoarea formă:

Unde k- numărul de intervale de grupare;

n i- frecvență de interval cu număr i;

x i- valoarea mijlocie a intervalului cu numărul i.

De exemplu, să calculăm varianța pentru datele grupate ale exemplului pe care îl analizăm (a se vedea tabelul 4.):

S 2 =/ 28=0,5473 (m2).

Varianta unei variabile aleatoare are dimensiunea pătratului dimensiunii variabilei aleatoare, ceea ce o face dificil de interpretat și o face să nu fie foarte vizuală. Pentru o descriere mai vizuală a împrăștierii, este mai convenabil să folosiți o caracteristică a cărei dimensiune coincide cu dimensiunea caracteristicii studiate. În acest scop, conceptul deviație standard(sau deviație standard).

deviație standard se numește rădăcina pătrată pozitivă a varianței:

În exemplul nostru, abaterea standard este

Abaterea standard are aceleași unități de măsură ca și rezultatele măsurătorii trăsăturii studiate și, astfel, caracterizează gradul de abatere a trăsăturii de la media aritmetică. Cu alte cuvinte, arată cum se află partea principală a variantei în raport cu media aritmetică.

Abaterea standard și varianța sunt cele mai utilizate măsuri de variație. Acest lucru se datorează faptului că sunt incluse într-o parte semnificativă a teoremelor teoriei probabilităților, care servește drept fundament al statisticii matematice. În plus, varianța poate fi descompusă în elementele sale constitutive, ceea ce face posibilă evaluarea influenței diferiților factori asupra variației trăsăturii studiate.

Pe lângă indicatorii absoluti de variație, care sunt varianța și abaterea standard, în statistică sunt introduși și cei relativi. Cel mai frecvent utilizat coeficient de variație. Coeficientul de variație este egal cu raportul dintre abaterea standard și media aritmetică, exprimat ca procent:

Din definiție reiese clar că, în sensul său, coeficientul de variație este o măsură relativă a dispersiei unei trăsături.

Pentru exemplul în cauză:

Coeficientul de variație este utilizat pe scară largă în cercetarea statistică. Fiind o valoare relativă, vă permite să comparați fluctuațiile ambelor trăsături cu unități de măsură diferite, precum și aceeași trăsătură în mai multe populații diferite cu valori diferite ale mediei aritmetice.

Coeficientul de variație este utilizat pentru a caracteriza omogenitatea datelor experimentale obținute. În practica culturii fizice și sportului, răspândirea rezultatelor măsurătorilor în funcție de valoarea coeficientului de variație este considerată a fi mică (V<10%), средним (11-20%) и большим (V> 20%).

Restricțiile privind utilizarea coeficientului de variație sunt legate de natura relativă a acestuia - definiția conține o normalizare la media aritmetică. În acest sens, pentru valori absolute mici ale mediei aritmetice, coeficientul de variație își poate pierde conținutul informațional. Cu cât valoarea mediei aritmetice este mai aproape de zero, cu atât acest indicator devine mai puțin informativ. În cazul limitativ, media aritmetică merge la zero (de exemplu, temperatura), iar coeficientul de variație merge la infinit, indiferent de răspândirea semnului. Prin analogie cu cazul de eroare, putem formula următoarea regulă. Dacă valoarea mediei aritmetice din eșantion este mai mare de unu, atunci utilizarea coeficientului de variație este justificată; în caz contrar, dispersia și abaterea standard ar trebui folosite pentru a descrie răspândirea datelor experimentale.

În încheierea acestei părți, avem în vedere evaluarea variației valorilor caracteristicilor estimate. După cum sa menționat deja, valorile caracteristicilor de distribuție calculate din datele experimentale nu coincid cu valorile lor adevărate pentru populația generală. Nu este posibil să se stabilească cu exactitate pe acesta din urmă, deoarece, de regulă, este imposibil să se examineze întreaga populație. Dacă folosim rezultatele diferitelor eșantioane din aceeași populație generală pentru a estima parametrii de distribuție, atunci se dovedește că aceste estimări pentru diferite eșantioane diferă unele de altele. Valorile estimate fluctuează în jurul valorii lor adevărate.

Abaterile estimărilor parametrilor generali de la valorile adevărate ale acestor parametri se numesc erori statistice. Motivul apariției lor este dimensiunea limitată a eșantionului - nu toate obiectele populației generale sunt incluse în acesta. Pentru a estima amploarea erorilor statistice, se utilizează abaterea standard a caracteristicilor eșantionului.

Ca exemplu, luați în considerare cea mai importantă caracteristică de poziție - media aritmetică. Se poate demonstra că abaterea standard a mediei aritmetice este dată de:

Unde σ - abaterea standard pentru populatia generala.

Deoarece valoarea adevărată a abaterii standard nu este cunoscută, o cantitate numită eroarea standard a mediei aritmetice si egal:

Valoarea caracterizează eroarea care, în medie, este permisă la înlocuirea mediei generale cu estimarea eșantionului acesteia. Conform formulei, o creștere a dimensiunii eșantionului în timpul studiului duce la o scădere a erorii standard proporțional cu rădăcina pătrată a dimensiunii eșantionului.

Pentru exemplul luat în considerare, valoarea erorii standard a mediei aritmetice este . În cazul nostru, sa dovedit a fi de 5,4 ori mai mică decât valoarea abaterii standard.

Principala caracteristică a dispersiei unei serii variaționale se numește dispersie

Caracteristica principală a dispersiei seriei de variații se numește dispersie. Varianta eșantionuluiDîn se calculează folosind următoarea formulă:

unde x i – i -a valoare din eșantion care apare m i ori; n - marime de mostra; este media eșantionului; k este numărul de valori diferite din eșantion. În acest exemplu: x1 =72, m1 =50; x2 =85, m2 =44; x3 =69, m3 =61; n=155; k=3; . Apoi:

Rețineți că, cu cât valoarea dispersiei este mai mare, cu atât diferența dintre valorile cantității măsurate este mai mare între ele. Dacă în eșantion toate valorile valorii măsurate sunt egale între ele, atunci varianța unui astfel de eșantion este egală cu zero.

Dispersia are proprietăți speciale.

Proprietatea 1.Valoarea varianței oricărui eșantion este nenegativă, adică .

Proprietatea 2.Dacă valoarea măsurată este constantă X=c, atunci varianța pentru o astfel de valoare este zero: DC ]= 0.

Proprietatea 3.Dacă toate valorile mărimii măsurate X în creşterea eşantionului în c ori, atunci varianța acestui eșantion va crește cu c de 2 ori: D[cx ]= c 2 D [ x ], unde c = const .

Uneori, în locul varianței, se folosește o abatere standard a eșantionului, care este egală cu rădăcina pătrată aritmetică a varianței eșantionului: .

Pentru exemplul considerat, deviația standard a eșantionului este egală cu .

Dispersia vă permite să evaluați nu numai gradul de diferență a indicatorilor măsurați în cadrul unui grup, dar poate fi folosit și pentru a determina abaterea datelor între diferite grupuri. Pentru aceasta se folosesc mai multe tipuri de dispersie.

Dacă orice grup este luat ca eșantion, atunci se numește varianța acestui grup varianță de grup. Pentru a exprima numeric diferențele dintre variațiile mai multor grupuri, există conceptul varianta intergrup. Varianta intergrup este varianța mediei grupului în raport cu media generală:

unde k este numărul de grupuri din eșantionul total, este media eșantionului pentru i -a grupă, n i - marime de mostra i grupa, - media eșantionului pentru toate grupurile.

Luați în considerare un exemplu.

Scorul mediu la munca de control la matematică la 10 clasa „A” a fost 3,64, iar la 10 clasa „B” 3,52. În 10 „A” sunt 22 de elevi, iar în 10 „B” - 21. Să găsim dispersia intergrup.

În această problemă, eșantionul este împărțit în două grupuri (două clase). Media eșantionului pentru toate grupurile este:

.

În acest caz, varianța intergrup este:

Deoarece varianța intergrup este aproape de zero, putem concluziona că scorurile unui grup (clasa 10 „A”) diferă ușor de scorurile celui de-al doilea grup (clasa 10 „B”). Cu alte cuvinte, din punctul de vedere al varianței intergrupurilor, grupurile considerate diferă ușor în ceea ce privește un atribut dat.

Dacă eșantionul total (de exemplu, o clasă de studenți) este împărțit în mai multe grupuri, atunci pe lângă varianța intergrup, se poate calcula șivarianta intragrup. Această varianță este media tuturor variațiilor de grup.

Varianta intragrupD Ungaria calculat prin formula:

unde k este numărul de grupuri din eșantionul total, D i – varianța i al-lea grup de volum n i .

Există o relație între ansamblu (Dîn ), intragrup ( D ngr ) și intergrup ( D intergr) dispersii:

D în \u003d D ingr + D intergr.

    SUPRAFAȚA (AREA) DE împrăștiere eficientă- caracteristică reflectivității țintei, exprimată prin raportul puterii el. magn. energia reflectată de țintă în direcția receptorului, la densitatea fluxului de energie de suprafață incidentă pe țintă. Depinde de… … Enciclopedia forțelor strategice de rachete

    Mecanica cuantică... Wikipedia

    - (EPR) caracteristică reflectivității țintei iradiate de unde electromagnetice. Valoarea EPR este definită ca raportul dintre debitul (puterea) energiei electromagnetice reflectată de țintă în direcția mijloacelor radio-electronice (RES), la ... ... Dicționar marin

    bandă rătăcită- Caracteristicile statistice ale datelor experimentale, reflectând abaterea acestora de la valorile medii. Subiecte metalurgie în general EN bandă disperată... Manualul Traducătorului Tehnic

    - (funcția de transfer al modulației), funcția, cu ajutorul unei tăieturi, „sharpness” a imaginii optice. sisteme şi elemente ale unor astfel de sisteme. Ch. la x. este transformata Fourier a așa-numitei. funcția de împrăștiere a liniilor care descrie natura „împrăștierii” ... ... Enciclopedia fizică

    Funcția de transfer de modulare, o funcție care evaluează proprietățile de „claritate” ale sistemelor optice de imagistică și ale elementelor individuale ale unor astfel de sisteme (vezi, de exemplu, Claritatea unei imagini fotografice). Ch. la x. există un Fourier ......

    bandă rătăcită- caracteristica statistică a datelor experimentale, reflectând abaterea acestora de la valoarea medie. Vezi și: Bandă Bandă de alunecare Bandă de resetare Bandă de întărire... Dicţionar Enciclopedic de Metalurgie

    BANDA SCATTER- caracteristica statistică a datelor experimentale, care reflectă abaterea acestora de la valorile medii... Dicţionar metalurgic

    Caracteristică împrăștierii valorilor unei variabile aleatoare. M. t. h este legată de abaterea pătrată (Vezi. Abaterea pătrată) σ prin formula Această metodă de măsurare a împrăștierii se explică prin faptul că în cazul normalului ... ... Marea Enciclopedie Sovietică

    STATISTICA VARIAȚIILOR- STATISTICĂ VARIAȚIONALĂ, termen care unește un grup de tehnici de analiză statistică utilizate în principal în științele naturii. În a doua jumătate a secolului al XIX-lea. Quetelet (Quetelet, „Anthro pometrie ou mesure des differentes facultes de 1… … Marea Enciclopedie Medicală

    Valorea estimata- (Media populației) Așteptarea matematică este distribuția probabilității unei variabile aleatoare Așteptări matematice, definiție, așteptări matematice ale variabilelor aleatoare discrete și continue, așteptări selective, condiționate, calcul, ... ... Enciclopedia investitorului

La caracteristici statistice de bază serii de măsurători (serie de variaţii) sunt caracteristicile poziției (caracteristici medii, sau tendința centrală a eșantionului); caracteristici de împrăștiere (variatii sau fluctuatii) și X caracteristicile formei distributie.

La caracteristicile poziției raporta medie aritmetică (Rău), Modăși median.

La caracteristici de împrăștiere (variatii sau fluctuatii) raporta: gama de variatie, dispersie, rădăcină medie pătrată (standard) deviere, eroare medie aritmetică (eroare medie), coeficientul de variație si etc.

La caracteristicile formei raporta coeficientul de asimetrie, măsurarea asimetriei și curtozei.

Caracteristicile poziției

Media aritmetică este una dintre principalele caracteristici ale probei.

Ea, ca și alte caracteristici numerice ale eșantionului, poate fi calculată atât din datele primare brute, cât și din rezultatele grupării acestor date.

Precizia calculului pe datele brute este mai mare, dar procesul de calcul se dovedește a fi consumator de timp cu o dimensiune mare a eșantionului.

Pentru datele negrupate, media aritmetică este determinată de formula:

Unde n- marime de mostra, X 1 , X 2 , ... X n - rezultatele măsurătorilor.

Pentru date grupate:

Unde n- marime de mostra, k este numărul de intervale de grupare, n i– frecvența intervalelor, x i sunt valorile mediane ale intervalelor.

Modă

Definiția 1. Modă este valoarea care apare cel mai frecvent în datele eșantionului. Notat luși este determinată de formula:

unde este limita inferioară a intervalului modal, este lățimea intervalului de grupare, este frecvența intervalului modal, este frecvența intervalului care precede modalul, este frecvența intervalului care urmează modalului.

Definiția 2. Moda Mo variabilă aleatoare discretă valoarea sa cea mai probabilă se numește.

Geometric, modul poate fi interpretat ca abscisa punctului maxim al curbei de distribuție. Sunt bimodal și multimodal distributie. Există distribuții care au un minim, dar nu un maxim. Astfel de distribuții sunt numite antimodal .

Definiție. Modal interval numit intervalul de grupare cu cea mai mare frecvență.

Median

Definiție. Median - rezultatul măsurării, care se află la mijlocul seriei clasate, cu alte cuvinte, mediana este valoarea caracteristicii X, atunci când jumătate din valorile datelor experimentale este mai mică decât aceasta, iar a doua jumătate este mai mare, se notează Pe mine.

Când dimensiunea eșantionului n- un număr par, adică există un număr par de rezultate de măsurare, apoi pentru a determina mediana se calculează valoarea medie a celor doi indicatori de eșantion situați la mijlocul seriei clasate.

Pentru datele grupate pe intervale, mediana este determinată de formula:

,

unde este limita inferioară a intervalului median; lățimea intervalului de grupare, 0,5 n- jumătate din dimensiunea eșantionului, - frecvența intervalului median, - frecvența cumulată a intervalului care precede mediana.

Definiție. intervalul median numit intervalul în care frecvența acumulată pentru prima dată va fi mai mult de jumătate din dimensiunea eșantionului ( n/ 2) sau frecvența acumulată va fi mai mare de 0,5.

Valorile numerice ale mediei, modului și medianei diferă atunci când există o formă nesimetrică a distribuției empirice.

Caracteristicile de împrăștiere de măsurare

Pentru analiza matematico-statistică a rezultatelor eșantionului nu este suficient să se cunoască doar caracteristicile postului. Aceeași valoare medie poate caracteriza eșantioane complet diferite.

Prin urmare, pe lângă ele, statisticile iau în considerare și caracteristici de împrăștiere (variatii, sau volatilitate ) rezultate.

Variație de interval

Definiție. în mare măsură variația este diferența dintre rezultatele eșantionului cel mai mare și cel mai mic, notate Rși hotărâtă

R=X max- X min.

Conținutul de informații al acestui indicator nu este mare, deși cu dimensiuni reduse ale eșantionului este ușor de estimat diferența dintre cele mai bune și cele mai proaste rezultate ale sportivilor.

Dispersia

Definiție. dispersie se numește pătratul mediu al abaterii valorilor atributelor de la media aritmetică.

Pentru datele negrupate, varianța este determinată de formulă

s2 = , (1)

Unde Х i- valoarea caracteristicii, - media aritmetică.

Pentru datele grupate pe intervale, varianța este determinată de formulă

,

Unde x i- Rău i interval de grupare, n i– frecvențe de interval.

Pentru a simplifica calculele și pentru a evita erorile de calcul la rotunjirea rezultatelor (mai ales la creșterea dimensiunii eșantionului), se folosesc și alte formule pentru a determina varianța. Dacă media aritmetică a fost deja calculată, atunci se utilizează următoarea formulă pentru datele negrupate:

pentru date grupate:

.

Aceste formule se obțin din cele anterioare prin extinderea pătratului diferenței sub semnul sumei.

Principalele caracteristici de dispersie utilizate pentru a evalua variația valorilor în raport cu media eșantionului sunt varianța, abaterea standard și coeficientul de variație.

1. Dispersia(din lat. dispersie - împrăștiere ) este media aritmetică a abaterilor pătrate ale valorilor x i de la media lor aritmetică.

Dispersia (D)- măsura dispersiei (abaterea de la medie), se determină astfel - media aritmetică se scade din fiecare opțiune, diferența se face pătrat și se înmulțește cu frecvența corespunzătoare acesteia. Apoi, determinați suma tuturor produselor și împărțiți-o la volumul populației:

Pentru datele grupate, varianța este determinată de:

Dimensiunea varianței nu coincide cu unitățile de măsură ale atributului variabil.

La rezolvarea problemelor practice, pe lângă utilizarea formulelor pentru calcularea varianței eșantionului, se folosește o valoare numită varianta corectata. Faptul este că valoarea varianței eșantionului dă valori subestimate în raport cu varianța reală, prin urmare, cu eșantioane mici (n< 30) необходимо применять исправленную дисперсию и среднеквадратическое отклонение :

sau

2. Eșantion și abaterea standard corectată (σ, s) este rădăcina pătrată a varianței. Dimensiunea abaterii standard, spre deosebire de dimensiunea varianței, coincide cu unitățile de date experimentale, deci este folosită în principal pentru a caracteriza dispersia trăsăturii studiate.

Prezentăm calculul dispersiei (Tabelul 5) de exemplu 1.

Tabelul 5

Calculul intermediar al varianței

Nu. p / p Valori mediane, x i Frecvențele de clasă, n i
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
sumă

Varianta pentru datele de exemplu grupate este:

Abaterea standard, respectiv, este egală cu:

Abaterea standard corectată este:

Rețineți că formulele pentru calcularea eșantionului și a variațiilor corectate diferă doar în numitori. Pentru n suficient de mare, eșantionul și variațiile corectate diferă puțin, așa că în practică varianța corectată este utilizată dacă n< 30 .

3. Coeficientul de variație (v)- este o măsură relativă a dispersiei unei caracteristici, este folosită ca indicator al omogenității observațiilor eșantionului (Tabelul 6).

Coeficientul de variație este raportul dintre abaterea standard și media aritmetică, exprimat ca procent. În plus, coeficientul de variație este adesea folosit atunci când se compară (compara) gradul de variație a diferitelor caracteristici exprimate în diferite unități de măsură.

Pentru a determina natura împrăștierii, coeficientul adimensional de variație v se calculează prin formula:

,

unde σ este abaterea standard;

Media aritmetică a datelor eșantionului.

Acțiune