Caracteristicile numerice ale variabilelor aleatoare, valorile lor statistice și probabilistice. Variabile aleatoare centrate

Caracteristica completă a unei variabile aleatoare este legea distribuției. În practică, o astfel de caracteristică nu poate fi întotdeauna obținută din cauza rezultatelor experimentale limitate. În aceste cazuri, în locul legilor de distribuție, se folosește o descriere aproximativă a variabilelor aleatoare, care se obține folosind numărul minim de caracteristici non-aleatoare. Numărul acestor caracteristici ar trebui să fie mic, dar ar trebui să reflecte cele mai semnificative caracteristici ale distribuției:

așteptarea matematică a unei variabile aleatoare;

Dispersia (momentul de ordin zero, 1).

Cea mai simplă caracteristică numerică a unei variabile aleatoare discrete X este valoarea medie: , unde este valoarea medie a variabilei aleatoare; N este numărul de teste; - valoarea variabilei aleatoare, pe care o ia în N încercări.

Pentru a caracteriza răspândirea valorilor unei variabile aleatoare discrete în această serie de experimente, se utilizează pătratul diferenței dintre valorile variabilei aleatoare și valoarea medie a acesteia: , unde este varianța statistică a variabilei aleatoare Х. valori în jurul valorii sale medii.

Dacă rezultatele experimentelor sunt caracterizate nu de o variabilă aleatoare, ci de mai multe, atunci pe lângă caracteristicile considerate se introduc cantități care caracterizează gradul de dependență dintre aceste variabile aleatoare. Ca atare caracteristică, de exemplu, pentru 2 variabile aleatoare x și y din această serie de experimente s-a adoptat următoarea valoare: . Egalitatea (4) moment de corelație statică. Cu o creștere a experimentelor, valoarea frecvenței de apariție a acestui eveniment se va apropia de probabilitate. Iar valoarea medie aritmetică va tinde spre așteptările sale matematice : , unde este probabilitatea de apariție a valorii . Astfel, așteptarea matematică a unei variabile aleatoare discrete X este suma produselor tuturor valorilor sale posibile x și probabilitatea de apariție a acestor valori. , varianța unei variabile aleatoare este așteptarea sa matematică a pătratului abaterii de la această valoare de la așteptarea sa matematică. , unde este o variabilă aleatoare centrată, , . Momentul corelației: , unde este probabilitatea ca variabila aleatoare X y preia valorile x i, y i, .

Pentru variabile aleatoare continue, așteptarea matematică, varianța și momentul de corelare se determină prin densitatea: .

Pentru variabile aleatoare independente: atunci , . Conform (9) pentru variabile aleatoare independente, prin urmare, dacă două variabile aleatoare sunt diferite de 0, atunci aceasta indică prezența unei relații între aceste variabile aleatoare. Variabile aleatoare pentru care se numesc variabile aleatoare necorelative. caracterizează nu numai dependența cantităților, ci și dispersia acestora. Dacă, de exemplu, una dintre valorile X sau Y se abate puțin de la așteptările sale matematice, atunci momentul de corelare va fi mic, indiferent de dependența acestor valori una de cealaltă.



Pentru a elimina acest neajuns, se introduce o caracteristică adimensională, care se numește coeficient de corelație: . Dacă folosim o interpretare mecanică, atunci abscisa poate fi reprezentată ca centru de greutate al figurii, iar dispersia ca momentul de inerție al figurii plane.

are o varianță de 1 și o așteptare de 0.

Variabilă aleatorie normalizată V este raportul dintre o variabilă aleatoare dată X și abaterea ei standard σ

Deviație standard este rădăcina pătrată a varianței

Așteptările matematice și varianța variabilei aleatoare normalizate V sunt exprimate în funcție de caracteristicile lui X, după cum urmează:

MV= M(X)σ=1v, DV= 1,

unde v este coeficientul de variație al variabilei aleatoare originale X.

Pentru funcția de distribuție F V (x) și densitatea de distribuție f V (x) avem:

F V (x) = F(σx), f V (x) = σf(σx),

Unde F(x) este funcția de distribuție a variabilei aleatoare originale X, A f(x) este densitatea sa de probabilitate.

Coeficient de corelație.

Coeficient de corelație este un indicator al naturii influenței stocastice reciproce a unei modificări a două variabile aleatoare. Coeficientul de corelație poate lua valori de la -1 la +1. Dacă valoarea modulo este mai aproape de 1, atunci aceasta înseamnă prezența unei conexiuni puternice, iar dacă este mai aproape de 0, nu există nicio conexiune sau este în esență neliniară. Cu un coeficient de corelație egal în valoare absolută cu unu, se vorbește de o relație funcțională (și anume, o dependență liniară), adică modificările în două mărimi pot fi descrise printr-o funcție liniară.

Procesul este numit stocastică, dacă este descris de variabile aleatoare a căror valoare se modifică în timp.

Coeficientul de corelație al lui Pearson.

Pentru mărimile metrice se folosește coeficientul de corelație Pearson, a cărui formulă exactă a fost derivată de Francis Hamilton. Fie X și Y două variabile aleatoare definite pe același spațiu de probabilitate. Atunci coeficientul lor de corelare este dat de formula:

inegalitățile lui Cebyșev.

inegalitatea lui Markov.

inegalitatea Markovîn teoria probabilității, oferă o estimare a probabilității ca o variabilă aleatorie să depășească o constantă pozitivă fixă ​​în valoare absolută, în termenii așteptărilor sale matematice. Estimarea rezultată este de obicei destul de grosieră. Cu toate acestea, permite să vă faceți o anumită idee despre distribuție atunci când aceasta din urmă nu este cunoscută în mod explicit.

Fie definită o variabilă aleatoare pe un spațiu de probabilitate și așteptarea ei matematică să fie finită. Apoi

,

Unde A > 0.

Inegalitate Chebyshev - Bieneme.

Dacă E< ∞ (E – математическое ожидание), то для любого , справедливо

Legea numerelor mari.

Legea numerelor mari afirmă că media empirică (media aritmetică) a unui eșantion finit suficient de mare dintr-o distribuție fixă ​​este aproape de media teoretică (așteptările) acelei distribuții. În funcție de tipul de convergență, se face distincția între legea slabă a numerelor mari, când are loc convergența în probabilitate, și legea puternică a numerelor mari, când convergența are loc aproape peste tot.



Va exista întotdeauna un astfel de număr de încercări încât, cu orice probabilitate predeterminată, frecvența de apariție a unui eveniment va diferi în mod arbitrar puțin de probabilitatea acestuia. Sensul general al legii numerelor mari este că acțiunea comună a unui număr mare de factori aleatori duce la un rezultat aproape independent de întâmplare.

Legea slabă a numerelor mari.

Atunci Sn P M(X).

Legea puternică a numerelor mari.

Atunci Sn→M(X) este aproape sigur.

Variabilă aleatoare centrată corespunzătoare RVX se numește diferența dintre variabila aleatoare X și așteptările sale matematice

Se numește variabila aleatoare normalizat dacă varianța sa este 1. Se numește o variabilă aleatoare centrată și normalizată standard.

Variabila aleatoare standard Z, corespunzătoare variabilei aleatoare X se gaseste dupa formula:

(1.24)

1.2.5. Alte caracteristici numerice

Moda SV discretă X definită ca atare valoare posibilă X m, pentru care

Moda continuă SWX numit număr real M 0 (X), definit ca punctul maxim al densității distribuției probabilității f(X).

Astfel, modul SW X este valoarea sa cea mai probabilă, dacă o astfel de valoare este unică. Un mod poate să nu existe, să aibă o singură valoare (distribuție unimodală) sau să aibă mai multe valori (distribuție multimodală).

Mediana SW continuuX numit număr real M D (X) satisfacerea condiţiei

Deoarece această ecuație poate avea mai multe rădăcini, mediana este determinată, în general, în mod ambiguu.

Moment de pornirem-al-lea ordin SWX (dacă există) se numește număr real m, determinat de formula

(1.27)

Momentul central al ordinului al m-lea SWX(dacă există) se numește număr m, determinat de formula

(1.28)

Așteptările matematice ale SW X este primul său moment inițial, iar varianța este al doilea moment central.

Dintre momentele de ordine superioară, momentele centrale ale ordinului 3 și 4 au o importanță deosebită.

Coeficientul de asimetrie ("teșit") A(X) se numeste cantitate

Coeficientul de curtoză („punctură”) E(X) SWX se numeste cantitate

1.3. Câteva legi de distribuție a variabilelor aleatoare discrete

1.3.1. Distribuția geometrică

SW discret X are o distribuție geometrică dacă valorile sale posibile sunt 0, 1, 2, …, m, … corespund probabilităților calculate prin formula

unde 0< p< 1,q= 1 –p.

În practică, o distribuție geometrică apare atunci când se fac un număr de încercări independente pentru a obține un rezultat. DARși probabilitatea producerii unui eveniment DARîn fiecare încercare P(A) =P. SW X este numărul de încercări inutile (până la primul experiment, în care apare evenimentul DAR), are o distribuție geometrică cu o serie de distribuții:

X i

p i

q 2 p

q m p

si caracteristici numerice:

(1.30)

1.3.2. Distribuția hipergeometrică

SW discret X cu valori posibile 0, 1, …, m, …,M are o distribuţie hipergeometrică cu parametri N,M,n, dacă

(1.31)

Unde MN,m n,nN,m,n,N,M- numere întregi.

Distribuția hipergeometrică apare în cazuri precum următoarele: există N obiecte, dintre care M au o anumită caracteristică. Disponibil N obiectele sunt alese la întâmplare n obiecte.

SW X numărul de obiecte cu atributul specificat dintre cele selectate se repartizează conform legii hipergeometrice.

Distribuția hipergeometrică este utilizată, în special, în rezolvarea problemelor legate de controlul calității produselor.

Așteptarea matematică a unei variabile aleatoare cu o distribuție hipergeometrică este:

(1.32)

așteptări matematice variabila aleatoare discreta se numeste suma produselor tuturor valorilor sale posibile si a probabilitatilor acestora

Cometariu. Din definiție rezultă că așteptarea matematică a unei variabile aleatoare discrete este o variabilă non-aleatoare (constantă).

Așteptările matematice ale unei variabile aleatoare continue pot fi calculate prin formula

M(X) =
.

Așteptările matematice sunt aproximativ egale cu(cu cât este mai precis, cu atât este mai mare numărul de încercări) media aritmetică a valorilor observate ale variabilei aleatoare.

Proprietățile așteptărilor matematice.

Proprietatea 1. Așteptările matematice ale unei constante este egală cu constanta însăși:

Proprietatea 2. Factorul constant poate fi scos din semnul așteptării:

Proprietatea 3. Așteptările matematice ale produsului a două variabile aleatoare independente este egală cu produsul așteptărilor lor matematice:

M(XY) =M(X) *M(Y).

Proprietatea 4. Așteptările matematice ale sumei a două variabile aleatoare este egală cu suma așteptărilor matematice ale termenilor:

M(X+Y) =M(X) +M(Y).

12.1. Dispersia unei variabile aleatoare și proprietățile acesteia.

În practică, este adesea necesar să se afle dispersia unei variabile aleatoare în jurul valorii sale medii. De exemplu, în artilerie este important să știți cât de aproape vor cădea obuzele aproape de ținta care ar trebui să fie lovită.

La prima vedere, poate părea că cel mai simplu mod de a estima împrăștierea este de a calcula toate valorile posibile ale abaterii unei variabile aleatoare și apoi de a găsi valoarea medie a acestora. Cu toate acestea, această cale nu va da nimic, deoarece valoarea medie a abaterii, adică M, pentru orice variabilă aleatorie este egală cu zero.

Prin urmare, cel mai adesea merg în sens invers - folosesc varianța pentru a calcula.

dispersie(difuzarea) unei variabile aleatoare este așteptarea matematică a abaterii pătrate a unei variabile aleatoare de la așteptarea ei matematică:

D(X) = M2.

Pentru a calcula varianța, este adesea convenabil să folosiți următoarea teoremă.

Teorema. Dispersia este egală cu diferența dintre așteptarea matematică a pătratului variabilei aleatoare X și pătratul așteptării sale matematice.

D (X) \u003d M (X 2) - 2.

Proprietăți de dispersie.

Proprietatea 1. Constanta de dispersieCeste egal cu zero:

Proprietatea 2. Un factor constant poate fi ridicat dincolo de semnul varianței prin pătratul:

D(CX)=C2D(X).

Proprietatea 3. Varianța sumei a două variabile aleatoare independente este egală cu suma varianțelor acestor variabile:

D(X+Y) =D(X) +D(Y).

Proprietatea 4. Varianta diferenței a două variabile aleatoare independente este egală cu suma varianțelor lor:

D(X-Y) =D(X) +D(Y).

13.1. Variabile aleatoare normalizate.

are o varianță de 1 și o așteptare de 0.

Variabilă aleatorie normalizată V este raportul dintre o variabilă aleatoare dată X și abaterea ei standard σ

Deviație standard este rădăcina pătrată a varianței

Așteptările matematice și varianța variabilei aleatoare normalizate V sunt exprimate în funcție de caracteristicile lui X, după cum urmează:

unde v este coeficientul de variație al variabilei aleatoare originale X.

Pentru funcția de distribuție F V (x) și densitatea de distribuție f V (x) avem:

F V (x) =F(σx), f V (x) =σf(σx),

Unde F(x) este funcția de distribuție a variabilei aleatoare originale X, A f(x) este densitatea sa de probabilitate.

CARACTERISTICI DE împrăștiere

Din caracteristicile poziției - așteptare matematică, mediană, mod - să trecem la caracteristicile răspândirii unei variabile aleatoare X. dispersie D(X)= a 2 , abaterea standard a și coeficientul de variație v. Definiția și proprietățile varianței pentru variabile aleatoare discrete au fost luate în considerare în capitolul anterior. Pentru variabile aleatoare continue

Abaterea standard este valoarea nenegativă a rădăcinii pătrate a varianței:

Coeficientul de variație este raportul dintre abaterea standard și așteptarea matematică:

Coeficient de variație – aplicat când M(X)> O - măsoară răspândirea în unități relative, în timp ce abaterea standard - în absolut.

Exemplul 6. Pentru o variabilă aleatoare distribuită uniform X găsiți varianța, abaterea standard și coeficientul de variație. Dispersia este:

Substituție variabilă face posibilă scrierea:

Unde cu = f - aU2.

Prin urmare, abaterea standard este iar coeficientul de variație este:

TRANSFORMĂRILE VALORILOR ALEATORII

Pentru fiecare variabilă aleatoare X definiți încă trei cantități - centrate Y, normalizat Vși dat U. Variabilă aleatoare centrată Y este diferența dintre variabila aleatoare dată Xși așteptările sale matematice M(X), acestea. Y=X - M(X). Așteptările matematice ale unei variabile aleatoare centrate Y este egală cu 0, iar varianța este varianța variabilei aleatoare date:

functie de distributie Fy(x) variabilă aleatoare centrată Y legate de funcţia de distribuţie F(x) a variabilei aleatoare originale X raport:

Pentru densitățile acestor variabile aleatoare, egalitatea

Variabilă aleatorie normalizată V este raportul variabilei aleatoare date X la abaterea sa standard a, i.e. V = XIo. Așteptările matematice și varianța unei variabile aleatoare normalizate V exprimate prin caracteristici X Asa de:

unde v este coeficientul de variație al variabilei aleatoare originale X. Pentru funcția de distribuție Fv(x) si densitate fv(x) variabilă aleatoare normalizată V noi avem:

Unde F(x)- funcţia de distribuţie a variabilei aleatoare originale X; repara) este densitatea sa de probabilitate.

Variabilă aleatoare redusă U este o variabilă aleatoare centrată și normalizată:

Pentru o variabilă aleatoare redusă

Variabilele aleatoare normalizate, centrate și reduse sunt utilizate în mod constant atât în ​​cercetarea teoretică, cât și în algoritmi, produse software, documentație de reglementare și tehnică și instructivă și metodologică. În special, pentru că egalitățile M(U) = 0, D(lf) = 1 fac posibilă simplificarea fundamentarii metodelor, formulărilor de teoreme și formulelor de calcul.

Se folosesc transformări ale variabilelor aleatoare și un plan mai general. Deci, dacă U = aX + b, Unde Ași b sunt niște numere, atunci

Exemplul 7. Dacă A= 1/G, b = -M(X)/G, atunci Y este o variabilă aleatoare redusă, iar formulele (8) sunt transformate în formule (7).

Cu fiecare variabilă aleatoare X se poate conecta multimea variabilelor aleatoare Y date prin formula Y = Oh + b la diverse a > 0 și b. Acest set se numește familia de forfecare, generat de o variabilă aleatoare X. Funcții de distribuție Fy(x) constituie o familie de distribuții scale-shift generate de funcția de distribuție F(x).În loc de Y= aX + b notație folosită frecvent

Număr cu se numește parametrul de schimbare și numărul d- parametrul de scară. Formula (9) arată că X- rezultatul măsurării unei anumite valori - merge la K - rezultatul măsurării aceleiași valori, dacă începutul măsurării este mutat într-un punct cu,și apoi folosiți noua unitate de măsură, în d ori mai mare decât cea veche.

Pentru familia scale-shift (9), distribuția X numit standard. În metodele probabilistic-statistice de luare a deciziilor și alte cercetări aplicate, se utilizează distribuția normală standard, distribuția standard Weibull-Gnedenko, distribuția standard gamma.

distribuție etc. (vezi mai jos).

Sunt folosite și alte transformări ale variabilelor aleatoare. De exemplu, pentru o variabilă aleatoare pozitivă X considera Y = IgX, Unde IgX- logaritmul zecimal al unui număr X. Lanț de egalități

raportează funcțiile de distribuție Xși Y.

Acțiune