Variabila aleatoare e are o lege de distribuție normală. Distributie normala

Definiție. normal numită distribuție de probabilitate continuă variabilă aleatorie, care este descris de densitatea de probabilitate

Distribuția normală se mai numește legea lui Gauss.

Legea distribuției normale este centrală pentru teoria probabilității. Acest lucru se datorează faptului că această lege se manifestă în toate cazurile când o variabilă aleatorie este rezultatul acțiunii unui număr mare. diverși factori. Toate celelalte legi de distribuție se apropie de legea normală.

Se poate arăta cu ușurință că parametrii și , incluse în densitatea distribuției sunt, respectiv, așteptarea matematică și abaterea standard a variabilei aleatoare X.

Să găsim funcția de distribuție F(X) .

Graficul normal al densității distribuției se numește curba normala sau curba gaussiana.

O curbă normală are următoarele proprietăți:

1) Funcția este definită pe toată axa numerelor.

2) Pentru toți X funcția de distribuție ia numai valori pozitive.

3) Axa OX este asimptota orizontală a graficului densității probabilității, deoarece cu o creştere nelimitată a valorii absolute a argumentului X, valoarea funcției tinde spre zero.

4) Aflați extremul funcției.

pentru că la y’ > 0 la X < mși y’ < 0 la X > m, apoi la punct x = t funcția are un maxim egal cu
.

5) Funcția este simetrică față de o dreaptă x = a, deoarece diferență

(x - a) intră în funcția de densitate de distribuție la pătrat.

6) Pentru a găsi punctele de inflexiune ale graficului, găsim derivata a doua a funcției de densitate.

La X = m+  și X = m-  derivata a doua este egală cu zero, iar la trecerea prin aceste puncte își schimbă semnul, adică. în aceste puncte funcţia are o inflexiune.

În aceste puncte, valoarea funcției este
.

Să construim un grafic al funcției de densitate de distribuție (Fig. 5).

Graficele au fost construite pentru t=0 și trei valori posibile ale abaterii standard  = 1,  = 2 și  = 7. După cum puteți vedea, pe măsură ce valoarea abaterii standard crește, graficul devine mai plat, iar valoarea maximă scade.

În cazul în care un A> 0, atunci graficul se va deplasa în direcția pozitivă dacă A < 0 – в отрицательном.

La A= 0 și  = 1 se numește curba normalizat. Ecuația curbei normalizate:

      Funcția Laplace

Aflați probabilitatea ca o variabilă aleatoare distribuită conform legii normale să se încadreze într-un interval dat.

Denota

pentru că integrală
nu se exprimă în termeni de funcții elementare, atunci funcția

,

Care e numit Funcția Laplace sau integrală de probabilitate.

Valorile acestei funcții pentru diferite valori X calculate şi prezentate în tabele speciale.

Pe fig. 6 prezintă un grafic al funcției Laplace.

Funcția Laplace are următoarele proprietăți:

1) F(0) = 0;

2) F(-x) = - F(x);

3) F() = 1.

Se mai numește și funcția Laplace funcția de eroareși indică erf X.

Încă în uz normalizat funcția Laplace, care este legată de funcția Laplace prin relația:

Pe fig. 7 prezintă un grafic al funcției Laplace normalizate.

      P regula trei sigma

Când se consideră distribuția normală, se distinge un caz special important, cunoscut sub numele regula trei sigma.

Să notăm probabilitatea ca abaterea unei variabile aleatoare distribuite normal de la așteptări matematice mai mică decât valoarea setată :

Dacă acceptăm  = 3, atunci obținem folosind tabelele de valori ale funcției Laplace:

Acestea. probabilitatea ca o variabilă aleatoare să se abate de la așteptările ei matematice cu o sumă mai mare de trei ori deviația standard este practic zero.

Această regulă se numește regula trei sigma.

În practică, se crede că, dacă pentru orice variabilă aleatorie este îndeplinită regula trei sigma, atunci această variabilă aleatoare are o distribuție normală.

Concluzia cursului:

În cadrul prelegerii, am luat în considerare legile distribuției cantităților continue.În pregătirea pentru următoarea prelegere și exerciții practice, ar trebui să completați în mod independent notele de curs cu un studiu aprofundat al literaturii recomandate și rezolvarea problemelor propuse.

Înlocuind φ(x)=π /4 ,f(x)=1/(b-a)

D[π /4]=( /720) ).

№319 Muchia cubului X măsurată aproximativ A . Considerând muchia cubului ca o variabilă aleatoare X distribuită uniform în intervalul (a,b), găsiți așteptarea și varianța matematică a volumului cubului.

1. Să găsim așteptarea matematică a ariei cercului - o variabilă aleatorie Y=φ(K)= - conform formulei

M[φ(X)]=

Punând φ(x)= ,f(x)=1/(b-a) iar după integrare, obținem

M( )=
.

2. Găsiți dispersia zonei cercului folosind formula

D[φ(X)]= - .

Înlocuind φ(x)= ,f(x)=1/(b-a) iar după integrare, obținem

D = .

№320 Variabilele aleatoare X și Y sunt independente și uniform distribuite: X-în intervalul (a,b), Y-în intervalul (c,d) Aflați așteptarea matematică a produsului XY.

Așteptările matematice ale produsului variabilelor aleatoare independente este egală cu produsul așteptărilor lor matematice, i.e.

M(XY)=

№321 Variabilele aleatoare X și Y sunt independente și uniform distribuite: X - în intervalul (a,b), Y - în intervalul (c,d). Aflați varianța produsului XY.

Să folosim formula

D(XY)=M[

Așteptările matematice ale produsului variabilelor aleatoare independente este egală cu produsul așteptărilor lor matematice, prin urmare

Să găsim M după formula

M[φ(X)]=

Înlocuind φ(x)= ,f(x)=1/(b-a)și integrând, obținem

M (**)

În mod similar, găsim

M (***)

Înlocuind M(X)=(a+b)/2, M(Y)=(c+d)/2, precum și (***) și (**) în (*), obținem în sfârșit

D(XY)= -[ .

№322 Așteptările matematice ale unei variabile aleatoare X distribuite normal este a=3 și abaterea standard σ=2. Scrieți densitatea de probabilitate a lui X.

Să folosim formula:

f(x)= .

Înlocuind valorile disponibile obținem:

f(x)= = f(x)= .

№323 Scrieți densitatea de probabilitate a unei variabile aleatoare X distribuite normal, știind că M(X)=3, D(X)=16.

Să folosim formula:

f(x)= .

Pentru a găsi valoarea lui σ, folosim proprietatea că abaterea standard a unei variabile aleatoare X egală rădăcină pătrată din dispersia ei. Prin urmare σ=4, M(X)=a=3. Înlocuind în formula obținem

f(x)= = .

№324 O variabilă aleatoare X distribuită normal este dată de densitate

f(x)= . Aflați așteptările matematice și varianța lui X.

Să folosim formula

f(x)= ,

Unde A-valorea estimata, σ -abaterea standard X. Din aceasta formula rezulta ca a=M(X)=1. Pentru a găsi varianța, folosim proprietatea că abaterea standard a unei variabile aleatoare X este egală cu rădăcina pătrată a varianței sale. Prin urmare D(X)= =

Răspuns: așteptarea matematică este 1; varianța este 25.

Bondarchuk Rodion

Având în vedere funcția de distribuție a legii normale normalizate . Aflați densitatea distribuției f(x).

Știind că , găsim f(x).

Răspuns:

Demonstrați că funcția Laplace . ciudat: .

Vom face un înlocuitor

Facem înlocuirea inversă și obținem:

= =



În diferite ramuri ale științei și tehnologiei, precum și în practica metrologică, legea distribuției normale (sau pur și simplu legea normală) și-a găsit cea mai mare aplicare. Multe variabile aleatoare continue se supun acestei legi. Utilizarea pe scară largă a legii distribuției normale este explicată prin teorema limită centrală. Din această teoremă rezultă că dacă variabila aleatoare X este suma variabilelor aleatoare reciproc independente x p x 2, ..., X, influența fiecăruia asupra întregii sume este nesemnificativă, atunci indiferent de ce legi de distribuție se supune fiecărui termen x p, valoarea în sine X va avea o distribuție de probabilitate apropiată de normal și cu atât mai precisă decât mai mult număr termeni.

Funcția diferențială distribuția sau densitatea distribuției de probabilitate a unei aleatorii valoare continuă, respectând legea normală, are forma:

unde x este o variabilă aleatorie (rezultatul observațiilor); Oh, a d este abaterea standard a rezultatelor observațiilor componentei aleatorii a erorii lor; t x- matematică

așteptare; în este baza logaritmilor naturali, e = 2, 71828.

Trebuie amintit că Oh= a d.

Funcția diferențială a distribuției normale este exprimată grafic ca o curbă în formă de clopot (curba Gauss), prezentată în fig. 5.8.

Funcția Ф(А) a distribuției normale normalizate (integrala gaussiană) este prezentată sub formă tabelară în Anexa A.

După cum se vede în fig. 5.8, curba de distribuție normală a unei variabile aleatoare x a rezultatelor măsurătorii este simetrică în raport cu așteptarea matematică.

Dacă x sunt rezultatele observațiilor multiple ale aceluiași determinist cantitate fizica, atunci curba de mai sus este simetrică în raport cu așteptarea matematică a rezultatelor acestor observații.

După cum sa menționat mai devreme, dacă o eroare aleatoare A cu o abatere standard a d este luată ca variabilă aleatoare, această curbă este simetrică față de axa y (Fig. 5.9).

Poziția curbei P x (x)=/(x) relativ la origine este determinată de valoarea așteptării matematice. Și de obicei, în practică, nu așteptările matematice sunt luate, ci media aritmetică a rezultatelor observațiilor multiple. X.

Forma curbei de distribuție normală este determinată de parametrul a. După cum sa arătat mai devreme, cu cât a mai mic, cu atât curba devine mai aprinsă, iar ramurile sale converg (vezi Fig. 5.4).

Probabilitatea ca rezultatul observației să se încadreze într-un interval dat [x p x 2] este egală cu aria de sub curba de distribuție normală, mărginită de limitele inferioare Xj și superioare x 7 ale intervalului de încredere (Fig. 5.10).

Să o exprimăm matematic:

Schimbând variabilele și înlocuindu-le, obținem

În teoria probabilității și metrologie, așa-numita funcție Laplace normalizată Ф(Z) =

= care este intabulat. Condiții de raționalizare

sunt că valoarea mediei aritmetice a rezultatelor măsurătorii X se ia egal cu zero, iar abaterea standard o = 1. În acest caz, parametrul este valoarea

Valorile funcției Laplace sunt date în Anexa B. Folosind funcția Laplace, se poate determina probabilitatea de a atinge rezultatul observației după cum urmează Xîn intervalul (x, x 2):

Expresia de mai sus spune că probabilitatea ca rezultatul observației să se încadreze în intervalul dat [х р x-,] este egală cu diferența dintre valorile funcției Laplace în punctele limitelor superioare și inferioare ale intervalului de încredere. .

Când luați în considerare această formulă, rețineți că O(-Z) = -0(Z).

Momente ale funcției de distribuție a erorii aleatoare A, distribuite conform legii normale:

Funcția integrală a distribuției normale prezentată în fig. 5.11 se exprimă în termeni de diferenţial după cum urmează:


Regula trei sigma.În practică, destul de des este necesar să se estimeze probabilitatea ca abaterea unei cantități distribuite normal Xîn valoare absolută nu depășește o anumită dimensiune, care este de obicei luată egală cu număr pozitiv 8.

Cu alte cuvinte, este necesar să se găsească probabilitatea ca inegalitatea Xa 5.

Această inegalitate este echivalentă cu următoarele: - b sau (a-b) +5).

Folosind regula potrivit căreia probabilitatea ca o variabilă aleatorie distribuită normal să se încadreze într-un interval dat este egală cu diferența dintre valorile funcției Laplace la limitele acestui interval, adică. P(a(3) =

= ", primim

La a = 0 primim

Dacă presupunem că 5 = Pentru, obținem

Astfel, probabilitatea de abatere a valorii adevărate a variabilei aleatoare Xîn valoare absolută va fi mai mică de trei ori abaterea standard. Aceasta este regula trei sigma.

Este formulat astfel: dacă variabila aleatoare este distribuită normal, atunci valoarea absolută abatere maxima rezultatul măsurării din așteptarea matematică nu depășește de trei ori abaterea standard.

Această regulă se aplică și după cum urmează: dacă distribuția unei variabile aleatoare este necunoscută, dar este îndeplinită condiția specificată în regula trei sigma, atunci există motive să presupunem că variabila aleatoare studiată este distribuită în mod normal, altfel nu.

întrebări de testare

  • 1. Funcția de distribuție diferențială a rezultatelor măsurătorilor și a erorii aleatoare, respectând legea normală. Dependență analitică, vedere grafică, momente inițiale și centrale.
  • 2. Funcția integrală corespunzătoare legii distribuției normale.
  • 3. Regula celor trei sigma.

Legea distribuției normale este cea mai comună în practică. Principala trăsătură care o deosebește de alte legi este că este o lege limitativă, față de care se abordează alte legi de distribuție în condiții tipice foarte des întâlnite (vezi capitolul 6).

Definiție. O variabilă aleatoare continuă X arelegea distribuției normale (legea Gauss)cu parametrii a și a 2, dacă densitatea sa de probabilitate are forma

Termenul „normal” nu este în întregime de succes. Multe semne respectă legea normală, de exemplu, înălțimea unei persoane, raza de acțiune a unui proiectil și așa mai departe. Dar dacă vreun semn se supune altuia, diferită de legea normală, de distribuție, atunci aceasta nu vorbește deloc despre „anormalitatea” fenomenului asociat cu acest semn.

Curba de distribuție normală se numește normal, sau gaussian, strâmb. Pe fig. 4.6, A, 6 este dată curba normală φ, (x) cu parametrii d00 2, adică. In absenta a 2) și graficul funcției de distribuție a unei variabile aleatoare X, care are o lege normală. Rețineți că o curbă normală este simetrică față de o linie dreaptă. x = a, are un maxim la punct X= A,

egal , adică

Și două puncte de inflexiune x = a±

cu ordonata

Se poate observa că în expresia pentru densitatea legii normale, parametrii sunt notați cu literele Ași st 2 , prin care notăm așteptarea matematică M(X) și dispersie OH). O astfel de coincidență nu este întâmplătoare. Să considerăm o teoremă care stabilește semnificația probabilistică a parametrilor legii normale.

Teorema. Așteptarea matematică a unei variabile aleatoare X distribuită conform legii normale este egală cu parametrul a al acestei legi, acestea.

A varianța sa - parametru a 2 , adică

Așteptările matematice ale unei variabile aleatorii X:

Facem o schimbare de variabilă prin setare

Apoi limitele integrării nu se schimbă

și, prin urmare

(prima integrală este egală cu zero ca integrală a unei funcții impare pe un interval simetric în raport cu originea coordonatelor, iar a doua integrală este integrala Euler-Poisson).

Varianta unei variabile aleatoare X:

Facem aceeași schimbare de variabilă x = a + o^2 t, ca la calculul integralei anterioare. Apoi

Aplicând metoda integrării pe părți, obținem

Aflați cum se va schimba curba normală la modificarea parametrilor Ași cu 2 (sau a). Dacă a = const, iar parametrul se modifică a (a x a 3), adică centrul de simetrie al distribuției, atunci curba normală se va deplasa de-a lungul axei x fără a-și schimba forma (Fig. 4.7).

În cazul în care un a = const și se modifică parametrul a 2 (sau a), apoi se schimbă ordonata

curba maxima Pe măsură ce crește, ordonata maximului

curba scade, dar deoarece aria sub orice curbă de distribuție trebuie să rămână egală cu unitatea, curba devine mai plată, întinzându-se de-a lungul axei x; când scade su, dimpotrivă, curba normală se întinde în sus, micșorându-se simultan din lateral. Pe fig. 4.8 prezintă curbele normale cu parametrii a 1 (o 2 și a 3, unde o, A(aka așteptare matematică) caracterizează poziția centrului, iar parametrul a 2 (aka dispersie) caracterizează forma curbei normale.

Distribuția normală a unei variabile aleatoare X cu parametrii A= 0, st 2 = 1, g.u. X ~ N( 0; 1), se numește standard sau normalizat iar curba normală corespunzătoare este standard sau normalizat.

Dificultatea de a găsi direct funcția de distribuție a unei variabile aleatoare distribuite conform legii normale conform formulei (3.23) și probabilitatea ca aceasta să se încadreze într-un anumit interval conform formulei (3.22) este legată de faptul că integrala lui funcția (4.26) este „necolectabilă” în functii elementare. Prin urmare, ele sunt exprimate prin funcție

- funcţie (integrala de probabilitate) Laplace, pentru care sunt realizate tabelele. Reamintim că am întâlnit deja funcția Laplace când luăm în considerare teorema integrală a lui Moivre - Laplace (vezi Secțiunea 2.3). Proprietățile sale au fost luate în considerare și acolo. Din punct de vedere geometric, funcția Laplace Ф(.с) este aria de sub curba normală standard a segmentului [-X; X] (Fig. 4.9) 1 .

Orez. 4.10

Orez. 4.9

Teorema. Funcția de distribuție a unei variabile aleatoare X, distribuită conform legii normale, este exprimată în termenii funcției LaplaceФ(х) conform formulei

Conform formulei (3.23), funcția de distribuție:

Să facem o schimbare de variabilă, presupunând X-> -oo? -" -00, deci

1 Alături de integrala de probabilitate a formei (4.29), care reprezintă funcția Ф(х), expresiile acesteia sunt folosite și în literatură sub forma altor funcții tabulate:

care sunt ariile curbei normale standard, respectiv, pe intervalele (0; x], (-oo; x], [-x>/2; Xl/2; .

Prima integrală

(datorită uniformității integrandului și faptului că integrala Euler-Poisson este egală cu [la).

A doua integrală, ținând cont de formula (4.29), este

Geometric, funcția de distribuție este aria de sub curba normală pe intervalul (-co, x) (Fig. 4.10). După cum puteți vedea, este format din două părți: prima, pe interval (-oo, A), egal cu 1/2, i.e. jumătate din întreaga zonă sub curba normală, iar a doua, pe intervalul (i, x),

egal

Luați în considerare proprietățile unei variabile aleatoare distribuite conform legii normale.

1. Probabilitatea de a atinge o variabilă aleatoare X, distribuită conform legii normale,în interval[x 1(x 2 ], este egal cu

Având în vedere că, conform proprietății (3.20), probabilitatea P(x,

unde și Г 2 sunt determinate de formula (4.33) (Fig. 4.11). ?

2. Probabilitatea ca abaterea unei variabile aleatoare X, distribuită conform legii normale, de la așteptarea matematică a să nu depășească valoarea A > 0 ( în valoare absolută), este egal cu

precum și proprietatea de ciudățenie a funcției Laplace, obținem

Unde? \u003d D / o (Fig. 4.12). ?

Pe fig. 4.11 și 4.12 oferă o interpretare geometrică a proprietăților legii normale.

Cometariu. Considerat în cap. 2 formula integrală aproximativă a lui Moivre - Laplace (2.10) rezultă din proprietatea (4.32) a unei variabile aleatoare distribuite normal cu x (= a, x 2 = b) a = pr și Asa de

ca lege binomială de distribuție a unei variabile aleatoare x=t cu parametrii P și R, pentru care s-a obtinut aceasta formula, la n -> oc tinde spre legea normală (vezi cap. 6).

În mod similar, consecințele (2.13), (2.14) și (2.16) ale formulei integrale Moivre-Laplace pentru numărul x=t producerea unui eveniment în P teste independente și frecvența acesteia t/n rezultă din proprietățile (4.32) și (4.34) ale legii normale.

Să calculăm prin formula (4.34) probabilitățile P(X-a e) la diferite valori ale lui D (folosim Tabelul II din anexe). obține

De aici provine „regula celor trei sigma”.

Dacă o variabilă aleatoare X are o lege de distribuție normală cu parametrii ași un 2 , adică M(a; a 2), atunci este aproape sigur că valorile sale sunt în interval(a - pentru, A+ Pentru).

Încălcarea „regula celor trei sigma”, i.e. abaterea unei variabile aleatoare distribuite normal X mai mult de 3a (dar în valoare absolută), este un eveniment care este practic imposibil, deoarece probabilitatea sa este foarte mică:

Rețineți că abaterea D în, la care , se numește

abatere probabilă. Pentru legea normală D în « 0.675a, i.e. pe interval (A - 0,675a, A+ 0,675a) reprezintă jumătate din suprafața totală sub curba normală.

Aflați coeficientul de asimetrie și curtoza variabilei aleatoare X, distribuite conform legii normale.

Evident, datorită simetriei curbei normale față de linia verticală x = a, trecând prin centrul de distribuţie a \u003d M (X), coeficientul de asimetrie al distribuției normale L \u003d 0.

Curtoza unei variabile aleatoare distribuite normal X găsim prin formula (3.37), i.e.

unde ai invatat asta moment central Ordinul al 4-lea, găsit prin formula (3.30) ținând cont de definiția (4.26), i.e.

(omitem calculul integralei).

Prin urmare, kurtoza distribuției normale este zero iar abrupta altor distribuții este definită în raport cu cea normală (am menționat deja acest lucru în Secțiunea 3.7).

O Exemplul 4.9. Presupunând că înălțimea bărbaților dintr-o anumită grupă de vârstă este o variabilă aleatoare distribuită normal X cu parametrii A= 173 și a 2 = 36:

  • 1) Aflați: a) expresia pentru densitatea de probabilitate și funcția de distribuție a unei variabile aleatoare X; b) proporția costumelor de înălțimea a 4-a (176-182 cm) și a 3-a înălțime (170-176 cm), care trebuie prevăzute în volumul total de producție pentru această grupă de vârstă; c) cuantilă x 07și 10% punct variabil aleatoriu X.
  • 2) Formulați „regula celor trei sigma” pentru o variabilă aleatorie X. Decizie. 1, a) Folosind formulele (4.26) și (4.30), scriem

1, b) Ponderea costumelor de înălțimea a 4-a (176-182 cm) în producția totală este determinată de formula (4.32) ca probabilitate


(Fig. 4.14), deoarece conform formulelor (4.33)

Proporția costumelor de a 3-a înălțime (170-176 cm) ar putea fi determinată în mod similar cu formula (4.32), dar este mai ușor de realizat folosind formula (4.34), având în vedere că acest interval este simetric față de așteptarea matematică. A = M(X) = 173 i.e. inegalitate 170 X X -173|

(vezi Fig. 4.14;.

1, c) Quantile x 07(vezi paragraful 3.7) variabilă aleatoare X găsim din ecuația (3.29) ținând cont de formula (4.30):

Unde

Conform tabelului 11 aplicații pe care le găsim eu- 0,524 și

Aceasta înseamnă că 70% dintre bărbații din această grupă de vârstă au sub 176 cm înălțime.

  • 10% punct - cuantila ego x 09 \u003d 181 cm (găsit similar), i.e. 10% dintre bărbați au cel puțin 181 cm înălțime.
  • 2) Este aproape sigur că creșterea bărbaților din această grupă de vârstă se încadrează în limitele de la A- Z = 173 - 3 6 = 155 până la un + Zet \u003d 173 + 3 - 6 \u003d \u003d 191 (cm), adică. 155

    Datorită particularităților legii distribuției normale notate la începutul paragrafului (și în capitolul 6), aceasta ocupă un loc central în teoria și practica metodelor probabilistic-statistice. Marea semnificație teoretică a legii normale constă în faptul că cu ajutorul ei se obțin o serie de distribuții importante, care sunt considerate mai jos.

    • Săgețile din fig. 4.11-4.13 au marcat condiționat aria și d și cifrele corespunzătoare sub curba normală.
    • Valorile funcției Laplace F(x) sunt determinate din tabel. II cereri.

Luați în considerare distribuția normală. Folosind funcțiaMS EXCELNORM.DIST() să reprezentăm graficul funcției de distribuție și al densității probabilității. Să generăm o matrice numere aleatorii distribuite conform legii normale, vom estima parametrii de distribuție, valoarea medie și abaterea standard.

Distributie normala(numită și distribuția Gaussiană) este cea mai importantă atât în ​​teorie, cât și în aplicațiile sistemului de control al calității. importanța valorii distributie normala(Engleză) Normaldistributie) în multe domenii ale științei rezultă din teoria probabilității.

Definiție: Valoare aleatoare X distribuit de legea normală daca are:

Distributie normala depinde de doi parametri: μ (mu)- este și σ ( sigma)- este un ( deviație standard). Parametrul μ determină poziția centrului probabilitate densitate distributie normala, iar σ este răspândirea în jurul centrului (medie).

Notă: Influența parametrilor μ și σ asupra formei distribuției este descrisă în articolul despre , și în exemplu de fișier din foaia de lucru Setări de influență puteți utiliza pentru a observa schimbarea formei curbei.

Distribuție normală în MS EXCEL

În MS EXCEL, începând cu versiunea 2010, pt distributie normala există o funcție NORM.DIST(), numele în limba engleză este NORM.DIST(), care vă permite să calculați probabilitate densitate(vezi formula de mai sus) și funcția de distribuție integrală(probabilitatea ca o variabilă aleatoare X să fie distribuită peste legea normală, ia o valoare mai mică sau egală cu x). Calculele în acest ultim caz se fac după următoarea formulă:

Distribuția de mai sus are notația N(μ; σ). Este, de asemenea, adesea folosită notația prin N(μ; σ 2).

Notă: Înainte de MS EXCEL 2010, EXCEL avea doar funcția NORMDIS(), care vă permite, de asemenea, să calculați funcția de distribuție și densitatea probabilității. NORMDIST() a fost lăsat în MS EXCEL 2010 pentru compatibilitate.

distribuție normală standard

distribuție normală standard numit distributie normala cu μ=0 și σ=1. Distribuția de mai sus are notația N(0;1).

Notă: În literatură, pentru o variabilă aleatoare distribuită peste standard legea normala, denumirea specială z este fixă.

Orice distributie normala poate fi convertit în standard prin substituție variabilă z=(X-μ)/σ . Acest proces de transformare se numește standardizare.

Notă: MS EXCEL are o funcție NORMALIZE() care realizează transformarea de mai sus. Deși în MS EXCEL această transformare este numită din anumite motive normalizare. Formulele =(x-μ)/σ și =NORMALIZARE(x;μ;σ) va returna acelasi rezultat.

În MS EXCEL 2010 pentru disponibil functie speciala NORM.ST.DIST() și moștenirea sa NORMSDIST() , care efectuează calcule similare.

Să demonstrăm cum se desfășoară procesul de standardizare în MS EXCEL distributie normala N(1,5; 2).

Pentru a face acest lucru, calculăm probabilitatea ca o variabilă aleatorie să fie distribuită legea normală N(1,5; 2), mai mic sau egal cu 2,5. Formula arată astfel: =NORM.DIST(2,5; 1,5; 2; TRUE)=0,691462. Prin efectuarea unei schimbări de variabilă z=(2,5-1,5)/2=0,5 , scrieți formula de calcul Distribuție normală standard:=NORM.ST.DIST(0,5, TRUE)=0,691462.

Desigur, ambele formule dau aceleași rezultate (vezi Fig. fișă de fișier exemplu Exemplu).

Rețineți că standardizare se aplică numai la (argument integrală este egal cu TRUE), nu la probabilitate densitate.

Notă: În literatură, pentru o funcție care calculează probabilitățile unei variabile aleatoare distribuite peste standard legea normala, se fixează denumirea specială Ф(z). În MS EXCEL, această funcție este calculată prin formula
=NORM.ST.DIST(z,TRUE). Calculele se fac după formula

Deoarece funcția este pară distribuția f(x), și anume f(x)=f(-x), funcția distribuție normală standard are proprietatea Ф(-x)=1-Ф(x).

Funcții inverse

Funcţie STANDARDS.DIST(x;TRUE) calculează probabilitatea P ca variabila aleatoare X să ia o valoare mai mică sau egală cu x. Dar de multe ori trebuie să faceți un calcul invers: cunoscând probabilitatea P, doriți să calculați valoarea lui x. Se numește valoarea calculată a lui x standard distributie normala.

În MS EXCEL pentru calcul cuantile utilizați funcțiile NORM.ST.INV() și NORM.INV().

Grafice de funcții

Fișierul exemplu conține diagrame de densitate de distribuție probabilități și funcția de distribuție integrală.

După cum știți, aproximativ 68% din valorile selectate din populație cu distributie normala, sunt cu o abatere standard (σ) de la μ (medie sau așteptări matematice); aproximativ 95% sunt în 2 σ și deja 99% dintre valori sunt în 3 σ. Asigurați-vă că asta pentru distribuție normală standard se poate scrie formula:

=NORM.ST.DIST(1,TRUE)-NORM.ST.DIST(-1,TRUE)

care va returna o valoare de 68,2689% - adică procentul de valori care se află în +/-1 abatere standard de mijloc(cm. sheet Graph în fișier exemplu).

Deoarece funcția este pară densitate standard normală distributii: f(X)= f(-X), funcție distribuție normală standard are proprietatea F(-x)=1-F(x). Prin urmare, formula de mai sus poate fi simplificată:

=2*NORM.ST.DIST(1;TRUE)-1

Pentru arbitrar funcții normale de distribuție N(μ; σ) calcule similare ar trebui făcute folosind formula:

2* NORM.DIST(μ+1*σ;μ;σ;TRUE)-1

Calculele de probabilitate de mai sus sunt necesare pentru .

Notă: Pentru comoditatea scrierii formulelor în fișierul exemplu sunt create pentru parametrii de distribuție: μ și σ.

Generarea numerelor aleatorii

Să generăm 3 tablouri de 100 de numere cu μ și σ diferite. Pentru a face acest lucru, în fereastră Generaţie numere aleatorii setați următoarele valori pentru fiecare pereche de parametri:

Notă: Dacă setați opțiunea Imprăștire aleatorie (Sămânță aleatorie), apoi puteți alege un anumit set aleatoriu de numere generate. De exemplu, setând această opțiune la 25, puteți genera aceleași seturi de numere aleatorii pe computere diferite (dacă, desigur, alți parametri de distribuție sunt aceiași). Valoarea opțiunii poate lua valori întregi de la 1 la 32 767. Numele opțiunii Imprăștire aleatorie poate deruta. Ar fi mai bine să o traducem ca Setați un număr cu numere aleatorii.

Ca urmare, vom avea 3 coloane de numere, pe baza cărora se pot estima parametrii distribuției din care a fost realizat eșantionul: μ și σ . O estimare pentru μ poate fi făcută folosind funcția AVERAGE(), iar pentru σ folosind funcția STDEV.B(), vezi mai jos. fișă de exemplu de fișier Generare.

Notă: Pentru a genera o matrice de numere distribuite peste legea normală, puteți folosi formula =NORM.INV(RAND();μ;σ). Funcția RAND() generează de la 0 la 1, care corespunde doar intervalului de modificare a probabilității (vezi mai jos). fișă de exemplu de fișier Generare).

Sarcini

Sarcina 1. Compania produce fire de nailon cu o rezistență medie de 41 MPa și o abatere standard de 2 MPa. Consumatorul dorește să achiziționeze fire cu o rezistență de cel puțin 36 MPa. Calculați probabilitatea ca loturile de fire produse de o companie pentru un consumator să îndeplinească sau să depășească cerințele.
Soluția 1: =1-NORM.DIST(36,41,2,TRUE)

Sarcina 2. Compania produce țevi cu un diametru exterior mediu de 20,20 mm și o abatere standard de 0,25 mm. Conform specificațiilor, țevile sunt considerate potrivite dacă diametrul este de 20,00+/- 0,40 mm. Ce proporție de țevi fabricate îndeplinește specificațiile?
Soluția 2: = NORM.DIST(20,00+0,40;20,20;0,25;TRUE)- NORM.DIST(20,00-0,40;20,20;0,25)
În figura de mai jos, este evidențiată gama de valori ale diametrului, care satisface cerințele caietului de sarcini.

Soluția este dată în exemplu de fișă de fișiere Sarcini.

Sarcina 3. Compania produce țevi cu un diametru exterior mediu de 20,20 mm și o abatere standard de 0,25 mm. Diametrul exterior nu trebuie să depășească o anumită valoare(presupunând că limita inferioară nu este importantă). Ce limită superioară din specificațiile tehnice trebuie stabilită astfel încât 97,5% din toate produsele fabricate să îi corespundă?
Soluția 3: =NORM.INV(0,975; 20,20; 0,25)=20,6899 sau
=NORM.ST.OBR(0,975)*0,25+20,2(produs „de-standardizare”, vezi mai sus)

Sarcina 4. Găsirea parametrilor distributie normala cu valorile lui 2 (sau ).
Să presupunem că știm că o variabilă aleatoare are o distribuție normală, dar parametrii ei nu sunt cunoscuți, ci doar a 2-a percentilă(de exemplu, 0,5- percentilă, adică mediană și 0,95 percentilă). pentru că este cunoscut, atunci știm , i.e. μ. Pentru a găsi trebuie să utilizați .
Soluția este dată în exemplu de fișă de fișiere Sarcini.

Notă: Înainte de MS EXCEL 2010, EXCEL avea funcțiile NORMINV() și NORMINV(), care sunt echivalente cu NORM.INV() și NORM.INV() . NORMINV() și NORMINV() sunt lăsate în MS EXCEL 2010 și versiuni ulterioare numai pentru compatibilitate.

Combinații liniare de variabile aleatoare distribuite normal

Se știe că combinație liniară variabile aleatoare distribuite normal X(i) cu parametrii μ (i) și σ (i) distribuite de asemenea în mod normal. De exemplu, dacă o variabilă aleatoare Y=x(1)+x(2), atunci Y va avea o distribuție cu parametrii μ (1)+μ(2)și ROOT(σ(1)^2+ σ(2)^2). Vom verifica acest lucru folosind MS EXCEL.

Acțiune