Numeričke karakteristike slučajnih varijabli, njihove statističke i vjerovatnoće vrijednosti. Centrirane slučajne varijable

Potpuna karakteristika slučajne varijable je zakon distribucije. U praksi se takva karakteristika ne može uvijek dobiti zbog ograničenih eksperimentalnih rezultata. U ovim slučajevima, umjesto zakona distribucije, koristi se približan opis slučajnih varijabli, koji se dobija korištenjem minimalnog broja neslučajnih karakteristika. Broj ovih karakteristika trebao bi biti mali, ali bi trebao odražavati najznačajnije karakteristike distribucije:

matematičko očekivanje slučajne varijable;

Disperzija (momenat nultog reda, 1.).

Najjednostavnija numerička karakteristika diskretne slučajne varijable X je prosječna vrijednost: , gdje je prosječna vrijednost slučajne varijable; N je broj testova; - vrijednost slučajne varijable koju uzima u N pokušaja.

Za karakterizaciju širenja vrijednosti diskretne slučajne varijable u ovoj seriji eksperimenata, koristi se kvadrat razlike između vrijednosti slučajne varijable i njene prosječne vrijednosti: , gdje je statistička varijansa slučajne varijable H. vrijednosti oko njegove srednje vrijednosti.

Ako rezultate eksperimenata karakterizira ne jedna slučajna varijabla, već nekoliko, tada se pored razmatranih karakteristika uvode i veličine koje karakteriziraju stupanj ovisnosti između ovih slučajnih varijabli. Kao takva karakteristika, na primjer, za 2 slučajne varijable x i y u ovoj seriji eksperimenata usvojena je sljedeća vrijednost: . Jednakost (4) statički korelacijski moment. Sa povećanjem eksperimenata, vrijednost učestalosti pojavljivanja ovog događaja će se približiti vjerovatnoći. A srednja aritmetička vrijednost će težiti svom matematičkom očekivanju : , gdje je vjerovatnoća pojavljivanja vrijednosti . Dakle, matematičko očekivanje diskretne slučajne varijable X je zbir proizvoda svih mogućih vrijednosti x i vjerovatnoće da se te vrijednosti pojave. , varijansa slučajne varijable je njeno matematičko očekivanje kvadrata odstupanja od ove vrijednosti od njenog matematičkog očekivanja. , gdje je centrirana slučajna varijabla, , . Korelacioni momenat: , gde je verovatnoća da je slučajna varijabla x, y preuzimaju vrijednosti x i , y i, .

Za kontinuirane slučajne varijable, matematičko očekivanje, varijansa i korelacijski moment određuju se kroz gustinu: .

Za nezavisne slučajne varijable: onda , . Prema (9) za nezavisne slučajne varijable, dakle, ako su dvije slučajne varijable različite od 0, to ukazuje na postojanje veze između ovih slučajnih varijabli. Slučajne varijable za koje se nazivaju nekorelacione slučajne varijable. karakteriše ne samo zavisnost veličina, već i njihovu disperziju. Ako, na primjer, jedna od veličina X ili Y malo odstupa od svog matematičkog očekivanja, tada će korelacijski moment biti mali, bez obzira na to kakvu ovisnost ove veličine imaju jedna od druge.



Da bi se otklonio ovaj nedostatak, uvodi se bezdimenzionalna karakteristika koja se naziva koeficijent korelacije: . Ako koristimo mehaničku interpretaciju, tada se apscisa može predstaviti kao težište figure, a disperzija kao moment inercije ravne figure.

ima varijansu 1 i očekivanje 0.

Normalizovana slučajna varijabla V je omjer date slučajne varijable X i njene standardne devijacije σ

Standardna devijacija je kvadratni korijen varijanse

Matematičko očekivanje i varijansa normalizovane slučajne varijable V izražavaju se u smislu karakteristika X na sledeći način:

MV= M(X)σ=1v, DV= 1,

gdje je v koeficijent varijacije originalne slučajne varijable X.

Za funkciju distribucije F V (x) i gustinu distribucije f V (x) imamo:

F V (x) = F(σx), f V (x) = σf(σx),

gdje F(x) je funkcija distribucije originalne slučajne varijable X, a f(x) je njegova gustina vjerovatnoće.

Koeficijent korelacije.

Koeficijent korelacije je pokazatelj prirode međusobnog stohastičkog uticaja promene dve slučajne varijable. Koeficijent korelacije može imati vrijednosti od -1 do +1. Ako je modulo vrijednost bliža 1, to znači da postoji jaka veza, a ako je bliža 0, nema veze ili je u suštini nelinearna. Sa koeficijentom korelacije koji je po apsolutnoj vrijednosti jednak jedan, govori se o funkcionalnom odnosu (odnosno, linearnoj zavisnosti), odnosno da se promjene u dvije veličine mogu opisati linearnom funkcijom.

Proces se zove stohastički, ako je opisan slučajnim varijablama čija se vrijednost mijenja tokom vremena.

Pearsonov koeficijent korelacije.

Za metričke veličine koristi se Pearsonov koeficijent korelacije, čiju je tačnu formulu izveo Francis Hamilton. Neka su X i Y dvije slučajne varijable definirane na istom prostoru vjerovatnoće. Tada je njihov koeficijent korelacije dan formulom:

Čebiševljeve nejednakosti.

Markova nejednakost.

Markova nejednakost u teoriji vjerovatnoće, daje procjenu vjerovatnoće da će slučajna varijabla premašiti fiksnu pozitivnu konstantu u apsolutnoj vrijednosti, u smislu njenog matematičkog očekivanja. Rezultirajuća procjena je obično prilično gruba. Međutim, omogućava da se dobije određena ideja o distribuciji kada potonja nije eksplicitno poznata.

Neka je slučajna varijabla definirana na prostoru vjerovatnoće i njeno matematičko očekivanje je konačno. Onda

,

gdje a > 0.

Nejednakost Čebišev - Bieneme.

Ako E< ∞ (E – математическое ожидание), то для любого , справедливо

Zakon velikih brojeva.

Zakon velikih brojeva navodi da je empirijska sredina (aritmetička sredina) dovoljno velikog konačnog uzorka iz fiksne distribucije blizu teorijske sredine (očekivanja) te distribucije. U zavisnosti od vrste konvergencije, razlikuje se slab zakon velikih brojeva, kada dolazi do konvergencije u verovatnoći, i jak zakon velikih brojeva, kada se konvergencija odvija skoro svuda.



Uvijek će postojati toliki broj pokušaja da će se, sa bilo kojom unaprijed određenom vjerovatnoćom, učestalost pojave nekog događaja proizvoljno malo razlikovati od njegove vjerovatnoće. Opšte značenje zakona velikih brojeva je da zajedničko djelovanje velikog broja slučajnih faktora dovodi do rezultata koji je gotovo nezavisan od slučajnosti.

Slab zakon velikih brojeva.

Tada je Sn P M(X).

Jaki zakon velikih brojeva.

Tada je Sn→M(X) gotovo siguran.

Centrirana slučajna varijabla koja odgovara RVX naziva se razlika između slučajne varijable X i njegovo matematičko očekivanje

Slučajna varijabla se poziva normalizovano ako je njegova varijansa 1. Poziva se centrirana i normalizirana slučajna varijabla standard.

Standardna slučajna varijabla Z, što odgovara slučajnoj varijabli X nalazi se prema formuli:

(1.24)

1.2.5. Ostale numeričke karakteristike

Diskretna SV moda X definirana kao takva moguća vrijednost x m, za koji

Moda kontinuirana SWX zove pravi broj M 0 (X), definisan kao maksimalna tačka gustine distribucije verovatnoće f(x).

Dakle, SW mod X je njegova najvjerovatnija vrijednost, ako je takva vrijednost jedinstvena. Način možda ne postoji, ima jednu vrijednost (unimodalna distribucija) ili ima više vrijednosti (multimodalna distribucija).

Medijan kontinuiranog SWX zove pravi broj M D (X) koji zadovoljava uslov

Kako ova jednadžba može imati mnogo korijena, medijana se određuje, općenito govoreći, dvosmisleno.

Početni trenutakm-ti red SWX (ako postoji) naziva se realan broj m, određeno formulom

(1.27)

Centralni moment m-tog reda JZX(ako postoji) naziva se broj m, određeno formulom

(1.28)

Matematičko očekivanje SW X je njegov prvi početni trenutak, a varijansa je njegov drugi centralni moment.

Među trenucima višeg reda posebno su važni centralni momenti 3. i 4. reda.

Koeficijent asimetrije ("košenje") A(X) naziva se količina

Koeficijent kurtozisa ("zašiljenosti") E(X) SWX naziva se količina

1.3. Neki zakoni distribucije diskretnih slučajnih varijabli

1.3.1. Geometrijska distribucija

Discrete SW X ima geometrijsku distribuciju ako su mu moguće vrijednosti 0, 1, 2, …, m, … odgovaraju vjerovatnoćama izračunatim po formuli

gdje je 0< str< 1,q= 1 –str.

U praksi, geometrijska distribucija nastaje kada se napravi niz nezavisnih pokušaja da se postigne neki rezultat. ALI i vjerovatnoću da se neki događaj desi ALI u svakom pokušaju P(A) =P. SW X je broj beskorisnih pokušaja (do prvog eksperimenta, u kojem se događaj pojavljuje ALI), ima geometrijsku distribuciju sa nizom distribucije:

x i

str i

q 2 str

q m str

i numeričke karakteristike:

(1.30)

1.3.2. Hipergeometrijska distribucija

Discrete SW X sa mogućim vrijednostima 0, 1, …, m, …,M ima hipergeometrijsku distribuciju sa parametrima N,M,n, ako

(1.31)

gdje MN,m n,nN,m,n,N,M- cijeli brojevi.

Hipergeometrijska raspodjela se javlja u slučajevima kao što su sljedeći: postoji N objekata, od kojih M imaju određenu karakteristiku. Dostupan N objekti se biraju nasumično n objekata.

SW X broj objekata sa navedenim atributom među odabranim raspoređuje se prema hipergeometrijskom zakonu.

Hipergeometrijska raspodjela se posebno koristi u rješavanju problema vezanih za kontrolu kvaliteta proizvoda.

Matematičko očekivanje slučajne varijable sa hipergeometrijskom distribucijom je:

(1.32)

matematičko očekivanje diskretna slučajna varijabla naziva se zbir proizvoda svih mogućih vrijednosti i njihovih vjerovatnoća

Komentar. Iz definicije proizilazi da je matematičko očekivanje diskretne slučajne varijable neslučajna (konstantna) varijabla.

Matematičko očekivanje kontinuirane slučajne varijable može se izračunati po formuli

M(X) =
.

Matematičko očekivanje je približno jednako(što tačnije to je veći broj pokušaja) aritmetička sredina posmatranih vrednosti slučajne varijable.

Osobine matematičkog očekivanja.

Nekretnina 1. Matematičko očekivanje konstantne vrijednosti jednako je samoj konstanti:

Nekretnina 2. Konstantni faktor se može izvaditi iz predznaka očekivanja:

Nekretnina 3. Matematičko očekivanje proizvoda dvije nezavisne slučajne varijable jednako je proizvodu njihovih matematičkih očekivanja:

M(XY) =M(X) *M(Y).

Nekretnina 4. Matematičko očekivanje zbira dvije slučajne varijable jednako je zbiru matematičkih očekivanja pojmova:

M(X+Y) =M(X) +M(Y).

12.1. Disperzija slučajne varijable i njena svojstva.

U praksi je često potrebno pronaći disperziju slučajne varijable oko njene srednje vrijednosti. Na primjer, u artiljeriji je važno znati koliko će granate pasti blizu cilja koji treba pogoditi.

Na prvi pogled može izgledati da je najlakši način za procjenu rasipanja izračunati sve moguće vrijednosti odstupanja slučajne varijable, a zatim pronaći njihovu prosječnu vrijednost. Međutim, ovaj put neće dati ništa, jer je prosječna vrijednost odstupanja, tj. M, za bilo koju slučajnu varijablu jednaka nuli.

Stoga najčešće idu drugim putem – koriste varijansu za izračunavanje.

disperzija(rasipanje) slučajne varijable je matematičko očekivanje kvadratnog odstupanja slučajne varijable od njenog matematičkog očekivanja:

D(X) = M 2 .

Za izračunavanje varijanse često je zgodno koristiti sljedeću teoremu.

Teorema. Disperzija je jednaka razlici između matematičkog očekivanja kvadrata slučajne varijable X i kvadrata njenog matematičkog očekivanja.

D (X) \u003d M (X 2) - 2.

Svojstva disperzije.

Nekretnina 1. Konstanta disperzijeCjednako nuli:

Nekretnina 2. Konstantni faktor se može podići izvan znaka varijanse kvadriranjem:

D(CX)=C 2 D(X).

Nekretnina 3. Varijanca zbira dvije nezavisne slučajne varijable jednaka je zbroju varijansi ovih varijabli:

D(X+Y) =D(X) +D(Y).

Nekretnina 4. Varijanca razlike dvije nezavisne slučajne varijable jednaka je zbiru njihovih varijansi:

D(X-Y) =D(X) +D(Y).

13.1. Normalizirane slučajne varijable.

ima varijansu 1 i očekivanje 0.

Normalizovana slučajna varijabla V je omjer date slučajne varijable X i njene standardne devijacije σ

Standardna devijacija je kvadratni korijen varijanse

Matematičko očekivanje i varijansa normalizovane slučajne varijable V izražavaju se u smislu karakteristika X na sledeći način:

gdje je v koeficijent varijacije originalne slučajne varijable X.

Za funkciju distribucije F V (x) i gustinu distribucije f V (x) imamo:

F V (x) =F(σx), f V (x) =σf(σx),

gdje F(x) je funkcija distribucije originalne slučajne varijable X, a f(x) je njegova gustina vjerovatnoće.

KARAKTERISTIKE RASIJENJA

Od karakteristika pozicije - matematičko očekivanje, medijan, modus - prijeđimo na karakteristike širenja slučajne varijable x. disperzija D(X)= a 2 , standardna devijacija a i koeficijent varijacije v. Definicija i svojstva varijanse za diskretne slučajne varijable razmatrani su u prethodnom poglavlju. Za kontinuirane slučajne varijable

Standardna devijacija je nenegativna vrijednost kvadratnog korijena varijanse:

Koeficijent varijacije je omjer standardne devijacije i matematičkog očekivanja:

Koeficijent varijacije - primjenjuje se kada M(X)> O - mjeri širenje u relativnim jedinicama, dok standardna devijacija - u apsolutnim.

Primjer 6. Za ravnomjerno raspoređenu slučajnu varijablu X pronaći varijansu, standardnu ​​devijaciju i koeficijent varijacije. Disperzija je:

Zamjena varijable omogućava pisanje:

gdje With = f - aU2.

Dakle, standardna devijacija je a koeficijent varijacije je:

TRANSFORMACIJE SLUČAJNIH VRIJEDNOSTI

Za svaku slučajnu varijablu X definirati još tri veličine - centriran Y, normalizovano V i dato U. Centrirana slučajna varijabla Y je razlika između date slučajne varijable X i njegovo matematičko očekivanje M(X), one. Y=X - M(X). Matematičko očekivanje centrirane slučajne varijable Y jednaka je 0, a varijansa je varijanca date slučajne varijable:

funkcija distribucije Fy(x) centrirana slučajna varijabla Y vezano za funkciju distribucije F(x) originalne slučajne varijable X omjer:

Za gustine ovih slučajnih varijabli, jednakost

Normalizovana slučajna varijabla V je omjer date slučajne varijable X na njegovu standardnu ​​devijaciju a, tj. V = XIo. Matematičko očekivanje i varijansa normalizirane slučajne varijable V izraženo kroz karakteristike X dakle:

gdje je v koeficijent varijacije originalne slučajne varijable x. Za funkciju distribucije Fv(x) i gustina fv(x) normalizovana slučajna varijabla V imamo:

gdje F(x)- funkcija distribucije originalne slučajne varijable x; popraviti) je njegova gustina vjerovatnoće.

Redukovana slučajna varijabla U je centrirana i normalizirana slučajna varijabla:

Za smanjenu slučajnu varijablu

Normalizovane, centrirane i redukovane slučajne varijable se konstantno koriste kako u teorijskim istraživanjima tako i u algoritmima, softverskim proizvodima, regulatornoj i tehničkoj i instruktivno-metodološkoj dokumentaciji. Posebno zbog jednakosti M(U) = 0, D(lf) = 1 omogućavaju pojednostavljenje potvrđivanja metoda, formulacija teorema i proračunskih formula.

Koriste se transformacije slučajnih varijabli i opštiji plan. Dakle, ako U = aX + b, gdje a i b su onda neki brojevi

Primjer 7. Ako a= 1/G, b = -M(X)/G, tada je Y redukovana slučajna varijabla, a formule (8) se pretvaraju u formule (7).

Sa svakom slučajnom varijablom X moguće je povezati skup slučajnih varijabli Y datih formulom Y = Oh + b na raznim a > 0 i b. Ovaj skup se zove porodica makaza, generisano slučajnom varijablom x. Funkcije distribucije Fy(x) čine porodicu distribucija sa pomakom skale koju generiše funkcija distribucije F(x). Umjesto Y= aX + bčesto korištena notacija

Broj With naziva se parametar pomaka, a broj d- parametar skale. Formula (9) to pokazuje X- rezultat mjerenja određene vrijednosti - ide na K - rezultat mjerenja iste vrijednosti, ako se početak mjerenja pomjeri u tačku sa, a zatim koristite novu jedinicu mjere, in d puta veći od starog.

Za familiju pomaka razmjera (9), distribucija X naziva se standardnim. U probabilističko-statističkim metodama odlučivanja i drugim primijenjenim istraživanjima koriste se standardna normalna raspodjela, standardna Weibull-Gnedenkova raspodjela, standardna gama raspodjela.

distribucija, itd. (vidi dolje).

Koriste se i druge transformacije slučajnih varijabli. Na primjer, za pozitivnu slučajnu varijablu X razmotriti Y = IgX, gdje IgX- decimalni logaritam broja x. Lanac jednakosti

odnose funkcije distribucije X i Y.

Dijeli