Karakteristika disperzije vrijednosti je slučajna. Karakteristike raspršenja Disperzija i njena svojstva Čebiševljeva nejednakost

Karakteristike položaja opisuju distributivni centar. Istovremeno, vrijednosti varijante mogu se grupirati oko nje iu širokom i u uskom pojasu. Stoga je za opisivanje distribucije potrebno okarakterizirati raspon promjene vrijednosti atributa. Karakteristike raspršivanja se koriste za opisivanje raspona varijacija karakteristika. Najšire korišteni su raspon varijacije, disperzije, standardna devijacija i koeficijent varijacije.

Varijacija raspona definira se kao razlika između maksimalne i minimalne vrijednosti osobine u proučavanoj populaciji:

R=x max- x min.

Očigledna prednost ovog indikatora je jednostavnost izračunavanja. Međutim, budući da raspon varijacije ovisi o vrijednostima samo ekstremnih vrijednosti atributa, opseg njegove primjene je ograničen na prilično homogene distribucije. U drugim slučajevima, informativni sadržaj ovog indikatora je vrlo mali, jer postoji mnogo distribucija koje se uvelike razlikuju po obliku, ali imaju isti raspon. U praktičnim studijama, raspon varijacija se ponekad koristi za male (ne više od 10) veličina uzoraka. Tako je, na primjer, po rasponu varijacije lako procijeniti koliko se najbolji i najgori rezultati razlikuju u grupi sportista.

u ovom primjeru:

R\u003d 16,36 - 13,04 \u003d 3,32 (m).

Druga karakteristika raspršenja je disperzija. Varijanca je srednji kvadrat odstupanja vrijednosti slučajna varijabla od njegove prosječne vrijednosti. Disperzija je karakteristika disperzije, disperzija vrijednosti veličine oko njene prosječne vrijednosti. Sama riječ "disperzija" znači "raspršivanje".

Prilikom provođenja studija uzoraka potrebno je utvrditi procjenu varijanse. Varijanca izračunata iz podataka uzorka naziva se varijansa uzorka i označava se S 2 .

Na prvi pogled, najprirodnija procjena varijanse je statistička varijansa izračunata iz definicije korištenjem formule:

U ovoj formuli, zbir kvadrata odstupanja vrijednosti atributa x i iz aritmetičke sredine . Ovaj zbir se dijeli s veličinom uzorka kako bi se dobila srednja kvadratna devijacija. P.

Međutim, ova procjena nije nepristrasna. Može se pokazati da je zbroj kvadrata odstupanja vrijednosti atributa za uzorak aritmetičke sredine manji od zbira kvadrata odstupanja od bilo koje druge vrijednosti, uključujući pravu srednju vrijednost ( matematičko očekivanje). Stoga će rezultat dobijen gornjom formulom sadržavati sistematsku grešku, a procijenjena vrijednost varijanse će biti potcijenjena. Da bi se eliminisala pristrasnost, dovoljno je uvesti faktor korekcije. Rezultat je sljedeća relacija za procijenjenu varijansu:

Za velike vrijednosti n, naravno, obje procjene - pristrasna i nepristrasna - će se vrlo malo razlikovati i uvođenje faktora korekcije postaje besmisleno. U pravilu, formulu za procjenu varijanse treba precizirati kada n<30.

U slučaju grupiranih podataka, posljednja formula za pojednostavljenje izračuna može se svesti na sljedeći oblik:

gdje k- broj intervala grupisanja;

n i- frekvencija intervala sa brojem i;

x i- srednja vrijednost intervala sa brojem i.

Kao primjer, izračunajmo varijansu za grupisane podatke primjera koji analiziramo (vidi tabelu 4.):

S 2 =/ 28=0,5473 (m2).

Varijanca slučajne varijable ima dimenziju kvadrata dimenzije slučajne varijable, što otežava interpretaciju i čini je ne baš vizualnom. Za vizualniji opis raspršivanja, pogodnije je koristiti karakteristiku čija se dimenzija poklapa s dimenzijom karakteristike koja se proučava. U tu svrhu, koncept standardna devijacija(ili standardna devijacija).

standardna devijacija naziva se pozitivnim kvadratnim korijenom varijanse:

U našem primjeru, standardna devijacija je

Standardna devijacija ima iste mjerne jedinice kao i rezultati mjerenja osobine koja se proučava i stoga karakteriše stepen odstupanja osobine od aritmetičke sredine. Drugim riječima, pokazuje kako se glavni dio varijante nalazi u odnosu na aritmetičku sredinu.

Standardna devijacija i varijansa su najčešće korištene mjere varijacije. To je zbog činjenice da su uključeni u značajan dio teorema teorije vjerovatnoće, koja služi kao temelj matematičke statistike. Osim toga, varijansa se može razložiti na svoje sastavne elemente, što omogućava procjenu utjecaja različitih faktora na varijaciju osobine koja se proučava.

Pored apsolutnih indikatora varijacije, a to su varijansa i standardna devijacija, u statistiku se uvode i relativni. Koeficijent varijacije koji se najčešće koristi. Koeficijent varijacije jednak je omjeru standardne devijacije i aritmetičke sredine, izražen kao postotak:

Iz definicije je jasno da je, u svom značenju, koeficijent varijacije relativna mjera disperzije neke karakteristike.

Za dotični primjer:

Koeficijent varijacije se široko koristi u statističkim istraživanjima. Budući da je relativna vrijednost, omogućava vam da uporedite fluktuacije obje osobine s različitim mjernim jedinicama, kao i istu osobinu u nekoliko različitih populacija s različitim vrijednostima aritmetičke sredine.

Koeficijent varijacije se koristi za karakterizaciju homogenosti dobijenih eksperimentalnih podataka. U praksi fizičke kulture i sporta, širenje rezultata mjerenja u zavisnosti od vrijednosti koeficijenta varijacije smatra se malim (V<10%), средним (11-20%) и большим (V> 20%).

Ograničenja upotrebe koeficijenta varijacije povezana su sa njegovom relativnom prirodom – definicija sadrži normalizaciju na aritmetičku sredinu. S tim u vezi, za male apsolutne vrijednosti aritmetičke sredine, koeficijent varijacije može izgubiti svoj informativni sadržaj. Što je vrijednost aritmetičke sredine bliža nuli, ovaj indikator postaje manje informativan. U graničnom slučaju, aritmetička sredina ide na nulu (na primjer, temperatura), a koeficijent varijacije ide u beskonačnost, bez obzira na širenje karakteristike. Po analogiji sa slučajem greške, možemo formulirati sljedeće pravilo. Ako je vrijednost aritmetičke sredine u uzorku veća od jedan, onda je upotreba koeficijenta varijacije opravdana, u suprotnom treba koristiti disperziju i standardnu ​​devijaciju za opisivanje raspršenosti eksperimentalnih podataka.

U zaključku ovog dijela razmatramo procjenu varijacije u vrijednostima procijenjenih karakteristika. Kao što je već napomenuto, vrijednosti karakteristika distribucije izračunate iz eksperimentalnih podataka ne poklapaju se s njihovim pravim vrijednostima za opću populaciju. Ovo posljednje nije moguće precizno utvrditi, jer je po pravilu nemoguće ispitati cjelokupnu populaciju. Ako koristimo rezultate različitih uzoraka iz iste opće populacije za procjenu parametara distribucije, onda se ispostavlja da se ove procjene za različite uzorke razlikuju jedna od druge. Procijenjene vrijednosti fluktuiraju oko svojih pravih vrijednosti.

Odstupanja procjena općih parametara od pravih vrijednosti ovih parametara nazivaju se statističkim greškama. Razlog za njihovu pojavu je ograničena veličina uzorka – nisu svi objekti opće populacije uključeni u njega. Za procjenu veličine statističkih grešaka koristi se standardna devijacija karakteristika uzorka.

Kao primjer, razmotrite najvažniju karakteristiku položaja - aritmetičku sredinu. Može se pokazati da je standardna devijacija aritmetičke sredine data sa:

gdje σ - standardna devijacija za opštu populaciju.

Pošto prava vrijednost standardne devijacije nije poznata, veličina se zove standardna greška aritmetičke sredine i jednako:

Vrijednost karakteriše grešku koja je u prosjeku dozvoljena kada se opći prosjek zamjenjuje njegovom procjenom uzorka. Prema formuli, povećanje veličine uzorka tokom istraživanja dovodi do smanjenja standardne greške proporcionalno kvadratnom korijenu veličine uzorka.

Za primjer koji se razmatra, vrijednost standardne greške aritmetičke sredine je . U našem slučaju se pokazalo da je 5,4 puta manja od vrijednosti standardne devijacije.

Glavna karakteristika disperzije varijacionog niza naziva se disperzija

Glavna karakteristika disperzije varijacionog niza se zove disperzija. Varijanca uzorkaD in izračunava se pomoću sljedeće formule:

gdje je x i – i -ta vrijednost iz uzorka koji se pojavljuje m i puta; n - veličina uzorka; je srednja vrijednost uzorka; k je broj različitih vrijednosti u uzorku. u ovom primjeru: x 1 =72, m 1 =50; x 2 =85, m 2 =44; x 3 =69, m 3 =61; n=155; k=3; . onda:

Imajte na umu da što je veća vrijednost disperzije, to je veća razlika između vrijednosti mjerene veličine jedna od druge. Ako su u uzorku sve vrijednosti izmjerene vrijednosti jednake jedna drugoj, tada je varijansa takvog uzorka jednaka nuli.

Disperzija ima posebna svojstva.

Nekretnina 1.Vrijednost varijanse bilo kojeg uzorka je nenegativna, tj. .

Nekretnina 2.Ako je izmjerena vrijednost konstantna X=c, tada je varijansa za takvu vrijednost nula: D[c ]= 0.

Nekretnina 3.Ako su sve vrijednosti mjerene veličine x u uzorku povećanje u c puta, tada će se varijansa ovog uzorka povećati za c 2 puta: D[cx ]= c 2 D [ x ], gdje je c = konst.

Ponekad se umjesto varijanse koristi standardna devijacija uzorka, koja je jednaka aritmetičkom kvadratnom korijenu varijanse uzorka: .

Za razmatrani primjer, standardna devijacija uzorka je jednaka .

Disperzija vam omogućava da procenite ne samo stepen razlike u izmerenim pokazateljima unutar jedne grupe, već se može koristiti i za određivanje odstupanja podataka između različitih grupa. Za to se koristi nekoliko vrsta disperzije.

Ako se neka grupa uzme kao uzorak, tada se naziva varijansa ove grupe grupna varijansa. Da bi se numerički izrazile razlike između varijansi nekoliko grupa, postoji koncept međugrupna varijansa. Međugrupna varijansa je varijansa grupnih srednjih vrijednosti u odnosu na ukupnu srednju vrijednost:

gdje je k je broj grupa u ukupnom uzorku, je srednja vrijednost uzorka za i -ta grupa, n i - veličina uzorka i th grupa, - srednja vrijednost uzorka za sve grupe.

Razmotrimo primjer.

Prosječna ocjena za kontrolni rad iz matematike u 10 "A" razredu bila je 3,64, a u 10 "B" razredu 3,52. U 10 "A" su 22 učenika, a u 10 "B" - 21. Nađimo međugrupnu disperziju.

U ovom zadatku uzorak je podijeljen u dvije grupe (dvije klase). Srednja vrijednost uzorka za sve grupe je:

.

U ovom slučaju, varijansa među grupama je:

S obzirom da je međugrupna varijansa blizu nule, možemo zaključiti da se rezultati jedne grupe (10 "A" klase) neznatno razlikuju od rezultata druge grupe (10 "B" klase). Drugim riječima, sa stanovišta međugrupne varijanse, razmatrane grupe se neznatno razlikuju u pogledu datog atributa.

Ako se ukupni uzorak (na primjer, razred učenika) podijeli u nekoliko grupa, tada se pored međugrupne varijanse može izračunati iunutargrupna varijansa. Ova varijansa je prosjek svih grupnih varijansi.

Unutargrupna varijansaD mađarska izračunato po formuli:

gdje je k je broj grupa u ukupnom uzorku, D i – varijansa i th volume group n i .

Postoji odnos između ukupnog (D in ), unutargrupni ( D ngr ) i međugrupni ( D intergr) disperzije:

D u \u003d D ingr + D intergr.

    EFEKTIVNA POVRŠINA RASPENJA (POVRŠINA)- karakteristika refleksivnosti mete, izražena odnosom snage el. magn. energija koju reflektuje cilj u pravcu prijemnika, na gustinu fluksa površinske energije koja pada na metu. Zavisi od… … Enciklopedija strateških raketnih snaga

    Kvantna mehanika ... Wikipedia

    - (EPR) karakteristika reflektivnosti mete ozračene elektromagnetnim talasima. EPR vrijednost je definirana kao omjer protoka (snage) elektromagnetne energije koju reflektira cilj u smjeru radioelektronskog sredstva (RES), prema ... ... Pomorski rječnik

    lutalica- Statističke karakteristike eksperimentalnih podataka, koje odražavaju njihovo odstupanje od prosječnih vrijednosti. Teme metalurgija općenito EN očajnički bend… Priručnik tehničkog prevodioca

    - (funkcija prijenosa modulacije), funkcija, uz pomoć reza, “oštrina” optičke slike. sistemi i elemenata takvih sistema. Ch. to x. je Fourierova transformacija tzv. funkcija širenja linija koja opisuje prirodu "širenja" ... ... Physical Encyclopedia

    Funkcija prijenosa modulacije, funkcija koja procjenjuje svojstva "oštrine" optičkih sistema za snimanje i pojedinačnih elemenata takvih sistema (vidi, na primjer, Oštrina fotografske slike). Ch. to x. postoji Fourier ... ...

    lutalica- statistička karakteristika eksperimentalnih podataka, koja odražava njihovo odstupanje od prosječne vrijednosti. Vidi također: Strip Slip traka Reset traka Traka za otvrdnjavanje… Enciklopedijski rečnik metalurgije

    SCATTER BAND- statistička karakteristika eksperimentalnih podataka, koja odražava njihovo odstupanje od prosječnih vrijednosti ... Metalurški rječnik

    Karakteristika rasipanja vrijednosti slučajne varijable. Mt.h je povezan s kvadratnom devijacijom (Vidi kvadratno odstupanje) σ formulom Ova metoda mjerenja raspršenja objašnjava se činjenicom da u slučaju normalnog ... ... Velika sovjetska enciklopedija

    STATISTIKA VARIJACIJA- VARIJACIONA STATISTIKA, termin koji objedinjuje grupu tehnika statističke analize koje se koriste uglavnom u prirodnim naukama. U drugoj polovini XIX veka. Quetelet (Quetelet, „Anthro pometrie ou mesure des differentes facultes de 1… … Velika medicinska enciklopedija

    Očekivana vrijednost- (srednja populacija) Matematičko očekivanje je distribucija vjerovatnoće slučajne varijable Matematičko očekivanje, definicija, matematičko očekivanje diskretnih i kontinuiranih slučajnih varijabli, selektivno, uslovno očekivanje, proračun, ... ... Enciklopedija investitora

To osnovne statističke karakteristike serije mjerenja (varijacije serije) su karakteristike položaja (prosječne karakteristike, ili centralni trend uzorka); karakteristike raspršenja (varijacije ili fluktuacije) i X karakteristike oblika distribucija.

To karakteristike položaja odnositi se aritmetička sredina (znači), moda i medijana.

To karakteristike raspršenja (varijacije ili fluktuacije) odnose se: raspon varijacija, disperzija, srednji kvadrat (standard) odstupanje, greška aritmetičke sredine (srednja greška), koeficijent varijacije i sl.

Na karakteristike forme odnositi se koeficijent asimetrije, mjera zakrivljenosti i ekscesa.

Karakteristike položaja

Aritmetička sredina je jedna od glavnih karakteristika uzorka.

Ona se, kao i druge numeričke karakteristike uzorka, može izračunati kako iz sirovih primarnih podataka, tako i iz rezultata grupisanja ovih podataka.

Preciznost izračunavanja na sirovim podacima je veća, ali se ispostavlja da je proces proračuna dugotrajan sa velikom veličinom uzorka.

Za negrupirane podatke, aritmetička sredina je određena formulom:

gdje n- veličina uzorka, X 1 , X 2 , ... X n - rezultati mjerenja.

Za grupisane podatke:

gdje n- veličina uzorka, k je broj intervala grupisanja, n i– učestalost intervala, x i su srednje vrijednosti intervala.

Moda

Definicija 1. Moda je vrijednost koja se najčešće pojavljuje u podacima uzorka. Označeno Mo a određuje se formulom:

gdje je donja granica modalnog intervala, širina intervala grupiranja, frekvencija modalnog intervala, frekvencija intervala koji prethodi modalnom, je frekvencija intervala koji slijedi nakon modalnog.

Definicija 2. Fashion Mo diskretna slučajna varijabla naziva se njegova najvjerovatnija vrijednost.

Geometrijski, mod se može tumačiti kao apscisa maksimalne tačke krivulje distribucije. Oni su bimodal i multimodalni distribucija. Postoje distribucije koje imaju minimum, ali ne i maksimum. Takve distribucije se nazivaju antimodal .

Definicija. Modal interval naziva se interval grupisanja sa najvećom frekvencijom.

Medijan

Definicija. Medijan - rezultat mjerenja, koji se nalazi u sredini rangirane serije, drugim riječima, medijan je vrijednost karakteristike X, kada je jedna polovina vrijednosti eksperimentalnih podataka manja od nje, a druga polovina više, označava se Ja.

Kada je veličina uzorka n- paran broj, tj. postoji paran broj rezultata mjerenja, a zatim se za određivanje medijane izračunava prosječna vrijednost dva indikatora uzorka koja se nalaze u sredini rangirane serije.

Za podatke grupirane u intervale, medijan je određen formulom:

,

gdje je donja granica srednjeg intervala; širina intervala grupisanja, 0,5 n- polovina veličine uzorka, - učestalost srednjeg intervala, - kumulativna učestalost intervala koji prethodi medijani.

Definicija. srednji interval naziva se interval u kojem će akumulirana frekvencija po prvi put biti više od polovine veličine uzorka ( n/ 2) ili će akumulirana frekvencija biti veća od 0,5.

Numeričke vrijednosti srednje vrijednosti, moda i medijane razlikuju se kada postoji nesimetričan oblik empirijske distribucije.

Karakteristike raspršenosti mjerenja

Za matematičko-statističku analizu rezultata uzorka nije dovoljno poznavati samo karakteristike pozicije. Ista srednja vrijednost može karakterizirati potpuno različite uzorke.

Stoga, pored njih, uzima u obzir i statistika karakteristike raspršenja (varijacije, ili volatilnost ) rezultate.

Varijacija raspona

Definicija. na veliki način varijacija je razlika između najvećeg i najmanjeg rezultata uzorka, označena R i odlučan

R=X max- X min.

Informativni sadržaj ovog indikatora nije visok, iako je uz male veličine uzorka lako procijeniti razliku između najboljih i najgorih rezultata sportista.

Disperzija

Definicija. disperzija naziva se srednji kvadrat odstupanja vrijednosti atributa od aritmetičke sredine.

Za negrupirane podatke, varijansa je određena formulom

s2 = , (1)

gdje H i- vrijednost karakteristike, - aritmetička sredina.

Za podatke grupirane u intervale, varijansa je određena formulom

,

gdje x i- zla i interval grupisanja, n i– intervalne frekvencije.

Da bi se pojednostavili proračuni i da bi se izbjegle greške u proračunu prilikom zaokruživanja rezultata (posebno kada se povećava veličina uzorka), koriste se i druge formule za određivanje varijanse. Ako je aritmetička sredina već izračunata, onda se za negrupirane podatke koristi sljedeća formula:

za grupisane podatke:

.

Ove formule se dobijaju iz prethodnih proširivanjem kvadrata razlike ispod predznaka zbira.

Glavne karakteristike disperzije koje se koriste za procjenu varijacije vrijednosti u odnosu na srednju vrijednost uzorka su varijansa, standardna devijacija i koeficijent varijacije.

1. Disperzija(od lat. disperzija - rasipanje ) je aritmetička sredina kvadrata odstupanja x i vrijednosti od njihove aritmetičke sredine.

Disperzija (D)- mjera disperzije (odstupanja od prosjeka), određuje se na sljedeći način - aritmetička sredina se oduzima od svake opcije, razlika se kvadrira i množi sa frekvencijom koja joj odgovara. Zatim odredite zbroj svih proizvoda i podijelite ga s volumenom populacije:

Za grupisane podatke, varijansa je određena:

Dimenzija varijanse se ne poklapa sa mjernim jedinicama varijabilnog atributa.

Prilikom rješavanja praktičnih zadataka, osim korištenja formula za izračunavanje varijanse uzorka, koristi se vrijednost koja se naziva korigovana varijansa. Činjenica je da vrijednost varijanse uzorka daje podcijenjene vrijednosti u odnosu na stvarnu varijansu, dakle, kod malih uzoraka (n< 30) необходимо применять исправленную дисперсию и среднеквадратическое отклонение :

ili

2. Uzorak i ispravljena standardna devijacija (σ, s) je kvadratni korijen varijanse. Dimenzija standardne devijacije, za razliku od dimenzije varijanse, poklapa se sa jedinicama eksperimentalnih podataka, pa se uglavnom koristi za karakterizaciju disperzije ispitivanog svojstva.

Predstavljamo proračun disperzije (tabela 5) na primjeru 1.

Tabela 5

Međuizračun varijanse

br. p / str Srednje vrijednosti, x i Frekvencije klasa, n i
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
suma

Varijanca za grupisane primjere podataka je:

Standardna devijacija je, respektivno, jednaka:

Ispravljena standardna devijacija je:

Imajte na umu da se formule za izračunavanje uzorka i ispravljenih varijansi razlikuju samo u nazivnicima. Za dovoljno veliko n, uzorak i ispravljene varijanse se malo razlikuju, tako da se u praksi korigirana varijansa koristi ako je n< 30 .

3. Koeficijent varijacije (v)- je relativna mjera disperzije obilježja, koristi se kao indikator homogenosti opservacija uzorka (Tabela 6).

Koeficijent varijacije je omjer standardne devijacije i aritmetičke sredine, izražen kao postotak. Pored toga, koeficijent varijacije se često koristi kada se poredi (upoređuje) stepen varijacije različitih karakteristika izraženih u različitim mernim jedinicama.

Da bi se odredila priroda raspršenja, bezdimenzionalni koeficijent varijacije v izračunava se po formuli:

,

gdje je σ standardna devijacija;

Aritmetička sredina uzoraka podataka.

Dijeli