Az értékek szórásának jellemzője véletlenszerű. Szórási jellemzők Diszperzió és tulajdonságai Csebisev-egyenlőtlenség

A helyzetjellemzők az elosztóközpontot írják le. Ugyanakkor egy változat értékei köré csoportosíthatók széles és keskeny sávban is. Ezért az eloszlás leírásához jellemezni kell az attribútum értékeinek változási tartományát. A szórási karakterisztikák a jellemzők változási tartományának leírására szolgálnak. A legszélesebb körben használt variációs, diszperziós, szórásés variációs együttható.

Terjeszkedési variáció a tulajdonság maximális és minimális értéke közötti különbség a vizsgált populációban:

R=x max- x min.

Ennek a mutatónak a nyilvánvaló előnye a számítás egyszerűsége. Mivel azonban a variáció tartománya csak az attribútum szélső értékeinek értékétől függ, alkalmazási köre meglehetősen homogén eloszlásokra korlátozódik. Más esetekben ennek a mutatónak az információtartalma nagyon kicsi, mivel nagyon sok olyan eloszlás van, amelyek alakja jelentősen eltér, de tartománya azonos. A gyakorlati tanulmányokban a variációs tartományt néha kis (10-nél nem több) mintaméreteknél alkalmazzák. Így például a variációs tartomány alapján könnyen megbecsülhető, hogy a legjobb és a legrosszabb eredmények mennyiben térnek el egy sportolócsoportban.

Ebben a példában:

R\u003d 16,36 - 13,04 \u003d 3,32 (m).

A második szórási jellemző az diszperzió. A variancia egy érték eltérésének négyzete valószínűségi változóátlagos értékétől. A diszperzió a diszperzió jellemzője, egy mennyiség értékeinek szórása az átlagértéke körül. Maga a „diszperzió” szó „szórást” jelent.

A mintavizsgálatok elvégzésekor szükség van a variancia becslésére. A mintaadatokból számított szórást mintavarianciának nevezzük és jelöljük S 2 .

Első pillantásra a variancia legtermészetesebb becslése a definícióból a következő képlet segítségével kiszámított statisztikai szórás:

Ebben a képletben az attribútumértékek négyzetes eltéréseinek összege x i a számtani átlagtól . Ezt az összeget elosztjuk a minta méretével, hogy megkapjuk az átlagos négyzetes eltéréseket. P.

Ez a becslés azonban nem elfogulatlan. Kimutatható, hogy a minta számtani átlagához tartozó attribútumértékek négyzetes eltéréseinek összege kisebb, mint bármely más értéktől való eltérés négyzetes összege, beleértve a valódi átlagot is ( matematikai elvárás). Ezért a fenti képlettel kapott eredmény szisztematikus hibát fog tartalmazni, és a szórás becsült értéke alulbecsült lesz. A torzítás megszüntetéséhez elegendő egy korrekciós tényezőt bevezetni. Az eredmény a következő összefüggés a becsült szórásra:

Nagy értékekhez n Természetesen mindkét becslés – elfogult és elfogulatlan – nagyon kis mértékben fog eltérni, és a korrekciós tényező bevezetése értelmetlenné válik. A szórásbecslés képletét általában mikor kell finomítani n<30.

Csoportosított adatok esetén a számítások egyszerűsítését szolgáló utolsó képlet a következőre redukálható:

ahol k- csoportosítási intervallumok száma;

n i- intervallum gyakorisága számmal én;

x i- az intervallum középső értéke a számmal én.

Példaként számítsuk ki a szórását az általunk elemzett példa csoportosított adataira (lásd 4. táblázat):

S 2 =/ 28=0,5473 (m2).

Egy valószínűségi változó varianciája a valószínűségi változó dimenziójának négyzetének dimenziójával rendelkezik, ami megnehezíti az értelmezést és nem túl vizuálisan. A szóródás vizuálisabb leírásához kényelmesebb olyan jellemzőt használni, amelynek mérete egybeesik a vizsgált jellemző dimenziójával. Erre a célra a koncepció szórás(vagy szórás).

szórás a variancia pozitív négyzetgyökének nevezzük:

Példánkban a szórás az

A szórás ugyanazokkal a mértékegységekkel rendelkezik, mint a vizsgált tulajdonság mérési eredményei, így a tulajdonság számtani átlagtól való eltérésének mértékét jellemzi. Más szóval azt mutatja meg, hogy a változat fő része hogyan helyezkedik el a számtani átlaghoz képest.

A szórás és a variancia a legszélesebb körben használt szórásmérők. Ez annak köszönhető, hogy a matematikai statisztika alapjául szolgáló valószínűségszámítás tételeinek jelentős részében szerepelnek. Ezenkívül a variancia felbontható alkotóelemeire, lehetővé téve a különböző tényezők hatásának felmérését a vizsgált tulajdonság variációjára.

A statisztikában az abszolút szórási mutatókon, azaz a variancia és a szórás mellett relatív mutatókat is bevezetnek. A leggyakrabban használt variációs együttható. A variációs együttható egyenlő a szórás és a számtani átlag arányával, százalékban kifejezve:

A definícióból világosan kitűnik, hogy jelentésében a variációs együttható egy jellemző szórásának relatív mértéke.

A kérdéses példához:

A variációs együtthatót széles körben alkalmazzák a statisztikai kutatásokban. Relatív értékként lehetővé teszi mindkét tulajdonság ingadozásának összehasonlítását különböző mértékegységekkel, valamint ugyanazt a tulajdonságot több különböző populációban, a számtani átlag különböző értékeivel.

A variációs együtthatót a kapott kísérleti adatok homogenitásának jellemzésére használjuk. A testkultúra és a sport gyakorlatában a mérési eredmények szórása a szórási együttható értékétől függően csekélynek számít (V<10%), средним (11-20%) и большим (V> 20%).

A variációs együttható használatára vonatkozó korlátozások annak relatív természetéhez kapcsolódnak - a definíció a számtani átlag normalizálását tartalmazza. Ebben a tekintetben a számtani átlag kis abszolút értékei esetén a variációs együttható elveszítheti információtartalmát. Minél közelebb van a számtani közép értéke a nullához, annál kevésbé informatív ez a mutató. Határesetben a számtani átlag nullára megy (például hőmérséklet), a variációs együttható pedig a végtelenbe, függetlenül a jellemző terjedésétől. A hibaesettel analóg módon a következő szabályt fogalmazhatjuk meg. Ha a mintában a számtani átlag értéke egynél nagyobb, akkor a variációs együttható alkalmazása indokolt, ellenkező esetben a szórást és a szórást kell használni a kísérleti adatok terjedésének leírására.

Ennek a résznek a végén megvizsgáljuk a becsült jellemzők értékeinek változását. Mint már említettük, a kísérleti adatokból számított eloszlási jellemzők értékei nem esnek egybe a teljes populációra vonatkozó valós értékükkel. Ez utóbbit nem lehet pontosan megállapítani, mivel általában nem lehet a teljes populációt megvizsgálni. Ha ugyanabból az általános sokaságból származó különböző minták eredményeit használjuk fel az eloszlási paraméterek becslésére, akkor kiderül, hogy ezek a különböző mintákra vonatkozó becslések eltérnek egymástól. A becsült értékek valódi értékeik körül ingadoznak.

Az általános paraméterek becsléseinek eltéréseit e paraméterek valódi értékétől statisztikai hibának nevezzük. Előfordulásuk oka a minta korlátozott mérete – a teljes sokaság nem minden objektuma szerepel benne. A statisztikai hibák nagyságának becsléséhez a minta jellemzőinek szórását használjuk.

Példaként vegyük a legfontosabb pozíciójellemzőt - a számtani átlagot. Megmutatható, hogy a számtani átlag szórása a következőképpen adódik:

ahol σ - szórás az általános populációra.

Mivel a szórás valódi értéke nem ismert, egy ún a számtani átlag standard hibájaés egyenlő:

Az érték azt a hibát jellemzi, amely átlagosan megengedett, ha az általános átlagot a mintabecslésével helyettesítjük. A képlet szerint a mintaszám növekedése a vizsgálat során a standard hiba csökkenéséhez vezet a mintanagyság négyzetgyökével arányosan.

A vizsgált példában a számtani átlag standard hibájának értéke . Esetünkben 5,4-szer kisebbnek bizonyult a szórás értékénél.

Egy variációs sorozat diszperziójának fő jellemzőjét diszperziónak nevezzük

A variációs sorozat szórásának fő jellemzőjét ún diszperzió. Minta szórásaD ban ben a következő képlettel számítják ki:

ahol x i – i -edik érték a mintából előforduló m i alkalommal; n - minta nagysága; a minta átlaga; k a különböző értékek száma a mintában. Ebben a példában: x 1 = 72, m 1 = 50; x 2 = 85, m 2 = 44; x 3 = 69, m 3 = 61; n=155; k=3; . Azután:

Vegye figyelembe, hogy minél nagyobb a diszperziós érték, annál nagyobb a különbség a mért mennyiség értékei között. Ha a mintában a mért érték összes értéke egyenlő egymással, akkor egy ilyen minta szórása nullával egyenlő.

A diszperzió különleges tulajdonságokkal rendelkezik.

1. tulajdonság.Bármely minta szórásának értéke nem negatív, azaz. .

2. tulajdonság.Ha a mért érték állandó X=c, akkor az ilyen érték szórása nulla: D[c ]= 0.

3. tulajdonság.Ha a mért mennyiség összes értéke x a minta növekedésében c alkalommal, akkor ennek a mintának a szórása növekszik c 2-szer: D[cx ]= c 2 D [ x ], ahol c = állandó.

Néha a variancia helyett a minta szórását használjuk, amely egyenlő a minta szórásának számtani négyzetgyökével: .

A vizsgált példa esetében a minta szórása egyenlő .

A diszperzió segítségével nemcsak az egy csoporton belüli mért mutatók eltérésének mértékét lehet értékelni, hanem a különböző csoportok közötti adatok eltérésének meghatározására is használható. Ehhez többféle diszperziót használnak.

Ha egy csoportot veszünk mintának, akkor ennek a csoportnak a varianciáját nevezzük csoport variancia. A több csoport varianciái közötti különbségek számszerű kifejezésére létezik a fogalom csoportközi variancia. A csoportközi variancia a csoportátlagok szórása a teljes átlaghoz képest:

ahol k a csoportok száma a teljes mintában, a minta átlaga i -edik csoport, n i - minta nagyságaén csoport, - mintaátlag minden csoportra.

Vegyünk egy példát.

A matematika ellenőrző munka átlagpontszáma 10 „A” osztályban 3,64, a 10 „B” osztályban 3,52 volt. 10 "A"-ban 22 tanuló van, a 10-ben pedig "B"-ben - 21. Határozzuk meg a csoportközi diszperziót.

Ebben a feladatban a mintát két csoportra (két osztályra) osztjuk. Az összes csoport mintaátlaga:

.

Ebben az esetben a csoportok közötti variancia:

Mivel a csoportközi variancia közel nulla, arra a következtetésre juthatunk, hogy az egyik csoport (10 "A" osztály) pontszámai kis mértékben eltérnek a második csoport (10 "B" osztály) pontszámaitól. Vagyis a csoportközi variancia szempontjából a vizsgált csoportok egy adott attribútum tekintetében némileg eltérnek egymástól.

Ha a teljes mintát (például egy tanulóosztályt) több csoportra osztjuk, akkor a csoportközi variancia mellett kiszámíthatócsoporton belüli variancia. Ez az eltérés az összes csoport eltérés átlaga.

Csoporton belüli varianciaD Magyarország képlettel számolva:

ahol k a csoportok száma a teljes mintában, D i – variancia i kötetcsoport n i .

Összefüggés van az általános (D ban ben ), csoporton belüli ( D ngr ) és csoportközi ( D intergr) diszperziók:

D in \u003d D ingr + D intergr.

    HATÉKONY SZÓRÓ FELÜLET (TERÜLET)- a cél reflexiós képességére jellemző, az el erejének arányával kifejezve. magn. a céltárgy által a vevő irányába visszavert energiát a céltárgyra eső felületi energia fluxussűrűségig. Attól függ… … Enciklopédia a Stratégiai Rakéta Erőkről

    Kvantummechanika ... Wikipédia

    - (EPR) az elektromágneses hullámokkal besugárzott céltárgy reflexiós képességére jellemző. Az EPR értéket a céltárgy által a rádióelektronikus eszközök (RES) irányába visszavert elektromágneses energia áramlásának (teljesítményének) a ... ... tengeri szótárhoz viszonyított arányaként határozzuk meg.

    kóbor banda- Kísérleti adatok statisztikai jellemzői, amelyek az átlagértékektől való eltérésüket tükrözik. Témák a kohászatról általában EN desperal band … Műszaki fordítói kézikönyv

    - (modulációs átviteli funkció), funkció, vágás segítségével a képalkotó optikai „élessége”. rendszerek és az ilyen rendszerek elemei. Ch. to. x. a Fourier-transzformációja az ún. vonalterítési függvény, amely leírja a "szórás" természetét ... ... Fizikai Enciklopédia

    Modulációs átviteli funkció, amely a képalkotó optikai rendszerek és az ilyen rendszerek egyes elemeinek „élesség” tulajdonságait értékeli (lásd például: Egy fényképes kép élessége). Ch. to. x. van egy Fourier......

    kóbor banda- a kísérleti adatok statisztikai jellemzői, amelyek tükrözik az átlagértéktől való eltérésüket. Lásd még: Csíkszalag visszaállító szalag Keményíthetőségi szalag… Enciklopédiai Kohászati ​​Szótár

    SZÓRÓSZÁV- a kísérleti adatok statisztikai jellemzői, amelyek tükrözik az átlagos értékektől való eltérésüket... Kohászati ​​szótár

    Egy valószínűségi változó értékeinek szórására jellemző. Mt. h a négyzeteltérés (Lásd. Négyzeteltérés) σ képlettel van összefüggésben A szórás mérésének ezt a módját az magyarázza, hogy normál ... ... Nagy szovjet enciklopédia

    VÁLTOZÁSI STATISZTIKA- VARIÁCIÓS STATISZTIKA, a főként a természettudományokban használt statisztikai elemzési technikák csoportját egyesítő fogalom. A XIX. század második felében. Quetelet (Quetelet, „Anthro pometrie ou mesure des differentes facultes de 1… … Nagy Orvosi Enciklopédia

    Várható érték- (Populációs átlag) A matematikai várakozás egy valószínűségi változó valószínűségi eloszlása ​​Matematikai elvárás, definíció, diszkrét és folytonos valószínűségi változók matematikai elvárása, szelektív, feltételes várakozás, számítás, ... ... A befektető enciklopédiája

NAK NEK alapvető statisztikai jellemzők méréssorozatok (variációs sorozatok) vannak pozíció jellemzői (átlagos jellemzők, vagy a minta központi trendje); szórási jellemzők (eltérések vagy ingadozások) És x forma jellemzői terjesztés.

NAK NEK pozíció jellemzői viszonyul számtani átlaga (átlagos), divatÉs középső.

NAK NEK szórási jellemzők (eltérések vagy ingadozások) viszonyul: variációs tartomány, diszperzió, négyzetes közép (alapértelmezett) eltérés, számtani közép hiba (átlagos hiba), a variációs együttható satöbbi.

A forma jellemzőihez viszonyul aszimmetria együttható, a ferdeség és a görbület mértéke.

Pozíció jellemzői

Számtani átlaga a minta egyik fő jellemzője.

A minta egyéb numerikus jellemzőihez hasonlóan a nyers primer adatokból és ezen adatok csoportosításának eredményeiből is kiszámítható.

A nyers adatokon végzett számítás pontossága nagyobb, de a számítási folyamat nagy mintaméret mellett időigényesnek bizonyul.

Csoportosítatlan adatok esetén a számtani átlagot a következő képlet határozza meg:

ahol n- minta nagysága, x 1 , x 2 , ... x n - mérési eredmények.

Csoportosított adatok esetén:

ahol n- minta nagysága, k a csoportosítási intervallumok száma, n i- az intervallumok gyakorisága, x i az intervallumok medián értékei.

Divat

1. definíció. Divat a leggyakrabban előforduló érték a mintaadatokban. Jelölve Moés a következő képlet határozza meg:

ahol a modális intervallum alsó határa, a csoportosítási intervallum szélessége, a modális intervallum gyakorisága, a modális intervallum gyakorisága, a modált követő intervallum gyakorisága.

2. definíció. Fashion Mo diszkrét valószínűségi változó legvalószínűbb értékét ún.

Geometriailag a módusz az eloszlási görbe maximumpontjának abszcisszájaként értelmezhető. Vannak bimodális És kombinált terjesztés. Vannak olyan disztribúciók, amelyeknek van minimuma, de nincs maximumuk. Az ilyen eloszlásokat ún antimodális .

Meghatározás. Modal intervallum a legmagasabb gyakoriságú csoportosítási intervallumnak nevezzük.

Középső

Meghatározás. Középső - a mérés eredménye, amely a rangsor közepén van, vagyis a medián a jellemző értéke x, amikor a kísérleti adatok értékeinek egyik fele kisebb, a második fele pedig több, jelöljük Nekem.

Amikor a minta mérete n- páros számú, azaz páros számú mérési eredmény van, majd a medián meghatározásához a rangsorolt ​​sorozat közepén elhelyezkedő két mintamutató átlagértékét számítjuk ki.

Az intervallumokba csoportosított adatok esetén a mediánt a következő képlet határozza meg:

,

ahol a medián intervallum alsó határa; csoportosítási intervallum szélessége, 0,5 n- a mintanagyság fele, - a medián intervallum gyakorisága, - a mediánt megelőző intervallum kumulatív gyakorisága.

Meghatározás. medián intervallum azt az intervallumot nevezzük, amelyben a felhalmozott frekvencia először meghaladja a minta méretének a felét ( n/ 2) vagy a halmozott frekvencia nagyobb lesz, mint 0,5.

Az átlag, a módusz és a medián számértékei különböznek, ha az empirikus eloszlás nem szimmetrikus formája van.

Mérési szórási jellemzők

A minta eredményeinek matematikai-statisztikai elemzéséhez nem elég csak a pozíció jellemzőit ismerni. Ugyanaz az átlagérték teljesen különböző mintákat jellemezhet.

Ezért rajtuk kívül a statisztikák is figyelembe veszik szórási jellemzők (variációk, vagy volatilitás ) eredmények.

Terjeszkedési variáció

Meghatározás. nagyban variáció a legnagyobb és a legkisebb mintaeredmények közötti különbség, jelölve Rés elhatározta

R=x max- x min.

Ennek a mutatónak az információtartalma nem magas, bár kis mintaszámmal könnyen megbecsülhető a különbség a sportolók legjobb és legrosszabb eredményei között.

Diszperzió

Meghatározás. diszperzió az attribútumértékek számtani átlagtól való eltérésének középnégyzete.

Csoportosítatlan adatok esetén az eltérést a képlet határozza meg

s2 = , (1)

ahol Х i- a jellemző értéke, - a számtani átlag.

Az intervallumokba csoportosított adatok esetében a szórást a képlet határozza meg

,

ahol x i- jelent én csoportosítási intervallum, n i– intervallumfrekvenciák.

A számítások egyszerűsítése és a számítási hibák elkerülése érdekében az eredmények kerekítésekor (különösen a mintanagyság növelésekor) más képleteket is alkalmaznak az eltérés meghatározására. Ha a számtani átlagot már kiszámították, akkor a csoportosítatlan adatokhoz a következő képletet kell használni:

csoportosított adatok esetén:

.

Ezeket a képleteket az előzőekből az összegjel alatti különbség négyzetének bővítésével kapjuk meg.

Az értékek mintaátlaghoz viszonyított változásának értékelésére használt fő diszperziós jellemzők a variancia, a szórás és a variációs együttható.

1. Diszperzió(a lat. diszperzió - szétszóródás ) az x i értékek számtani átlagától való négyzetes eltérésének számtani átlaga.

Diszperzió (D)- a szóródás mértékét (az átlagtól való eltérést) a következőképpen határozzuk meg - az egyes opciókból kivonjuk a számtani átlagot, a különbséget négyzetre emeljük és megszorozzuk a megfelelő gyakorisággal. Ezután határozza meg az összes termék összegét, és ossza el a sokaság térfogatával:

Csoportosított adatok esetén az eltérést a következők határozzák meg:

A variancia dimenziója nem esik egybe a változó jellemző mértékegységeivel.

Gyakorlati feladatok megoldása során a minta szórásának számítására szolgáló képletek használata mellett olyan értéket használunk, amely ún. korrigált variancia. A helyzet az, hogy a minta variancia értéke alulbecsült értékeket ad a tényleges szóráshoz képest, ezért kis minták esetén (n< 30) необходимо применять исправленную дисперсию и среднеквадратическое отклонение :

vagy

2. Minta és korrigált szórás (σ, s) a variancia négyzetgyöke. A szórás dimenziója, ellentétben a variancia dimenziójával, egybeesik a kísérleti adatok egységeivel, így elsősorban a vizsgált tulajdonság szórásának jellemzésére szolgál.

Az 1. példában bemutatjuk a diszperzió számítását (5. táblázat).

5. táblázat

Köztes varianciaszámítás

sz. p / p Medián értékek, x i Osztályfrekvenciák, n i
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
összeg

A csoportosított példaadatok eltérése a következő:

A szórás rendre egyenlő:

A korrigált szórás:

Megjegyzendő, hogy a minta és a korrigált szórások számítási képlete csak nevezőben tér el. Kellően nagy n esetén a minta és a korrigált szórások alig térnek el, ezért a gyakorlatban a korrigált szórást használjuk, ha n< 30 .

3. Variációs együttható (v)- egy jellemző szórásának relatív mértéke, a minta megfigyelések homogenitásának mutatójaként használják (6. táblázat).

A variációs együttható a szórás és a számtani átlag aránya, százalékban kifejezve. Ezenkívül a variációs együtthatót gyakran használják a különböző jellemzők különböző mértékegységekben kifejezett variációs fokának összehasonlításakor (összehasonlításakor).

A szórás jellegének meghatározásához a v dimenzió nélküli variációs együtthatót a következő képlettel számítjuk ki:

,

ahol σ a szórás;

A mintaadatok számtani átlaga.

Részvény