Null és alternatív hipotézisek. "Trust" ellenőrzési módszer

Mivel a statisztika mint kutatási módszer olyan adatokkal foglalkozik, amelyekben a kutatót érdeklő mintázatokat különböző véletlenszerű tényezők torzítják, a legtöbb statisztikai számításhoz az adatok forrására vonatkozó feltételezések vagy hipotézisek tesztelése is társul.

Pedagógiai hipotézis (tudományos hipotézis az egyik vagy másik módszer előnyeiről szóló állítást) a statisztikai elemzés során lefordítják a statisztika nyelvére, és legalább két statisztikai hipotézisben újrafogalmazzák.

Kétféle hipotézis létezik: az első típus - leíró hipotézisek, amelyek leírják az okokat és a lehetséges következményeket. A második típus - magyarázó : magyarázatot adnak az egyes okokból eredő lehetséges következményekre, és jellemzik azokat a feltételeket is, amelyek mellett ezek a következmények szükségszerűen következnek, azaz megmagyarázzák, milyen tényezők és feltételek alapján lesz ez a következmény. A leíró hipotézisek nem rendelkeznek előrelátással, míg a magyarázó hipotézisek igen. A magyarázó hipotézisek arra késztetik a kutatókat, hogy a jelenségek, tényezők és feltételek között bizonyos szabályos összefüggések létezését feltételezzék.

A pedagógiai kutatások hipotézisei azt sugallhatják, hogy az egyik eszköz (vagy azok egy csoportja) hatékonyabb lesz, mint a többi eszköz. Itt egy hipotetikus feltételezés fogalmazódik meg az eszközök, módszerek, módszerek, oktatási formák összehasonlító hatékonyságáról.

A hipotetikus előrejelzés magasabb szintje, hogy a tanulmány szerzője azt feltételezi, hogy bizonyos mértékrendszerek nemcsak jobbak lesznek a másiknál, hanem számos lehetséges rendszer közül bizonyos kritériumok alapján optimálisnak tűnik. Egy ilyen sejtés szigorúbb és ennélfogva részletesebb bizonyítást igényel.

Kulaichev A.P. Adatelemzés módszerei és eszközei Windows környezetben. Szerk. 3., átdolgozva. és további - M: InKo, 1999, 129-131

Pszichológiai-pedagógiai szótár pedagógusoknak, oktatási intézményvezetőknek. - Rostov-n / D: Phoenix, 1998, 92. o

5. Az alkalmazott statisztika főbb problémái - adatleírás, becslés, hipotézisek tesztelése

A hipotézisvizsgálatban használt kulcsfogalmak

Statisztikai hipotézis - a valószínűségi változók (elemek) ismeretlen eloszlására vonatkozó bármely feltételezés. Íme néhány statisztikai hipotézis megfogalmazása:

1. A megfigyelések eredményei normális eloszlás nullával matematikai elvárás.
2. A megfigyelések eredményeinek eloszlási függvénye van N(0,1).
3. A megfigyelések eredményei normális eloszlásúak.
4. A két független mintában végzett megfigyelések eredményei azonos normális eloszlásúak.
5. A két független mintában végzett megfigyelések eredményei azonos eloszlásúak.

Vannak null és alternatív hipotézisek. A nullhipotézis a tesztelendő hipotézis. Egy alternatív hipotézis minden érvényes hipotézis, kivéve a nullhipotézist. A nullhipotézis az H 0, alternatíva - H 1(a hipotézisből - „hipotézis” (angol)).

Egyik vagy másik null- vagy alternatív hipotézis kiválasztását a vezető, közgazdász, mérnök, kutató előtt álló alkalmazott feladatok határozzák meg. Vegye figyelembe a példákat.

11. példa. Legyen a nullhipotézis a fenti listából a 2. hipotézis, az alternatív hipotézis pedig az 1. Ez azt jelenti, hogy a valós helyzetet egy valószínűségi modell írja le, amely szerint a megfigyelések eredményeit független, azonos eloszlású valószínűségi változók realizációjának tekintjük. eloszlásfüggvénnyel N(0,σ), ahol a σ paraméter ismeretlen a statisztikus számára. Ebben a modellben a nullhipotézis a következőképpen van felírva:

H 0: σ = 1,

és egy ilyen alternatíva:

H 1: σ ≠ 1.

12. példa. Legyen a nullhipotézis továbbra is a fenti lista 2. hipotézise, ​​az alternatív hipotézis pedig ugyanennek a listának a 3. hipotézise. Ekkor egy vezetési, gazdasági vagy termelési helyzet valószínűségi modelljében feltételezzük, hogy a megfigyelések eredményei egy normális eloszlásból képeznek mintát. N(m, σ) bizonyos értékekre més σ. A hipotézisek így íródnak:

H 0: m= 0, σ = 1

(mindkét paraméter rögzített értéket vesz fel);

H 1: m≠ 0 és/vagy σ ≠ 1

(vagyis akár m≠ 0 vagy σ ≠ 1, vagy mindkettő m≠ 0 és σ ≠ 1).

13. példa Legyen H A 0 az 1. hipotézis a fenti listából, és H 1 - 3. hipotézis ugyanabból a listából. Ekkor a valószínűségi modell ugyanaz, mint a 12. példában,

H 0: m= 0, σ tetszőleges;

H 1: m≠ 0, σ tetszőleges.

14. példa Legyen H A 0 a 2. hipotézis a fenti listából, és ennek megfelelően H 1 megfigyelési eredménynek eloszlásfüggvénye van F(x), nem egyezik a szabványos normál eloszlásfüggvénnyel F(x). Azután

H 0: F(x) = F(x) mindenkinek x(így írva F(x) ≡ F(x));

H 1: F(x 0) ≠ F (x 0) néhánynál x 0(azaz nem igaz F(x) ≡ F(x)).

Jegyzet. Itt ≡ a függvények azonos egybeesésének jele (azaz az argumentum összes lehetséges értékének egybeesése x).

15. példa Legyen H A 0 a 3. hipotézis a fenti listából, és ennek megfelelően H 1 megfigyelési eredménynek eloszlásfüggvénye van F(x), nem normális. Azután

Néhány m, σ;

H 1: bármilyen m, σ van x 0 = x 0(m, σ) olyan, hogy .

16. példa Legyen H 0 - 4. hipotézis a fenti listából, a valószínűségi modell szerint két mintát veszünk eloszlásfüggvényű sokaságokból F(x) És G(x), amelyek normálisak paraméterekkel m 1 , σ 1 és m 2 , σ 2, illetve H 1 - tagadás H 0 . Azután

H 0: m 1 = m 2, σ 1 = σ 2, és m 1 és σ 1 tetszőleges;

H 1: m 1 ≠ m 2 és/vagy σ 1 ≠ σ 2 .

17. példa. Legyen a 16. példa feltételei mellett ismert, hogy σ 1 = σ 2 . Azután

H 0: m 1 = m 2 , σ > 0, és m 1 és σ tetszőleges;

H 1: m 1 ≠ m 2, σ > 0.

18. példa. Legyen H 0 - 5. hipotézis a fenti listából, a valószínűségi modell szerint két mintát veszünk eloszlásfüggvényű sokaságokból F(x) És G(x) illetve, és H 1 - tagadás H 0 . Azután

H 0: F(x) G(x) , ahol F(x)

H 1: F(x) És G(x) tetszőleges eloszlásfüggvények, és

F(x) G(x) néhánnyal x.

19. példa. Tegyük fel a 17. példa feltételei mellett, hogy az eloszlás függvényei F(x) És G(x) csak a műszakban különböznek, i.e. G(x) = F(x- de) néhánynál de. Azután

H 0: F(x) G(x) ,

ahol F(x) egy tetszőleges eloszlásfüggvény;

H 1: G(x) = F(x- a), a ≠ 0,

ahol F(x) egy tetszőleges eloszlásfüggvény.

20. példa. Legyen a 14. példa feltételei mellett ismert, hogy a helyzet valószínűségi modellje szerint F(x) egy normál eloszlású függvény egységnyi szórással, azaz. van formája N(m, egy). Azután

H 0: m = 0 (azok. F(x) = F(x)

mindenkinek x); (így írva F(x) ≡ F(x));

H 1: m 0

(azaz nem igaz F(x) ≡ F(x)).

21. példa. A technológiai, gazdasági, vezetési vagy egyéb folyamatok statisztikai szabályozása során vegyünk egy normál eloszlású és ismert varianciájú sokaságból vett mintát, és hipotéziseket.

H 0: m = m 0 ,

H 1: m= m 1 ,

ahol a paraméter értéke m = m 0 megfelel a folyamat megállapított menetének, és az átmenetnek m= m 1 meghibásodást jelez.

22. példa. Statisztikai átvétel-ellenőrzéssel a mintában lévő hibás termékegységek száma hipergeometrikus eloszlásnak engedelmeskedik, az ismeretlen paraméter p = D/ N a hibaszint, hol N- a terméktétel mennyisége, D- a tételben lévő hibás egységek teljes száma. A szabályozási, műszaki és kereskedelmi dokumentációban (szabványok, szállítási szerződések stb.) használt ellenőrzési tervek gyakran egy hipotézis tesztelésére irányulnak.

H 0: p < AQL

H 1: p > LQ,

ahol AQL – a hibásság elfogadási szintje, LQ a hibák hibássági szintje (nyilvánvalóan AQL < LQ).

23. példa. Egy technológiai, gazdasági, vezetési vagy egyéb folyamat stabilitásának mutatójaként az ellenőrzött mutatók eloszlásának számos jellemzőjét használják, különösen a variációs együtthatót. v = σ/ M(x). A nullhipotézist tesztelni kell

H 0: v < v 0

alternatív hipotézis szerint

H 1: v > v 0 ,

ahol v 0 valami előre meghatározott határérték.

24. példa. Legyen két minta valószínűségi modellje ugyanaz, mint a 18. példában, jelöljük az első és a második mintában a megfigyelések eredményeire vonatkozó matematikai elvárásokat M(x) És M(Nál nél) ill. Bizonyos helyzetekben a nullhipotézist tesztelik

H 0: M(X) = M(Y)

az alternatív hipotézissel szemben

H 1: M(X) ≠ M(Y).

25. példa. Feljebb megjegyezték nagyon fontos az eloszlásfüggvények matematikai statisztikájában 0-hoz képest szimmetrikus, A szimmetria ellenőrzésekor

H 0: F(- x) = 1 – F(x) mindenkinek x, másképp F tetszőleges;

H 1: F(- x 0 ) ≠ 1 – F(x 0 ) néhánynál x 0 , másképp F tetszőleges.

Valószínűségi-statisztikai döntéshozatali módszerekben a statisztikai hipotézisek tesztelésére szolgáló számos egyéb problémamegfogalmazást is alkalmaznak. Néhányat az alábbiakban tárgyalunk.

A statisztikai hipotézis tesztelésének konkrét feladata teljes mértékben leírható, ha megadjuk a null- és alternatív hipotézist. A statisztikai hipotézis tesztelésére szolgáló módszer megválasztását, a módszerek tulajdonságait és jellemzőit mind a null, mind az alternatív hipotézis határozza meg. Ugyanazon nullhipotézis különböző alternatív hipotézisek melletti teszteléséhez általánosságban elmondható, hogy különböző módszereket kell alkalmazni. Tehát a 14. és 20. példában a nullhipotézis ugyanaz, míg az alternatív hipotézisek eltérőek. Ezért a 14. példa körülményei között paraméteres családdal (Kolmogorov típusú vagy omega-négyzet típusú) illeszkedési kritériumokon alapuló módszereket, a 20. példa körülményei között Student-féle teszten vagy Cramer-Welch teszten alapuló módszereket kell alkalmazni. Ha a 14. példa körülményei között a Hallgató kritériumot használjuk, akkor az nem oldja meg a kitűzött feladatokat. Ha a 20. példa körülményei között Kolmogorov-típusú illeszkedési tesztet használunk, akkor az éppen ellenkezőleg, megoldja a kitűzött feladatokat, bár talán rosszabbul, mint a Student-féle speciálisan erre az esetre adaptált kritérium.

A valós adatok feldolgozása során nagy jelentősége van a hipotézisek helyes megválasztásának. H 0 és H egy . Az olyan feltételezéseket, mint az eloszlás normalitása, gondosan meg kell indokolni, különösen statisztikai módszerekkel. Vegye figyelembe, hogy az alkalmazott beállítások túlnyomó többségében a megfigyelési eredmények eloszlása ​​eltér a normáltól.

Gyakran adódik olyan helyzet, amikor az alkalmazott probléma megfogalmazásából a nullhipotézis formája következik, és az alternatív hipotézis formája nem egyértelmű. Ilyen esetekben meg kell fontolni a legáltalánosabb formájú alternatív hipotézist, és olyan módszereket kell alkalmazni, amelyek minden lehetséges módon megoldják a problémát. H egy . Különösen, amikor a 2. hipotézist (a fenti listából) nullként teszteljük, alternatív hipotézist kell használni H 1 a 14. példából, és nem a 20. példából, ha az alternatív hipotézis szerinti megfigyelések eredményeinek eloszlásának normalitása nem indokolja különösebben.

Előző

A statisztikai kutatás és modellezés különböző szakaszaiban szükségessé válik bizonyos feltételezések (hipotézisek) megfogalmazása és kísérleti igazolása a vizsgált általános sokaság (halmazok) ismeretlen paramétereinek természetére és nagyságára vonatkozóan. Például a kutató feltételezi: "a minta normál sokaságból származik" vagy "az elemzett sokaság általános átlaga egyenlő öttel". Az ilyen feltételezéseket ún statisztikai hipotézisek.

Az általános sokaságra vonatkozó felállított hipotézis összehasonlítása a rendelkezésre álló mintaadatokkal, a kapott következtetés megbízhatóságának kvantitatív értékelésével együtt, egyik vagy másik statisztikai kritérium alapján történik, és ún. statisztikai hipotézisek tesztelése .

A javasolt hipotézist ún nulla (alap) . Általában hivatkoznak rá H 0.

A megfogalmazott (fő) hipotézissel kapcsolatban mindig megfogalmazható alternatív (versenyző) ez ellentmond annak. Általában alternatív (versenyző) hipotézist jelölnek H 1.

A statisztikai hipotézisvizsgálat célja mintaadatok alapján dönteni a fő hipotézis érvényességéről H 0.

Ha a feltett hipotézist arra az állításra redukáljuk, hogy az általános sokaság valamely ismeretlen paraméterének értéke pontosan egyenlő adott érték, akkor ezt a hipotézist ún egyszerű, például: "Oroszország lakosságának átlagos egy főre jutó összjövedelme 650 rubel havonta"; „A munkanélküliségi ráta (a munkanélküliek aránya a gazdaságilag aktív népességen belül) Oroszországban 9%. Más esetekben a hipotézist ún nehéz.

Nullhipotézisként H 0 egyszerű hipotézist szokás felállítani, mert általában kényelmesebb egy szigorúbb állítást ellenőrizni.

Hipotézisek a vizsgált valószínűségi változó eloszlási törvényének alakjáról;

Hipotézisek a vizsgált általános populáció paramétereinek számszerű értékeiről;

Két vagy több minta homogenitására vonatkozó hipotézisek vagy az elemzett populációk néhány jellemzője;

Hipotézisek arról Általános nézet a jellemzők közötti statisztikai összefüggést leíró modell stb.

Mivel a statisztikai hipotézisek tesztelése mintaadatok alapján történik, pl. a nullhipotézissel kapcsolatos megfigyelések, döntések korlátozott halmaza H 0 valószínűségiek. Más szóval, egy ilyen döntéshez elkerülhetetlenül társul némi, bár talán nagyon kicsi a valószínűsége annak, hogy bármelyik irányba téves következtetés születik.



Tehát az esetek kis részében α null hipotézist H 0 elutasítható, míg a valóságban ez igazságos a lakosság körében. Az ilyen hibát ún írjon be egy hibát . A valószínűségét pedig ún szignifikancia szintje és kijelölni α .

Ezzel szemben az esetek kis részében β null hipotézist H 0 elfogadott, míg valójában az általános populációban téves, és az alternatív hipotézis igaz H 1. Az ilyen hibát ún típusú hiba . Általában a második típusú hiba valószínűségét jelölik β . Valószínűség 1-β hívott a kritérium ereje .

Rögzített mintamérettel csak az egyik hiba valószínűségi értékét választhatja meg saját belátása szerint α vagy β . Az egyik valószínűségének növekedése a másik csökkenéséhez vezet. Az első típusú hiba valószínűségét szokás beállítani α - szignifikancia szint. Általában néhány szabványos szignifikanciaszint-értéket használnak. α : 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Akkor nyilván két, azonos valószínűséggel jellemezhető kritérium alapján α utasítson el egy igaz hipotézist H 0, el kell fogadni azt, amihez kisebb, másodfajú hiba társul β , azaz több erő. Mindkét hiba valószínűségének csökkentése α És β a minta méretének növelésével érhető el.

Helyes döntés a nullhipotézissel kapcsolatban H 0 kétféle is lehet:

A nullhipotézist elfogadjuk. H 0, míg valójában a nullhipotézis igaz az általános populációra H 0; egy ilyen döntés valószínűsége 1 - α;

Null hipotézist H 0 el kell utasítani egy alternatíva javára H 1, míg valójában az általános populációban a nullhipotézis H 0 alternatíva javára elutasították H 1; egy ilyen döntés valószínűsége 1 - β - a kritérium hatványa.

A nullhipotézis döntés eredményeit a 8.1. táblázat segítségével szemléltethetjük.

8.1. táblázat

A statisztikai hipotéziseket a segítségével teszteljük statisztikai kritérium(nevezzük általánosnak NAK NEK), ami a megfigyelési eredmények függvénye.

A statisztikai kritérium egy szabály (képlet), amellyel a mintamegfigyelés eredményei és a felállított H 0 hipotézis közötti eltérés mértéke meghatározható.

A statisztikai kritérium, mint a megfigyelési eredmények bármely függvénye, egy valószínűségi változó, és feltételezve a nullhipotézis érvényességét H 0 alá tartozik néhány jól tanulmányozott (és táblázatba foglalt) elméleti eloszlási törvény az eloszlássűrűséggel f(k).

A statisztikai hipotézisek tesztelésének kritériumának megválasztása többféle elv alapján történhet. Leggyakrabban erre használják a valószínűségi arány elve, amely lehetővé teszi az összes lehetséges kritérium közül a legerősebb kritérium felépítését. Lényege egy ilyen kritérium megválasztására korlátozódik NAK NEK ismert sűrűségfüggvénnyel f(k) a H ​​0 hipotézis érvényességének függvényében, így adott szignifikanciaszinten α meg lehetne találni a kritikus pontot K kr.terjesztés f(k), amely két részre osztaná a kritérium értéktartományát: az elfogadható értékek tartományára, amelyben a minta megfigyelésének eredménye a legvalószínűbb, és a kritikus tartományra, amelyben a minta megfigyelésének eredményei kevésbé valószínű a nullhipotézishez képest H 0.

Ha egy ilyen kritérium NAK NEK választjuk, és ismert az eloszlásának sűrűsége, akkor a statisztikai hipotézis tesztelésének feladata lecsökkenti annak biztosítását, hogy adott szignifikanciaszinten α a mintaadatokból számítsa ki a kritérium megfigyelt értékét Az obl.és határozza meg, hogy többé-kevésbé valószínű-e a nullhipotézis tekintetében H 0.

A statisztikai hipotézisek mindegyik típusának tesztelése a megfelelő kritérium alapján történik, amely minden esetben a legerősebb. Például egy valószínűségi változó eloszlási törvényének formájára vonatkozó hipotézis tesztelése elvégezhető Pearson-féle illeszkedési teszttel. χ 2; két általános sokaság varianciáinak ismeretlen értékeinek egyenlőségére vonatkozó hipotézis igazolása - a kritérium segítségével F- Fisher; számos hipotézist tesztelünk az általános populációk paramétereinek ismeretlen értékeiről a kritérium segítségével Z- normál eloszlású valószínűségi változó és kritérium T- Diák stb.

A mintaadatok alapján speciális szabályok szerint számított kritérium értékét ún a kritérium megfigyelt értéke (Az obl.).

Kritériumértékek, a kritériumértékek halmazát osztva ezzel tolerancia tartomány(a legvalószínűbb a nullhipotézis szempontjából H 0) És kritikus régió(a valószínűségi változók eloszlási táblázataihoz képest kevésbé valószínű értéktartomány NAK NEK kritériumként választott ún kritikus pontok (K kr.).

Az elfogadható értékek területe (a nullhipotézis elfogadási területe H 0) NAK NEK H 0 nincs elutasítva.

Kritikus terület hívja meg a kritérium értékkészletét NAK NEK , amely alatt a nullhipotézis H 0 riválisa javára tért el H 1 .

Megkülönböztetni egyoldalú(jobb vagy bal kéz) és kétoldalú kritikus régiók.

Ha a versengő hipotézis jobbkezes, pl. H 1: a > a 0, akkor a kritikus tartomány az jobb oldali(1.ábra). A jobbkezes versengő hipotézis szerint a kritikus pont (Cr. jobb oldali) pozitív értékeket vesz fel.

Ha a versengő hipotézis balkezes, pl. H 1: a< а 0 , akkor a kritikus tartomány az bal oldali(2. ábra). A baloldali versengő hipotézis szerint a kritikus pont kerül be negatív értékeket (Kr. bal oldali).

Ha a versengő hipotézis kétoldalú, pl. H 1: a¹ egy 0, akkor a kritikus tartomány az kétoldalú(3. ábra). Egy kétoldalú versengő hipotézissel két kritikus pontot határozunk meg (K kr. bal oldaliÉs A cr. jobb kéz).


Megengedett terület Kritikus

értéktartományba esik

A hipotézisek megfogalmazása rendszerezi a kutató feltételezéseit, és világosan, tömören mutatja be azokat. A döntés, amelyet a kutatónak meg kell hoznia, a statisztikai hipotézis igazáról vagy hamisságáról szól. Kétféle hipotézis létezik: tudományos és statisztikai. Tudományos A hipotézis egy probléma javasolt megoldása (tételként megfogalmazva). Statisztikai a hipotézis egyszerűen az általános sokaság egy ismeretlen paraméterére vonatkozó állítás (egy valószínűségi változó vagy esemény tulajdonsága), amelyet egy kapcsolat megbízhatóságának tesztelésére fogalmaznak meg, és amely igazolható az ismert mintastatisztikák (kutatási eredmények, elérhető empirikus adatok) alapján. ).

A statisztikai hipotéziseket nulla és alternatív, irányított és nem-irányított hipotézisekre osztják. Nullhipotézis (H 0) ez egy hipotézis a különbségek hiányáról, egy tényező befolyásának hiányáról, a hatás hiányáról stb.. Ezt kellene megcáfolni, ha a különbségek jelentőségének bizonyításával állunk szemben. Alternatív hipotézis (H 1) ez egy hipotézis a különbségek jelentőségéről. Ez az, amit állítólag bizonyítani kell, ezért is nevezik néha kísérleti vagy munkahipotézisnek.

önmaga a kapott kvantitatív adatok feldolgozására szolgáló eljárást, amely néhány statisztikai jellemző és becslés kiszámításából áll, amelyek lehetővé teszik a nullhipotézis tesztelését, statisztikai elemzésnek nevezzük..

A null- és alternatív hipotézisek lehetnek irányítottak vagy nem irányítottak. A hipotézist az ún irányította ha tartalmazza a különbségek irányának jelzését. Ilyen hipotéziseket kell megfogalmazni például abban az esetben, ha az egyik csoportban az alanyok egyéni értékei valamelyik jellemzőnél magasabbak, a másikban alacsonyabbak, vagy bizonyítandó, hogy az egyik csoportban bármilyen kísérleti hatás hatására markánsabb változások történtek, mint a másik csoportban. A hipotézist az ún nem irányított, ha annak megfogalmazása csak a különbségek vagy nem eltérések meghatározását feltételezi (a különbségek irányának megjelölése nélkül). Például, ha bizonyítani kell, két különböző csoportban eltér egy jellemző eloszlási formái.

Példák hipotézisek megfogalmazására.

A statisztikai hipotézis érvényességének eldöntésére használt módszert ún hipotézisvizsgálat. A hipotézisvizsgálat alapelve a nullhipotézis felállítása. H 0, hogy megpróbálja cáfolni, és ezzel megerősíteni az alternatív hipotézist H 1 .

Bármilyen statisztikai hipotézis tesztelésekor a kutató döntése soha nem születik biztosan, hiszen mindig fennáll a rossz döntés kockázata.

A felhasznált minták általában kicsik, és ezekben az esetekben a hiba valószínűsége jelentős lehet. Van egy ún megbízhatósági szint (szignifikancia szint) különbségek. Ez annak a valószínűsége, hogy a különbségeket szignifikánsnak tekintjük, de valójában véletlenszerűek. Vagyis ez a nullhipotézis elutasításának valószínűsége, miközben igaz.

Ha a különbségeket 5%-os szignifikanciaszinten vagy p£0,05-nél szignifikánsnak mondjuk, akkor azt értjük, hogy annak a valószínűsége, hogy végül is nem szignifikánsak, 0,05 ( legalacsonyabb szint statisztikai jelentőség). Ha egy eltérést szignifikánsnak mondunk 1%-os szignifikancia szinten, vagy p£0,01-en, akkor az azt jelenti, hogy annak valószínűsége, hogy végül is nem szignifikáns, 0,01 (a statisztikai szignifikancia elégséges szintje). Ha a különbségeket 0,1%-os szignifikanciaszinten vagy p£0,001-en szignifikánsnak mondjuk, akkor ez azt jelenti, hogy annak valószínűsége, hogy továbbra sem szignifikánsak, 0,001 ( legmagasabb szint statisztikai jelentőség).

A H 0 elutasítás és H 1 elfogadás szabálya:

Ha a kritérium tapasztalati értéke egyenlő vagy meghaladja a p £ 0,05-nek megfelelő kritikus értéket, akkor H 0 elutasították, de még nem fogadták el határozottan H 1.

Ha a kritérium tapasztalati értéke egyenlő vagy meghaladja a p £ 0,01-nek megfelelő kritikus értéket, akkor H 0 elutasítva elfogadva H 1.

A döntési szabály megjelenítéséhez használhatja az úgynevezett "szignifikancia tengelyt".

Ha a konfidenciaszintet nem lépik túl, akkor valószínűnek tekinthető, hogy a feltárt különbség valóban tükrözi a lakosság helyzetét. Az egyes statisztikai módszer ez a szint megtanulható a megfelelő kritériumok kritikus értékeinek eloszlási táblázataiból.

T - Hallgatói kritérium

Ez egy parametrikus módszer, amellyel a normál eloszlású és azonos varianciájú populációk kvantitatív adatainak elemzésekor az átlagok különbségének érvényességére vonatkozó hipotéziseket tesztelnek. Jól alkalmazható az átlagértékek összehasonlításakor véletlenszerű értékek mért tulajdonság a kontroll és a kísérleti csoportban, különböző nemben és korcsoportban, más eltérő tulajdonságokkal rendelkező csoportokban.

A statisztikai hipotézisek bizonyítására szolgáló parametrikus módszerek, köztük a Student-féle t-próba alkalmazhatóságának előfeltétele az alárendeltség. empirikus eloszlás a vizsgált jellemzőt a normális eloszlás törvényéhez.

A Student-féle módszer a független és a függő minták esetében eltérő.

Független mintákat két különböző alanycsoport (például kontroll és kísérleti csoport) tanulmányozásával nyernek. NAK NEK függő a minták közé tartoznak például az alanyok azonos csoportjának eredményei a független változó expozíciója előtt és után.

A tesztelt H 0 hipotézis az, hogy a két minta átlagának különbsége nulla ( = 0), vagyis ez az átlagok egyenlőségére vonatkozó hipotézis (). A H 1 alternatív hipotézis az, hogy ez a különbség nem nulla (¹ 0), vagy eltérés van a mintaátlagokban ().

Amikor független minták az átlagok különbségének elemzéséhez a következő képletet használjuk: n 1 esetén n 2 > 30

és képlet n 1 , n 2 esetén< 30, где

az első minta számtani átlaga;

Az átlagos számtani érték második minta;

s 1 -szórás az első mintához;

s 2 - a második minta szórása;

n 1 és n 2 az első és a második minta elemeinek száma.

A t kritikus értékének meghatározásához meghatározzuk a szabadsági fokok számát:

n \u003d n 1 - 1 + n 2 - 1 \u003d (n 1 + n 2) - 2 \u003d n - 2.

Ha |t emp | > t cr, akkor elvetjük a nullhipotézist, és elfogadjuk az alternatívát, vagyis az átlagok különbségét tekintjük megbízhatónak. Ha |t emp |< t кр, то разница средних недостоверна.

Amikor függő minták az eszközök közötti különbség megbízhatóságának meghatározására szolgál következő képletet: , ahol

d– az egyes párok eredményei közötti különbség (х i – y i);

å d ezeknek a részleges különbségeknek az összege;

å d2 a részleges különbségek négyzetes összege;

n az adatpárok száma.

A t-kritérium meghatározásához függő minták esetén a szabadságfokok száma n = n - 1 lesz.

Vannak más statisztikai kritériumok is a hipotézisek tesztelésére, mind parametrikus, mind nem paraméteres. Például, egy matematikai-statisztikai kritériumot, amely lehetővé teszi a valószínűségi változók szórása közötti hasonlóságok és különbségek megítélését, Fisher-kritériumnak nevezzük.

Korrelációelemzés

A legáltalánosabb formában a „korreláció” jelentése kölcsönös kapcsolatra utal. Bár, ha már a korrelációról beszélünk, a "korreláció" és a "korreláció-függőség" kifejezéseket is használják, amelyeket gyakran szinonimaként használnak.

Alatt korreláció megérteni két vagy több jellemző összehangolt változását, pl. az egyik tulajdonság változékonysága némileg összhangban van egy másik tulajdonság változékonyságával.

Korrelációs függőség azok a változások, amelyeket egy jellemző értékei megváltoztatnak az előfordulási valószínűségben különböző értékeket másik jel.

Így a tulajdonságok konzisztens változásai és a köztük lévő, ezt tükröző korreláció nem e tulajdonságok egymástól való függőségét jelezheti, hanem mindkét tulajdonság valamely harmadik tulajdonságtól vagy a vizsgálatban nem vett tulajdonságok kombinációjától való függését.

Az összegyűjtött alapján statisztikai tanulmányok az adatok feldolgozása után következtetéseket vonunk le a vizsgált jelenségekről. Ezeket a következtetéseket statisztikai hipotézisek felállításával és tesztelésével vonjuk le.

Statisztikai hipotézis a kísérletben megfigyelt valószínűségi változók eloszlásának formájára vagy tulajdonságaira vonatkozó bármely állítást ún. A statisztikai hipotéziseket statisztikai módszerekkel teszteljük.

A tesztelendő hipotézist ún fő (nulla)és jelöltük H 0 . A nullán kívül van még alternatív (versenyző) hipotézis H 1 , a fő tagadása . Így a teszt eredményeként a hipotézisek közül csak egy kerül elfogadásra , a másodikat pedig elutasítják.

Hibatípusok. A felállított hipotézist az általános sokaságból vett minta vizsgálata alapján tesztelik. A minta véletlenszerűsége miatt a teszt nem mindig von le helyes következtetést. Ebben az esetben a következő helyzetek fordulhatnak elő:
1. A fő hipotézis igaz és elfogadásra kerül.
2. A fő hipotézis igaz, de elvetjük.
3. A fő hipotézis nem igaz, és elvetjük.
4. A fő hipotézis nem igaz, de elfogadott.
A 2. esetben az ember arról beszél első fajta hiba, az utóbbi esetben az a második típusú hiba.
Így egy minta esetében elfogadott helyes megoldás, míg mások tévednek. A döntés valamilyen mintavételi függvény értéke szerint történik, ún statisztikai jellemző, statisztikai kritérium vagy egyszerűen statisztika. A statisztika értékkészlete két nem átfedő részhalmazra osztható:

  • H 0 elfogadva (nem elutasítva), hívva hipotézis elfogadási terület (megengedhető terület);
  • statisztikai értékek részhalmaza, amelyre a hipotézis vonatkozik H 0 elutasításra kerül (elvetve), és a hipotézist elfogadjuk H 1 hívják kritikus terület.

Következtetések:

  1. kritérium hívott véletlenszerű érték K , amely lehetővé teszi a H0 nullhipotézis elfogadását vagy elutasítását.
  2. A hipotézisek tesztelésekor 2 féle hiba követhető el.
    I-es típusú hiba a hipotézis elutasítása H 0, ha igaz ("cél kihagyása"). Az I. típusú hiba elkövetésének valószínűségét α-val jelöljük, és ún szignifikancia szintje. A gyakorlatban leggyakrabban azt feltételezik, hogy α = 0,05 vagy α = 0,01.
    II típusú hiba az, hogy a H0 hipotézist akkor fogadjuk el, ha hamis („hamis pozitív”). Az ilyen típusú hibák valószínűségét β jelöli.

A hipotézisek osztályozása

Fő hipotézis H A 0 az eloszlás ismeretlen q paraméterének értékéről általában így néz ki:
H 0: q \u003d q 0.
Versengő hipotézis H 1 így nézhet ki:
H 1: q < q 0 , H 1:q> q 0 vagy H 1: qq 0 .
Ennek megfelelően kiderül bal oldal, jobb oldal vagy kétoldalú kritikus területek. A kritikus régiók határpontjai ( kritikus pontok) a vonatkozó statisztikák megoszlási táblázataiból kerül meghatározásra.

Egy hipotézis tesztelésekor ésszerű csökkenteni a rossz döntések valószínűségét. Megengedett I. típusú hiba valószínűségeáltalában jelölik aés felhívott szignifikancia szintje. Az értéke általában kicsi ( 0,1, 0,05, 0,01, 0,001 ...). De az 1-es típusú hiba valószínűségének csökkenése a 2-es típusú hiba valószínűségének növekedéséhez vezet ( b), azaz a csak igaz hipotézisek elfogadásának vágya az elutasított helyes hipotézisek számának növekedését okozza. Ezért a szignifikanciaszint megválasztását a felvetett probléma fontossága és a helytelen döntés következményeinek súlyossága határozza meg.
A statisztikai hipotézis tesztelése a következő lépésekből áll:
1) hipotézisek meghatározása H 0 és H 1 ;
2) statisztikák kiválasztása és szignifikanciaszintek hozzárendelése;
3) a kritikus pontok meghatározása K krés kritikus terület;
4) a statisztikai adatok értékének kiszámítása a mintából K pl;
5) a statisztikai érték összehasonlítása a kritikus régióval ( K krÉs K pl);
6) döntéshozatal: ha a statisztika értéke nem szerepel a kritikus tartományban, akkor a hipotézist elfogadjuk H 0 és utasítsa el a hipotézist H 1 , és ha a kritikus tartományba kerül, akkor a hipotézist elvetjük H 0 és a hipotézist elfogadjuk H egy . Ugyanakkor a statisztikai hipotézis tesztelésének eredményeit a következőképpen kell értelmezni: ha a hipotézist elfogadjuk H 1 , akkor bizonyítottnak tekinthetjük, és ha elfogadjuk a hipotézist H 0 , majd felismerték, hogy nem mond ellent a megfigyelések eredményeinek.Ez a tulajdonság azonban együtt H 0-nak más hipotézisei is lehetnek.

Hipotézisvizsgálat osztályozása

Tekintsünk tovább több különböző statisztikai hipotézist és ezek tesztelésének mechanizmusát.
ÉN) Az ismeretlen varianciájú normális eloszlás általános átlagának hipotézise. Feltételezzük, hogy az általános sokaság normális eloszlású, átlaga és szórása ismeretlen, de okkal feltételezhetjük, hogy az általános átlag egyenlő a -val. α szignifikanciaszinten szükséges a hipotézis tesztelése H 0: x=a. Alternatív megoldásként a fent tárgyalt három hipotézis egyike használható. Ebben az esetben a statisztika egy valószínűségi változó, amelynek Student-féle eloszlása ​​van n– 1 szabadságfok. Meghatározzuk a megfelelő kísérleti (megfigyelt) értéket t pl t kr H 1: x >a az α szignifikanciaszint és a szabadságfokok száma alapján található n– 1. Ha t pl < t kr H 1: x ≠a a kritikus értéket az α / 2 szignifikanciaszintből és ugyanannyi szabadsági fokból kapjuk. A nullhipotézist elfogadjuk, ha | t ex | II) Az önkényesen elosztott általános sokaságok (nagy független minták) két átlagának egyenlőségének hipotézise. α szignifikanciaszinten szükséges a hipotézis tesztelése H 0:x≠y. Ha mindkét minta térfogata nagy, akkor feltételezhetjük, hogy a mintaátlagok normális eloszlásúak, és ismertek a szórásaik. Ebben az esetben egy valószínűségi változó statisztikaként használható
,
normál eloszlású, és M(Z) = 0, D(Z) = 1. Meghatározzuk a megfelelő kísérleti értéket z pl. A Laplace-függvény táblázatából megtaláljuk a kritikus értéket z kr. Az alternatív hipotézis szerint H 1: x >y a feltételből található F(z kr) = 0,5 – a. Ha z pl< z кр , akkor a nullhipotézist elfogadjuk, ellenkező esetben elvetjük. Az alternatív hipotézis szerint H 1: x ≠ y a kritikus értéket a feltételből találjuk F(z kr) = 0,5×(1 – a). A nullhipotézist elfogadjuk, ha | z ex |< z кр .

III) A normál eloszlású általános sokaságok két átlagának egyenlőségének hipotézise, ​​amelyek varianciái ismeretlenek és azonosak (kis független minták). α szignifikanciaszinten szükséges a főhipotézis tesztelése H 0: x=y . Statisztikai adatként egy valószínűségi változót használunk
,
amelynek hallgatói disztribúciója van ( n x + n– 2) szabadsági fokok. Meghatározzuk a megfelelő kísérleti értéket t pl. A Student-féle eloszlás kritikus pontjainak táblázatából megtaláljuk a kritikus értéket t kr. Minden az (I) hipotézishez hasonlóan megoldódik.

IV) A normál eloszlású populációk két varianciájának egyenlőségének hipotézise. Ebben az esetben a szignifikancia szintjén a tesztelni kell a hipotézist H 0: D(x) = D(Y). A statisztika egy valószínűségi változó, amely Fisher-Snedecor eloszlással rendelkezik f 1 = n b– 1 és f 2 = n m- 1 szabadsági fok (S 2 b - nagy szórás, a mintájának térfogata n b). Meghatározzuk a megfelelő kísérleti (megfigyelt) értéket F pl. kritikus érték F kr alternatív hipotézis szerint H 1: D(x) > D(Y) megtalálható a Fisher-Snedecor eloszlás szignifikanciaszintek szerinti kritikus pontjainak táblázatából aés a szabadságfokok száma f 1 és f 2. A nullhipotézist akkor fogadjuk el, ha F pl < F kr.

Utasítás. A számításhoz meg kell adni a forrásadatok dimenzióját.

V) A normál eloszlású populációk több varianciájának egyenlőségének hipotézise azonos méretű mintákon. Ebben az esetben a szignifikancia szintjén a tesztelni kell a hipotézist H 0: D(x 1) = D(x 2) = …= D(Xl). A statisztika egy valószínűségi változó , amely a Cochran eloszlással rendelkezik szabadságfokkal f = n– 1 és l (n- az egyes minták mérete, l a minták száma). Ezt a hipotézist az előzőhöz hasonlóan teszteljük. A Cochran-eloszlás kritikus pontjainak táblázatát használjuk.

vi) Hipotézis a korreláció jelentőségéről. Ebben az esetben a szignifikancia szintjén a tesztelni kell a hipotézist H 0: r= 0. (Ha a korrelációs együttható nullával egyenlő, akkor a megfelelő mennyiségek nem kapcsolódnak egymáshoz). Ebben az esetben a statisztika egy valószínűségi változó
,
amelynek hallgatói elosztása van f = n– 2 szabadságfok. Ennek a hipotézisnek az igazolása az (I) hipotézis igazolásához hasonlóan történik.

Utasítás. Adja meg a forrásadatok mennyiségét.

VII) Hipotézis egy esemény bekövetkezési valószínűségének értékéről. Eleget költött nagyszámú n független vizsgálatok, amelyekben az esemény DE történt m egyszer. Okkal feltételezhető, hogy ennek az eseménynek a valószínűsége egy próba során egyenlő p 0. Fontossági szinten kötelező a tesztelje azt a hipotézist, hogy egy esemény valószínűsége DE egyenlő a hipotetikus valószínűséggel p 0. (Mivel a valószínűséget a relatív gyakorisággal becsüljük meg, a tesztelt hipotézis többféleképpen is megfogalmazható: a megfigyelt relatív gyakoriság és a hipotetikus valószínűség szignifikánsan eltér, vagy sem).
A próbák száma meglehetősen nagy, így az esemény relatív gyakorisága DE a normál törvény szerint osztják el. Ha a nullhipotézis igaz, akkor a várható értéke az p 0és a szórás. Ennek megfelelően statisztikaként egy valószínűségi változót választunk
,
amely megközelítőleg a normáltörvény szerint oszlik el nulla matematikai várakozással és egységnyi szórással. Ezt a hipotézist pontosan ugyanúgy teszteljük, mint az (I) esetben.

Utasítás. A számításhoz ki kell töltenie a kiindulási adatokat.

Részvény