Nulte i alternativne hipoteze. Metoda verifikacije "povjerenja".

Budući da se statistika kao istraživačka metoda bavi podacima u kojima su obrasci od interesa za istraživača iskrivljeni različitim slučajnim faktorima, većina statističkih proračuna je praćena testiranjem nekih pretpostavki ili hipoteza o izvoru ovih podataka.

Pedagoška hipoteza (naučna hipoteza izjava o prednostima jedne ili druge metode) prevodi se na jezik statističke nauke u procesu statističke analize i preformuliše u najmanje dve statističke hipoteze.

Postoje dvije vrste hipoteza: prva vrsta - deskriptivan hipoteze koje opisuju uzroke i moguće posljedice. Druga vrsta - objašnjavajuće : daju objašnjenje mogućih posledica iz određenih uzroka, a karakterišu i uslove pod kojima će te posledice nužno uslediti, odnosno objašnjava se na osnovu kojih faktora i uslova će ta posledica biti. Deskriptivne hipoteze nemaju predviđanje, dok eksplanatorne hipoteze imaju. Eksplanatorne hipoteze navode istraživače na pretpostavku postojanja određenih pravilnih odnosa između pojava, faktora i stanja.

Hipoteze u pedagoškom istraživanju mogu sugerisati da će jedno od sredstava (ili grupa njih) biti efikasnije od drugih sredstava. Ovdje se postavlja hipotetička pretpostavka o komparativnoj djelotvornosti sredstava, metoda, metoda, oblika obrazovanja.

Viši nivo hipotetičkog predviđanja je to što autor studije pretpostavlja da će neki sistem mjera biti ne samo bolji od drugog, već se među nizom mogućih sistema čini optimalnim u smislu određenih kriterija. Takva hipoteza zahtijeva rigorozniji i stoga detaljniji dokaz.

Kulaichev A.P. Metode i alati za analizu podataka u Windows okruženju. Ed. 3., revidirano. i dodatne - M: InKo, 1999, str. 129-131

Psihološko-pedagoški rečnik za nastavnike i rukovodioce obrazovnih ustanova. - Rostov-n / D: Phoenix, 1998, str

5. Glavni problemi primijenjene statistike - opis podataka, procjena i testiranje hipoteza

Ključni koncepti koji se koriste u testiranju hipoteza

Statistička hipoteza - svaka pretpostavka koja se tiče nepoznate distribucije slučajnih varijabli (elemenata). Evo formulacija nekoliko statističkih hipoteza:

1. Rezultati zapažanja imaju normalna distribucija sa nulom matematičko očekivanje.
2. Rezultati opservacija imaju funkciju distribucije N(0,1).
3. Rezultati posmatranja imaju normalnu distribuciju.
4. Rezultati posmatranja u dva nezavisna uzorka imaju istu normalnu distribuciju.
5. Rezultati opservacija u dva nezavisna uzorka imaju istu distribuciju.

Postoje nulte i alternativne hipoteze. Nul hipoteza je hipoteza koja se testira. Alternativna hipoteza je svaka važeća hipoteza osim nulte hipoteze. Nul hipoteza je H 0 , alternativa - H 1(od Hipoteza - "hipoteza" (engleski)).

Izbor jedne ili druge nulte ili alternativne hipoteze determinisan je primenjenim zadacima koji stoje pred menadžerom, ekonomistom, inženjerom, istraživačem. Razmotrite primjere.

Primjer 11. Neka je nulta hipoteza hipoteza 2 sa gornje liste, a alternativna hipoteza 1. To znači da je stvarna situacija opisana probabilističkim modelom, prema kojem se rezultati posmatranja smatraju realizacijom nezavisnih identično raspoređenih slučajnih varijabli sa funkcijom distribucije N(0,σ), pri čemu je parametar σ statističaru nepoznat. U ovom modelu, nulta hipoteza se piše na sljedeći način:

H 0: σ = 1,

i ovakva alternativa:

H 1: σ ≠ 1.

Primjer 12. Neka je nulta hipoteza i dalje hipoteza 2 sa gornje liste, a alternativna hipoteza hipoteza 3 sa iste liste. Zatim, u probabilističkom modelu menadžerske, ekonomske ili proizvodne situacije, pretpostavlja se da rezultati promatranja čine uzorak iz normalne distribucije N(m, σ) za neke vrijednosti m i σ. Hipoteze se pišu ovako:

H 0: m= 0, σ = 1

(oba parametra imaju fiksne vrijednosti);

H 1: m≠ 0 i/ili σ ≠ 1

(tj. bilo m≠ 0, ili σ ≠ 1, ili oboje m≠ 0 i σ ≠ 1).

Primjer 13 Neka bude H 0 je hipoteza 1 sa gornje liste, i H 1 - hipoteza 3 sa iste liste. Tada je probabilistički model isti kao u primjeru 12,

H 0: m= 0, σ je proizvoljan;

H 1: m≠ 0, σ je proizvoljan.

Primjer 14 Neka bude H 0 je hipoteza 2 sa gornje liste, a prema H 1 rezultati opservacije imaju funkciju distribucije F(x), ne odgovara standardnoj funkciji normalne distribucije F(x). Onda

H 0: F(x) = F(x) za sve X(napisano kao F(x) ≡ F(x));

H 1: F(x 0) ≠ F (x 0) kod nekih x 0(tj. nije tačno da F(x) ≡ F(x)).

Bilješka. Ovdje ≡ je znak identične podudarnosti funkcija (tj. podudarnosti za sve moguće vrijednosti argumenta X).

Primjer 15 Neka bude H 0 je hipoteza 3 sa gornje liste, a prema H 1 rezultati opservacije imaju funkciju distribucije F(x), ne biti normalan. Onda

Za neke m, σ;

H 1: za bilo koje m, σ postoji x 0 = x 0(m, σ) takav da .

Primjer 16 Neka bude H 0 - hipoteza 4 sa gornje liste, prema probabilističkom modelu, dva uzorka su izvučena iz populacija sa funkcijama distribucije F(x) i G(x), koji su normalni sa parametrima m 1 , σ 1 i m 2 , σ 2 respektivno, i H 1 - negacija H 0 . Onda

H 0: m 1 = m 2 , σ 1 = σ 2 , i m 1 i σ 1 su proizvoljni;

H 1: m 1 ≠ m 2 i/ili σ 1 ≠ σ 2 .

Primjer 17. Neka je pod uslovima iz primjera 16 dodatno poznato da je σ 1 = σ 2 . Onda

H 0: m 1 = m 2 , σ > 0, i m 1 i σ su proizvoljni;

H 1: m 1 ≠ m 2 , σ > 0.

Primjer 18. Neka bude H 0 - hipoteza 5 sa gornje liste, prema probabilističkom modelu, dva uzorka su izvučena iz populacija sa funkcijama distribucije F(x) i G(x) odnosno, i H 1 - negacija H 0 . Onda

H 0: F(x) G(x) , gdje F(x)

H 1: F(x) i G(x) su proizvoljne funkcije raspodjele, i

F(x) G(x) sa nekima X.

Primjer 19. Neka se u uslovima primjera 17 dodatno pretpostavlja da distribucijske funkcije F(x) i G(x) razlikuju se samo u pomaku, tj. G(x) = F(x- a) kod nekih a. Onda

H 0: F(x) G(x) ,

gdje F(x) je proizvoljna funkcija distribucije;

H 1: G(x) = F(x- a), a ≠ 0,

gdje F(x) je proizvoljna funkcija distribucije.

Primjer 20. Neka se u uslovima Primera 14 dodatno zna da je prema verovatnosnom modelu situacije F(x) je normalna funkcija raspodjele s jediničnom varijansom, tj. ima oblik N(m, jedan). Onda

H 0: m = 0 (oni. F(x) = F(x)

za sve X); (napisano kao F(x) ≡ F(x));

H 1: m 0

(tj. nije tačno da F(x) ≡ F(x)).

Primjer 21. U statističkoj regulaciji tehnoloških, ekonomskih, menadžerskih ili drugih procesa, razmotrite uzorak izvučen iz populacije s normalnom distribucijom i poznatom varijansom i hipotezama

H 0: m = m 0 ,

H 1: m= m 1 ,

gdje je vrijednost parametra m = m 0 odgovara utvrđenom toku procesa, a prelazak na m= m 1 ukazuje na kvar.

Primjer 22. Sa statističkom kontrolom prihvatljivosti, broj neispravnih jedinica proizvoda u uzorku podliježe hipergeometrijskoj raspodjeli, nepoznati parametar je str = D/ N je nivo defekta, gdje N- zapreminu serije proizvoda, D- ukupan broj neispravnih jedinica u seriji. Koristeći se u regulatornoj, tehničkoj i komercijalnoj dokumentaciji (standardi, ugovori o nabavci, itd.), planovi kontrole često imaju za cilj testiranje hipoteze

H 0: str < AQL

H 1: str > LQ,

gdje AQL – nivo prihvatanja kvara, LQ je nivo neispravnosti defekata (očigledno, AQL < LQ).

Primjer 23. Kao pokazatelji stabilnosti tehnološkog, ekonomskog, menadžerskog ili drugog procesa koriste se brojne karakteristike distribucija kontrolisanih indikatora, a posebno koeficijent varijacije v = σ/ M(X). Treba testirati nultu hipotezu

H 0: v < v 0

pod alternativnom hipotezom

H 1: v > v 0 ,

gdje v 0 je neka unaprijed određena granična vrijednost.

Primjer 24. Neka je probabilistički model dva uzorka isti kao u primjeru 18, označimo matematička očekivanja rezultata posmatranja u prvom i drugom uzorku M(X) i M(At) respektivno. U nekim situacijama se testira nulta hipoteza

H 0: M(X) = M(Y)

protiv alternativne hipoteze

H 1: M(X) ≠ M(Y).

Primjer 25. Gore je navedeno veliki značaj u matematičkoj statistici funkcija distribucije simetrične u odnosu na 0, prilikom provjere simetrije

H 0: F(- x) = 1 – F(x) za sve x, inače F proizvoljan;

H 1: F(- x 0 ) ≠ 1 – F(x 0 ) kod nekih x 0 , inače F proizvoljno.

U probabilističko-statističkim metodama odlučivanja koriste se i mnoge druge formulacije problema za testiranje statističkih hipoteza. Neki od njih su razmatrani u nastavku.

Specifični zadatak testiranja statističke hipoteze je u potpunosti opisan ako se daju nulta i alternativna hipoteza. Izbor metode za testiranje statističke hipoteze, svojstva i karakteristike metoda određuju se i nultom i alternativnom hipotezom. Za testiranje iste nulte hipoteze pod različitim alternativnim hipotezama, općenito govoreći, treba koristiti različite metode. Dakle, u primjerima 14 i 20 nulta hipoteza je ista, dok su alternativne različite. Stoga u uslovima primera 14 treba koristiti metode zasnovane na kriterijumima uklapanja sa parametarskom familijom (tip Kolmogorov ili tip omega kvadrata), a u uslovima primera 20 metode zasnovane na Studentovom testu ili Cramer-Welch testu. Ako se u uslovima iz primjera 14 koristi Studentov kriterij, onda on neće riješiti postavljene zadatke. Ako, u uslovima primjera 20, koristimo test ispravnosti tipa Kolmogorov, onda će, naprotiv, riješiti postavljene zadatke, iako, možda, lošije od Studentovog kriterija posebno prilagođenog za ovaj slučaj.

Prilikom obrade stvarnih podataka od velike je važnosti ispravan izbor hipoteza. H 0 i H jedan . Pretpostavke, kao što je normalnost distribucije, moraju biti pažljivo opravdane, posebno statističkim metodama. Imajte na umu da se u velikoj većini specifičnih primijenjenih postavki distribucija rezultata posmatranja razlikuje od normalne.

Često se javlja situacija kada oblik nulte hipoteze proizilazi iz formulacije primijenjenog problema, ali oblik alternativne hipoteze nije jasan. U takvim slučajevima treba razmotriti alternativnu hipotezu najopštijeg oblika i koristiti metode koje rješavaju problem za sve moguće H jedan . Konkretno, kada se hipoteza 2 (sa gornje liste) testira kao null, treba koristiti kao alternativnu hipotezu H 1 iz primjera 14, a ne iz primjera 20, ako ne postoje posebna opravdanja za normalnost distribucije rezultata opservacija pod alternativnom hipotezom.

Prethodno

U različitim fazama statističkog istraživanja i modeliranja, potrebno je formulisati i eksperimentalno provjeriti određene pretpostavke (hipoteze) o prirodi i veličini nepoznatih parametara analizirane opće populacije (skupova). Na primjer, istraživač postavlja pretpostavku: "uzorak je izvučen iz normalne populacije" ili "opći prosjek analizirane populacije je jednak pet". Takve pretpostavke se nazivaju statističke hipoteze.

Poređenje navedene hipoteze o opštoj populaciji sa dostupnim podacima uzorka, praćeno kvantitativnom procenom stepena pouzdanosti dobijenog zaključka, vrši se pomoću jednog ili drugog statističkog kriterijuma i naziva se testiranje statističkih hipoteza .

Predložena hipoteza se zove nula (osnovni) . Obično se pominje H 0.

U odnosu na izraženu (glavnu) hipotezu uvijek se može formulisati alternativa (takmičenje) to je u suprotnosti. Obično se označava alternativna (konkurentska) hipoteza H 1.

Svrha provjere statističkih hipoteza je odlučivanje o valjanosti glavne hipoteze na osnovu podataka uzorka H 0.

Ako se postavljena hipoteza svede na tvrdnju da je vrijednost nekog nepoznatog parametra opće populacije je tačno jednako date vrijednosti, onda se ova hipoteza naziva jednostavno, na primjer: "prosječni ukupan prihod stanovništva Rusije po glavi stanovnika je 650 rubalja mjesečno"; "stopa nezaposlenosti (udio nezaposlenih u ekonomski aktivnom stanovništvu) u Rusiji je 9%" . U drugim slučajevima hipoteza se naziva kompleks.

Kao nulta hipoteza H 0 uobičajeno je postaviti jednostavnu hipotezu, jer obično je zgodnije provjeriti rigorozniju tvrdnju.

Hipoteze o obliku zakona distribucije ispitivane slučajne varijable;

Hipoteze o numeričkim vrijednostima parametara proučavane opće populacije;

Hipoteze o homogenosti dva ili više uzoraka ili neke karakteristike analiziranih populacija;

Hipoteze o opšti pogled model koji opisuje statistički odnos između karakteristika, itd.

Budući da se testiranje statističkih hipoteza vrši na osnovu podataka uzorka, tj. ograničen skup zapažanja, odluka u vezi sa nultom hipotezom H 0 su vjerovatnoća. Drugim riječima, takvu odluku neminovno prati neka, iako možda vrlo mala, vjerovatnoća pogrešnog zaključka u oba smjera.



Dakle, u malom dijelu slučajeva α Nulta hipoteza H 0 može biti odbačeno, dok je u stvarnosti pravedno u opštoj populaciji. Takva greška se zove otkucajte jednu grešku . I njegova vjerovatnoća se zove nivo značajnosti i odrediti α .

Suprotno tome, u malom dijelu slučajeva β Nulta hipoteza H 0 je prihvaćena, dok je zapravo u opštoj populaciji pogrešna, a alternativna hipoteza je tačna H 1. Takva greška se zove greška tipa II . Obično se označava vjerovatnoća greške druge vrste β . Vjerovatnoća 1-β pozvao moć kriterijuma .

Sa fiksnom veličinom uzorka, možete odabrati po svom nahođenju vrijednost vjerovatnoće samo jedne od grešaka α ili β . Povećanje vjerovatnoće jednog od njih dovodi do smanjenja drugog. Uobičajeno je postaviti vjerovatnoću greške prve vrste α - nivo značajnosti. U pravilu se koriste neke standardne vrijednosti nivoa značajnosti. α : 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Zatim, očigledno, iz dva kriterijuma koje karakteriše ista verovatnoća α odbaciti istinitu hipotezu H 0, treba prihvatiti onu koja je praćena manjom greškom druge vrste β , tj. više snage. Smanjenje vjerovatnoće obe greške α i β može se postići povećanjem veličine uzorka.

Ispravna odluka u vezi sa nultom hipotezom H 0 može biti i od dvije vrste:

Nul hipoteza će biti prihvaćena. H 0, dok je zapravo nulta hipoteza tačna u općoj populaciji H 0; vjerovatnoća takve odluke 1 - α;

Nulta hipoteza H 0će biti odbijen u korist alternative H 1, dok je zapravo u općoj populaciji nulta hipoteza H 0 odbijen u korist alternative H 1; vjerovatnoća takve odluke 1 - β - snaga kriterija.

Rezultati odluke nulte hipoteze mogu se ilustrirati korištenjem Tabele 8.1.

Tabela 8.1

Statističke hipoteze se provjeravaju korištenjem statistički kriterijum(nazovimo to općenito To), što je funkcija rezultata posmatranja.

Statistički kriterijum je pravilo (formula) kojim se utvrđuje stepen neslaganja između rezultata posmatranja uzorka i navedene hipoteze H 0.

Statistički kriterij, kao i svaka funkcija rezultata promatranja, je slučajna varijabla i, uz pretpostavku valjanosti nulte hipoteze H 0 podliježe nekom dobro proučenom (i tabeliranom) teorijskom zakonu raspodjele sa gustinom raspodjele f(k).

Izbor kriterijuma za testiranje statističkih hipoteza može se izvršiti na osnovu različitih principa. Najčešće se koristi za ovo princip omjera vjerovatnoće, što vam omogućava da izgradite najmoćniji kriterij među svim mogućim kriterijima. Njegova suština se svodi na izbor takvog kriterija To sa poznatom funkcijom gustoće f(k) podložno validnosti hipoteze H 0 , tako da na datom nivou značajnosti α mogla bi se naći kritična tačka K cr.distribucija f(k), čime bi se raspon vrijednosti kriterija podijelio na dva dijela: raspon prihvatljivih vrijednosti, u kojem rezultati promatranja uzorka izgledaju najvjerovatnije, i kritično područje u kojem izgledaju rezultati promatranja uzorka manje uvjerljivo u odnosu na nultu hipotezu H 0.

Ako je takav kriterijum To je izabran, a gustina njegove distribucije je poznata, onda se zadatak testiranja statističke hipoteze svodi na osiguranje da, na datom nivou značajnosti, α izračunati uočenu vrijednost kriterija iz podataka uzorka Za obl. i utvrditi da li je više ili manje uvjerljivo u odnosu na nultu hipotezu H 0.

Testiranje svake vrste statističkih hipoteza vrši se korištenjem odgovarajućeg kriterija, koji je najmoćniji u svakom konkretnom slučaju. Na primjer, testiranje hipoteze o obliku zakona distribucije slučajne varijable može se provesti korištenjem Pearsonovog testa dobrobiti χ 2; provjera hipoteze o jednakosti nepoznatih vrijednosti varijansi dvije opće populacije - korištenjem kriterija F- Fisher; niz hipoteza o nepoznatim vrijednostima parametara općih populacija testirano je korištenjem kriterija Z- normalno distribuirana slučajna varijabla i kriterij T- Student itd.

Poziva se vrijednost kriterija izračunata prema posebnim pravilima na osnovu podataka uzorka posmatrana vrednost kriterijuma (Za obl.).

Vrijednosti kriterija dijele skup vrijednosti kriterija sa raspon tolerancije(najvjerovatnije u odnosu na nultu hipotezu H 0) i kritično područje(opseg vrijednosti manje vjerojatan u odnosu na tabele distribucije slučajne varijable To izabrani kao kriterijum se zovu kritične tačke (K cr.).

Područje prihvatljivih vrijednosti (područje prihvatanja nulte hipoteze H 0) To H 0 nije odbijena.

Kritično područje nazvati skup vrijednosti kriterija To , pod kojim je nulta hipoteza H 0 odstupio u korist rivala H 1 .

Razlikovati jednostrano(desna ili lijeva ruka) i bilateralne kritične regije.

Ako je konkurentska hipoteza desnoruka, na primjer, H 1: a > a 0, tada je kritična regija desno(Slika 1). Pod konkurentskom hipotezom desne ruke, kritična tačka (Kr. desno) uzima pozitivne vrijednosti.

Ako je konkurentska hipoteza lijevoruka, na primjer, H 1: a< а 0 , tada je kritična regija lijevo(Slika 2). Pod levostranom konkurentskom hipotezom uzima se kritična tačka negativne vrijednosti (Kr. lijevo).

Ako je konkurentska hipoteza dvostrana, npr. H 1: a¹ a 0, tada je kritična regija bilateralni(Slika 3). Sa dvostranom konkurentskom hipotezom definiraju se dvije kritične tačke (K kr. lijevostrano i To cr. desna ruka).


Dozvoljena površina Kritično

raspon vrijednosti

Formulisanje hipoteza sistematizuje pretpostavke istraživača i iznosi ih na jasan, sažet način. Odluka koju istraživač treba da donese odnosi se na istinitost ili netačnost statističke hipoteze. Postoje dvije vrste hipoteza: naučne i statističke. Scientific Hipoteza je predloženo rješenje problema (izloženo kao teorema). Statistički hipoteza je jednostavno izjava o nepoznatom parametru opće populacije (svojstvu slučajne varijable ili događaja), koji je formuliran da testira pouzdanost veze i koji se može provjeriti u odnosu na poznatu statistiku uzorka (rezultati istraživanja, dostupni empirijski podaci ).

Statističke hipoteze se dijele na nulte i alternativne, usmjerene i neusmjerene. Nul hipoteza (H 0) ovo je hipoteza o odsustvu razlika, odsustvu uticaja faktora, odsustvu efekta itd.. To je ono što bi trebalo opovrgnuti ako se suočimo sa zadatkom da dokažemo značaj razlika. Alternativna hipoteza (H 1) to je hipoteza o značaju razlika. To je ono što bi trebalo da se dokaže, zbog čega se ponekad naziva eksperimentalnom ili radnom hipotezom.

sama postupak obrade dobijenih kvantitativnih podataka, koji se sastoji od izračunavanja nekih statističkih karakteristika i procjena koje omogućavaju testiranje nulte hipoteze, naziva se statistička analiza.

Nulte i alternativne hipoteze mogu biti usmjerene ili neusmjerene. Hipoteza se zove usmjereno ako sadrži naznaku smjera razlika. Takve hipoteze treba formulirati, na primjer, u slučaju da su u jednoj od grupa pojedinačne vrijednosti ispitanika za bilo koju karakteristiku veće, a u drugoj niže, ili je potrebno dokazati da je u jednoj od grupa pod uticajem bilo kakvih eksperimentalnih uticaja izraženije promene nego u drugoj grupi. Hipoteza se zove neusmjerena, ako njegova formulacija pretpostavlja samo definiciju razlika ili nerazličitosti (bez navođenja smjera razlika). Na primjer, ako je potrebno dokazati, u dvije različite grupe razlikuju se oblici distribucije neke osobine.

Primjeri formuliranja hipoteza.

Metoda koja se koristi za odlučivanje o validnosti statističke hipoteze naziva se testiranje hipoteza. Osnovni princip testiranja hipoteze je da se postavlja nulta hipoteza. H 0, kako bi ga pokušali opovrgnuti i time potvrditi alternativnu hipotezu H 1 .

Prilikom testiranja bilo koje statističke hipoteze, odluka istraživača se nikada ne donosi sa sigurnošću, jer uvijek postoji rizik od donošenja pogrešne odluke.

Obično su korišteni uzorci mali i u tim slučajevima vjerovatnoća greške može biti značajna. Postoji tzv nivo povjerenja (nivo značajnosti) razlike. Ovo je vjerovatnoća da se razlike smatraju značajnim, ali su zapravo slučajne. Odnosno, to je vjerovatnoća odbacivanja nulte hipoteze dok je tačna.

Kada se navodi da su razlike značajne na nivou značajnosti od 5%, ili na p£0,05, ono što se misli je da je verovatnoća da ipak nisu značajne 0,05 ( najniži nivo statistički značaj). Ako se navodi da je razlika značajna na nivou značajnosti od 1% ili na p£0,01, onda to znači da je vjerovatnoća da ipak nije značajna 0,01 (dovoljan nivo statističke značajnosti). Ako se navede da su razlike značajne na nivou značajnosti od 0,1% ili na p£0,001, onda to znači da je vjerovatnoća da i dalje nisu značajne 0,001 ( najviši nivo statistički značaj).

Pravilo odbijanja H 0 i prihvatanja H 1:

Ako je empirijska vrijednost kriterija jednaka ili veća od kritične vrijednosti koja odgovara p £ 0,05, tada H 0 odbijeno, ali još nije definitivno prihvaćeno H 1.

Ako je empirijska vrijednost kriterija jednaka ili veća od kritične vrijednosti koja odgovara p £ 0,01, tada H 0 odbijeno prihvaćeno H 1.

Da biste vizualizirali pravilo odlučivanja, možete koristiti takozvanu "os značaja".

Ako nivo povjerenja nije prekoračen, onda se može smatrati vjerojatnim da otkrivena razlika zaista odražava stanje u populaciji. Za sve statistička metoda ovaj nivo se može naći u tabelama distribucije kritičnih vrijednosti odgovarajućih kriterija.

T - Studentov kriterijum

To je parametarska metoda koja se koristi za testiranje hipoteza o valjanosti razlike u srednjim vrijednostima pri analizi kvantitativnih podataka u populacijama s normalnom distribucijom i istom varijansom. Dobro je primjenjiv u slučaju poređenja vrijednosti prosjeka slučajne vrijednosti izmjerena osobina u kontrolnoj i eksperimentalnoj grupi, u različitim polnim i starosnim grupama, grupama sa drugim različitim karakteristikama.

Preduslov za primenljivost parametarskih metoda, uključujući Studentov t-test, za dokazivanje statističkih hipoteza je podređenost empirijska distribucija karakteristike koja se proučava na zakon normalne distribucije.

Studentova metoda je drugačija za nezavisne i zavisne uzorke.

Nezavisna uzorci se dobijaju proučavanjem dve različite grupe ispitanika (na primer, kontrolne i eksperimentalne grupe). To zavisan uzorci uključuju, na primjer, rezultate iste grupe ispitanika prije i poslije izlaganja nezavisnoj varijabli.

Testirana hipoteza H 0 je da je razlika između srednjih vrijednosti dva uzorka jednaka nuli ( = 0), drugim riječima, ovo je hipoteza o jednakosti srednjih vrijednosti (). Alternativna hipoteza H 1 je da je ta razlika različita od nule (№ 0) ili da postoji razlika u srednjim vrijednostima uzorka ().

Kada nezavisni uzorci za analizu razlike u srednjim vrijednostima koristi se formula: za n 1 , n 2 > 30

i formula za n 1 , n 2< 30, где

Aritmetička sredina prvog uzorka;

Prosječna aritmetička vrijednost drugi uzorak;

s 1 -standardna devijacija za prvi uzorak;

s 2 - standardna devijacija za drugi uzorak;

n 1 i n 2 su broj elemenata u prvom i drugom uzorku.

Da bismo pronašli kritičnu vrijednost t, određujemo broj stupnjeva slobode:

n \u003d n 1 - 1 + n 2 - 1 = (n 1 + n 2) - 2 = n - 2.

Ako |t emp | > t cr, tada odbacujemo nultu hipotezu i prihvatamo alternativnu, odnosno smatramo da je razlika u prosecima pouzdana. Ako |t emp |< t кр, то разница средних недостоверна.

Kada zavisni uzorci za utvrđivanje pouzdanosti razlike u sredstvima se koristi sledeća formula: , gdje

d– razlika između rezultata u svakom paru (h i – y i);

å d je zbir ovih parcijalnih razlika;

å d2 je zbir kvadrata parcijalnih razlika;

n je broj parova podataka.

Broj stupnjeva slobode u slučaju zavisnih uzoraka za određivanje t kriterija bit će jednak n = n - 1.

Postoje i drugi statistički kriterijumi za testiranje hipoteza, parametarski i neparametarski. Na primjer, matematičko-statistički kriterij koji omogućava prosuđivanje sličnosti i razlika u disperzijama slučajnih varijabli naziva se Fisherov kriterij.

Korelaciona analiza

U svom najopštijem obliku, značenje "korelacije" odnosi se na međusobni odnos. Iako se, kada smo već kod korelacije, koriste i termini „korelacija“ i „korelacija zavisnost“, koji se često koriste kao sinonimi.

Ispod korelacija razumiju koordinirane promjene dvije ili više karakteristika, tj. varijabilnost jedne osobine je u nekoj korespondenciji sa varijabilnošću druge.

Korelaciona zavisnost su promjene koje vrijednosti jedne karakteristike unose u vjerovatnoću pojave različite vrijednosti drugi znak.

Dakle, koordinirane promjene osobina i korelacija između njih koja to odražava mogu ukazivati ​​ne na ovisnost ovih osobina među sobom, već na ovisnost obje ove osobine o nekoj trećoj osobini ili kombinaciji osobina koje nisu razmatrane u studiji.

Na osnovu prikupljenog statističke studije podataka nakon njihove obrade izvode se zaključci o proučavanim pojavama. Ovi zaključci se donose iznošenjem i testiranjem statističkih hipoteza.

Statistička hipoteza naziva se svaka izjava o obliku ili svojstvima distribucije slučajnih varijabli uočene u eksperimentu. Statističke hipoteze se provjeravaju statističkim metodama.

Hipoteza koja se testira se zove glavni (nula) i označeno H 0 . Osim nule, postoji i alternativna (konkurentska) hipoteza H 1, negirajući glavnu . Dakle, kao rezultat testa, jedna i samo jedna od hipoteza će biti prihvaćena , a drugi će biti odbijen.

Vrste grešaka. Predložena hipoteza se testira na osnovu studije uzorka dobijenog iz opšte populacije. Zbog slučajnosti uzorka, test ne donosi uvijek tačan zaključak. U ovom slučaju mogu se pojaviti sljedeće situacije:
1. Glavna hipoteza je tačna i prihvaćena je.
2. Glavna hipoteza je tačna, ali se odbacuje.
3. Glavna hipoteza nije tačna i odbacuje se.
4. Glavna hipoteza nije tačna, ali je prihvaćena.
U slučaju 2 se govori o greška prve vrste, u potonjem slučaju jeste greška druge vrste.
Dakle, za jedan uzorak je prihvaćeno ispravno rješenje, dok drugi nisu u pravu. Odluka se donosi prema vrijednosti neke funkcije uzorkovanja, tzv statistička karakteristika, statistički kriterijum ili jednostavno statistika. Skup vrijednosti ove statistike može se podijeliti u dva podskupa koja se ne preklapaju:

  • H 0 je prihvaćen (ne odbijen), pozvan područje prihvatanja hipoteze (dozvoljeno područje);
  • podskup statističkih vrijednosti za koje je hipoteza H 0 se odbacuje (odbacuje) i hipoteza je prihvaćena H 1 se zove kritično područje.

Nalazi:

  1. kriterijum pozvao slučajna vrijednost K, što vam omogućava da prihvatite ili odbacite nultu hipotezu H0.
  2. Prilikom testiranja hipoteza mogu se napraviti greške 2 vrste.
    Greška tipa I je odbaciti hipotezu H 0 ako je istina ("preskoči cilj"). Vjerovatnoća pravljenja greške tipa I označava se sa α i naziva se nivo značajnosti. Najčešće se u praksi pretpostavlja da je α = 0,05 ili α = 0,01.
    Greška tipa II je da je hipoteza H0 prihvaćena ako je netačna ("lažno pozitivna"). Vjerovatnoća ove vrste greške je označena sa β.

Klasifikacija hipoteza

Glavna hipoteza H 0 o vrijednosti nepoznatog parametra q distribucije obično izgleda ovako:
H 0: q \u003d q 0.
Konkurentna hipoteza H 1 može izgledati ovako:
H 1: q < q 0 , H 1:q> q 0 ili H 1: qq 0 .
Shodno tome, ispada lijeva strana, desna strana ili bilateralni kritična područja. Granične tačke kritičnih regiona ( kritične tačke) utvrđuje se iz tabela distribucije relevantnih statistika.

Kada se testira hipoteza, razumno je smanjiti vjerovatnoću donošenja pogrešnih odluka. Dozvoljena vjerovatnoća greške tipa I obično označavaju a i pozvao nivo značajnosti. Njegova vrijednost je obično mala ( 0,1, 0,05, 0,01, 0,001 ...). Ali smanjenje vjerovatnoće greške tipa 1 dovodi do povećanja vjerovatnoće greške tipa 2 ( b), tj. želja da se prihvate samo istinite hipoteze uzrokuje povećanje broja odbačenih tačnih hipoteza. Stoga je izbor nivoa značaja određen značajem postavljenog problema i težinom posledica pogrešne odluke.
Testiranje statističke hipoteze sastoji se od sljedećih koraka:
1) definicija hipoteza H 0 i H 1 ;
2) izbor statistike i dodeljivanje nivoa značaja;
3) definisanje kritičnih tačaka K cr i kritično područje;
4) izračunavanje vrednosti statistike iz uzorka K ex;
5) poređenje statističke vrijednosti sa kritičnim područjem ( K cr i K ex);
6) odlučivanje: ako vrijednost statistike nije uključena u kritičnu regiju, hipoteza se prihvata H 0 i odbaciti hipotezu H 1, a ako uđe u kritično područje, hipoteza se odbacuje H 0 i hipoteza je prihvaćena H jedan . Istovremeno, rezultate testiranja statističke hipoteze treba tumačiti na sljedeći način: ako se hipoteza prihvati H 1 , onda to možemo smatrati dokazanim i ako prihvatimo hipotezu H 0 , tada je priznato da to nije u suprotnosti sa rezultatima opservacija.Međutim, ovo svojstvo, zajedno sa H 0 može imati druge hipoteze.

Klasifikacija testova hipoteza

Razmotrimo dalje nekoliko različitih statističkih hipoteza i mehanizama za njihovo testiranje.
ja) Hipoteza opšte sredine normalne distribucije sa nepoznatom varijansom. Pretpostavljamo da opća populacija ima normalnu distribuciju, njena srednja vrijednost i varijansa su nepoznati, ali postoji razlog za vjerovanje da je opći prosjek jednak a . Na nivou značajnosti α, potrebno je testirati hipotezu H 0: x=a. Kao alternativa, može se koristiti jedna od tri hipoteze o kojima smo gore govorili. U ovom slučaju, statistika je slučajna varijabla , koja ima Studentovu distribuciju sa n– 1 stepen slobode. Određuje se odgovarajuća eksperimentalna (opažena) vrijednost t ex t cr H 1: x >a nalazi se nivoom značajnosti α i brojem stepeni slobode n– 1. Ako t ex < t cr H 1: x ≠a kritična vrijednost se nalazi iz nivoa značajnosti α / 2 i istog broja stupnjeva slobode. Nul hipoteza je prihvaćena ako | t ex | II) Hipoteza o jednakosti dvaju srednjih vrednosti proizvoljno raspoređenih generalnih populacija (veliki nezavisni uzorci). Na nivou značajnosti α, potrebno je testirati hipotezu H 0:x≠y. Ako je volumen oba uzorka velik, onda možemo pretpostaviti da srednje vrijednosti uzorka imaju normalnu distribuciju, a njihove varijanse su poznate. U ovom slučaju, slučajna varijabla se može koristiti kao statistika
,
imaju normalnu distribuciju, i M(Z) = 0, D(Z) = 1. Određuje se odgovarajuća eksperimentalna vrijednost z ex. Iz tabele Laplaceove funkcije nalazi se kritična vrijednost z cr. Pod alternativnom hipotezom H 1: x >y nalazi se iz uslova F(z cr) = 0,5 – a. Ako a z ex< z кр , tada se nulta hipoteza prihvata, u suprotnom se odbacuje. Pod alternativnom hipotezom H 1: x ≠ y kritična vrijednost se nalazi iz uslova F(z cr) = 0,5×(1 – a). Nul hipoteza je prihvaćena ako | z ex |< z кр .

III) Hipoteza o jednakosti dvaju srednjih normalno raspoređenih opštih populacija čije su varijanse nepoznate i iste (mali nezavisni uzorci). Na nivou značajnosti α, potrebno je testirati glavnu hipotezu H 0: x=y . Kao statistiku koristimo slučajnu varijablu
,
koji ima Studentovu distribuciju sa ( n x + n– 2) stepeni slobode. Određuje se odgovarajuća eksperimentalna vrijednost t ex. Iz tabele kritičnih tačaka Studentove distribucije nalazi se kritična vrednost t cr. Sve se rješava slično kao hipoteza (I).

IV) Hipoteza o jednakosti dvije varijanse normalno raspoređenih populacija. U ovom slučaju, na nivou značaja a treba testirati hipotezu H 0: D(X) = D(Y). Statistika je slučajna varijabla, koja ima Fisher-Snedecor distribuciju sa f 1 = n b– 1 i f 2 = n m- 1 stepen slobode (S 2 b - velika varijansa, zapremina njegovog uzorka n b). Određuje se odgovarajuća eksperimentalna (opažena) vrijednost F ex. kritična vrijednost F cr pod alternativnom hipotezom H 1: D(X) > D(Y) nalazi se iz tabele kritičnih tačaka Fisher-Snedecorove distribucije po nivou značajnosti a i broj stepeni slobode f 1 i f 2. Nul hipoteza je prihvaćena ako F ex < F cr.

Uputstvo. Za proračun morate navesti dimenziju izvornih podataka.

V) Hipoteza o jednakosti nekoliko varijansi normalno raspoređenih populacija nad uzorcima iste veličine. U ovom slučaju, na nivou značaja a treba testirati hipotezu H 0: D(X 1) = D(X 2) = …= D(Xl). Statistika je slučajna varijabla , koji ima Cochranovu distribuciju sa stupnjevima slobode f = n– 1 i l (n- veličina svakog uzorka, l je broj uzoraka). Ova hipoteza se testira na isti način kao i prethodna. Koristi se tabela kritičnih tačaka Cochranove distribucije.

vi) Hipoteza o značaju korelacije. U ovom slučaju, na nivou značaja a treba testirati hipotezu H 0: r= 0. (Ako je koeficijent korelacije jednak nuli, tada odgovarajuće veličine nisu međusobno povezane). U ovom slučaju, statistika je slučajna varijabla
,
ima Studentsku distribuciju sa f = n– 2 stepena slobode. Provjera ove hipoteze vrši se slično kao i provjera hipoteze (I).

Uputstvo. Odredite količinu izvornih podataka.

VII) Hipoteza o vrijednosti vjerovatnoće nastanka događaja. Potrošeno dovoljno veliki broj n nezavisna ispitivanja u kojima je događaj ALI dogodilo m jednom. Postoji razlog za vjerovanje da je vjerovatnoća da se ovaj događaj dogodi u jednom ispitivanju jednaka p 0. Obavezno na nivou značaja a testirati hipotezu da je vjerovatnoća nekog događaja ALI jednaka hipotetičkoj vjerovatnoći p 0. (Budući da je vjerovatnoća procijenjena relativnom učestalošću, testirana hipoteza se može formulisati drugačije: posmatrana relativna učestalost i hipotetička vjerovatnoća se značajno razlikuju ili ne).
Broj suđenja je prilično velik, pa je i relativna učestalost događaja ALI distribuiraju prema uobičajenom zakonu. Ako je nulta hipoteza tačna, tada je njena očekivana vrijednost p 0, i varijansu . U skladu s tim, kao statistiku, biramo slučajnu varijablu
,
koji je raspoređen približno prema normalnom zakonu sa nultim matematičkim očekivanjem i jediničnom varijansom. Ova hipoteza se testira na potpuno isti način kao u slučaju (I).

Uputstvo. Za izračun morate popuniti početne podatke.

Dijeli