Vrijednost t if. Automatsko izračunavanje Studentovog t-testa

Studentov t-test je opšti naziv za klasu metoda za statističko testiranje hipoteza (statistički testovi) zasnovane na Studentovoj distribuciji. Najčešći slučajevi primjene t-testa odnose se na provjeru jednakosti srednjih vrijednosti u dva uzorka.

1. Istorija razvoja t-testa

Ovaj kriterijum je razvijen William Gosset za procjenu kvaliteta piva u Guinnessu. U vezi sa obavezama prema kompaniji da ne odaje poslovne tajne, Gossetov članak je objavljen 1908. godine u časopisu Biometrija pod pseudonimom „Student“ (Student).

2. Za šta se koristi Studentov t-test?

Studentov t-test se koristi za određivanje statističke značajnosti srednjih razlika. Može se koristiti i u slučajevima poređenja nezavisnih uzoraka ( na primjer, grupe pacijenata sa dijabetes melitusom i grupe zdravih), i kada se porede povezani skupovi ( npr. srednji broj otkucaja srca kod istih pacijenata prije i nakon uzimanja antiaritmičkog lijeka).

3. Kada se može koristiti Studentov t-test?

Za primenu Studentovog t-testa potrebno je da originalni podaci imaju normalna distribucija. U slučaju primjene ispitivanja sa dva uzorka za nezavisne uzorke, potrebno je zadovoljiti i uvjet jednakost (homoskedastičnost) varijansi.

Ako ovi uvjeti nisu ispunjeni, prilikom upoređivanja srednjih vrijednosti uzorka treba koristiti slične metode. neparametarske statistike, među kojima su najpoznatiji Mann-Whitney U-test(kao test sa dva uzorka za nezavisne uzorke), i kriterijum znaka i Wilcoxon test(koristi se u slučajevima zavisnih uzoraka).

4. Kako izračunati Studentov t-test?

Da bi se uporedile srednje vrednosti, Studentov t-test se izračunava pomoću sledeća formula:

gdje M 1- aritmetička sredina prve upoređene populacije (grupe), M 2- aritmetička sredina druge upoređene populacije (grupe), m 1 - srednja greška prva aritmetička sredina, m2- prosječna greška druge aritmetičke sredine.

5. Kako interpretirati vrijednost Studentovog t-testa?

Rezultirajuća vrijednost Studentovog t-testa mora biti ispravno interpretirana. Da bismo to učinili, moramo znati broj ispitanika u svakoj grupi (n 1 i n 2). Određivanje broja stepeni slobode f prema sljedećoj formuli:

f \u003d (n 1 + n 2) - 2

Nakon toga određujemo kritičnu vrijednost Studentovog t-testa za traženi nivo značajnosti (na primjer, p=0,05) i pri dati broj stepena slobode f prema tabeli ( vidi ispod).

Uspoređujemo kritične i izračunate vrijednosti kriterija:

  • Ako je izračunata vrijednost Studentovog t-testa jednaka ili veća kritične, pronađene u tabeli, zaključujemo da su razlike između upoređenih vrednosti statistički značajne.
  • Ako je vrijednost izračunatog Studentovog t-testa manje tabelarni, što znači da razlike između uspoređenih vrijednosti nisu statistički značajne.

6. Primjer izračunavanja Studentovog t-testa

Za proučavanje efikasnosti novog preparata gvožđa odabrane su dve grupe pacijenata sa anemijom. U prvoj grupi pacijenti su dvije sedmice primali novi lijek, au drugoj su primali placebo. Nakon toga mjeren je nivo hemoglobina u perifernoj krvi. U prvoj grupi prosječan nivo hemoglobin je iznosio 115,4±1,2 g/l, au drugom 103,7±2,3 g/l (podaci su prikazani u formatu M±m), upoređene populacije imaju normalnu distribuciju. U prvoj grupi je bilo 34, a u drugoj 40 pacijenata. Neophodno je izvesti zaključak o statističkoj značajnosti dobijenih razlika i efikasnosti novog preparata gvožđa.

Rješenje: Za procjenu značajnosti razlika koristimo Studentov t-test, izračunat kao razlika između srednjih vrijednosti podijeljenih sa zbirom grešaka na kvadrat:

Nakon izvršenih proračuna, vrijednost t-testa bila je jednaka 4,51. Broj stepeni slobode nalazimo kao (34 + 40) - 2 = 72. Dobivenu vrijednost Studentovog t-testa 4,51 uporedimo sa kritičnom vrijednošću pri p=0,05 prikazanom u tabeli: 1,993. Budući da je izračunata vrijednost kriterija veća od kritične vrijednosti, zaključujemo da su uočene razlike statistički značajne (nivo značajnosti p<0,05).

Testiranje statističke hipoteze omogućava vam da donesete rigorozan zaključak o karakteristikama opće populacije na osnovu podataka uzorka. Hipoteze su različite. Jedna od njih je hipoteza srednje vrijednosti ( matematičko očekivanje). Njegova suština je da se donese ispravan zaključak o tome gdje opći prosjek može, a gdje ne mora biti zasnovan samo na dostupnom uzorku (tačnu istinu nikada nećemo saznati, ali možemo suziti krug pretraživanja).

Opisan je opšti pristup testiranju hipoteza, tako da direktno pređemo na stvar. Pretpostavimo prvo da je uzorak izvučen iz normalnog skupa slučajnih varijabli X sa opštim prosjekom μ i disperzija σ2(Znam, znam da se to ne dešava, ali ne morate da me prekidate!). Aritmetička sredina ovog uzorka je očigledno i sama slučajna varijabla. Ako izdvojimo mnogo takvih uzoraka i izračunamo prosjek za njih, onda će i oni imati s matematičkim očekivanjem μ i

Onda slučajna vrijednost

Postavlja se pitanje: da li će opšta srednja vrednost sa verovatnoćom od 95% biti unutar ±1,96 s x̅. Drugim riječima, su distribucije slučajnih varijabli

ekvivalentno.

Po prvi put je ovo pitanje pokrenuo (i riješio) hemičar koji je radio u Guinnessovoj fabrici piva u Dablinu (Irska). Hemičar se zvao William Seeley Gosset i uzeo je uzorke piva za hemijsku analizu. U nekom trenutku, očigledno, William je počeo da ima nejasne sumnje u distribuciju prosjeka. Ispostavilo se da je malo više rasprostranjena nego što bi normalna distribucija trebala biti.

Nakon što je prikupio matematičko opravdanje i izračunao vrijednosti funkcije distribucije koju je otkrio, kemičar iz Dublina William Gosset napisao je bilješku koja je objavljena u martu 1908. godine u časopisu Biometrics (glavni urednik - Karl Pearson) . Jer Guinness je strogo zabranio odavanje tajni pivarstva, Gosset se potpisao pod pseudonimom Student.

Uprkos činjenici da je K. Pearson već izmislio distribuciju, ipak je opća ideja normalnosti i dalje dominirala. Niko nije mislio da distribucija procjena uzorka možda nije normalna. Stoga je članak W. Gosseta ostao praktično nezapažen i zaboravljen. I samo je Ronald Fisher cijenio Gossetovo otkriće. Fischer je koristio novu distribuciju u svom radu i dao joj ime Studentova t-distribucija. Kriterijum za testiranje hipoteza, odnosno, postao je Studentov t-test. Tako je došlo do "revolucije" u statistici, koja je zakoračila u eru analize uzoraka podataka. Bila je to kratka digresija u istoriju.

Hajde da vidimo šta je W. Gosset mogao vidjeti. Hajde da generišemo 20 hiljada normalnih uzoraka iz 6 posmatranja sa srednjom ( ) 50 i standardna devijacija ( σ ) 10. Zatim normaliziramo uzorka znači koristeći opšta varijansa:

Grupiramo rezultirajućih 20 hiljada prosjeka u intervale dužine 0,1 i izračunavamo frekvencije. Nacrtajmo stvarnu (Norm) i teorijsku (ENorm) raspodjelu frekvencija srednje vrijednosti uzorka na dijagramu.

Tačke (opažene frekvencije) se skoro poklapaju sa linijom (teorijske frekvencije). To je razumljivo, jer su podaci uzeti iz iste opće populacije, a razlike su samo greške uzorkovanja.

Hajde da napravimo novi eksperiment. Normaliziramo prosjeke koristeći varijansa uzorka.

Hajde da ponovo izbrojimo frekvencije i nacrtamo ih na dijagramu kao tačke, ostavljajući liniju standardne normalne distribucije za poređenje. Označimo empirijsku učestalost prosjeka, recimo, kroz slovo t.

Vidi se da distribucije ovoga puta nisu baš slične. Blizu, da, ali ne isto. Repovi su postali "teški".

Gosset-Student nije imao najnoviju verziju MS Excel-a, ali je upravo to primijetio. Zašto je tako? Objašnjenje je da je slučajna varijabla

ne zavisi samo od greške uzorkovanja (numeratora), već i od standardne greške srednje vrednosti (imenika), koja je takođe slučajna varijabla.

Hajde da shvatimo malo kakvu distribuciju treba da ima takva slučajna varijabla. Prvo, morate zapamtiti (ili naučiti) nešto iz matematičke statistike. Postoji takva Fisherova teorema, koja kaže da u uzorku iz normalne distribucije:

1. srednji i varijansu uzorka s2 su nezavisne veličine;

2. Odnos uzorka i opšte varijanse, pomnožen sa brojem stepeni slobode, ima distribuciju χ 2(hi-kvadrat) sa istim brojem stepeni slobode, tj.

gdje k- broj stepeni slobode (na engleskom stepeni slobode (d.f.))

Mnogi drugi rezultati u statistici normalnih modela zasnovani su na ovom zakonu.

Vratimo se na raspodjelu srednje vrijednosti. Podijelite brojilac i imenilac izraza

na σX̅. Get

Brojač je standardna normalna slučajna varijabla (označavamo ξ (xi)). Imenilac se može izraziti iz Fisherove teoreme.

Tada će originalni izraz poprimiti oblik

Ovo je općenito (studentski omjer). Već je moguće direktno izvesti njegovu funkciju distribucije, jer poznate su distribucije obje slučajne varijable u ovom izrazu. Ostavimo ovo zadovoljstvo matematičarima.

Studentova funkcija t-distribucije ima formulu koju je prilično teško razumjeti, pa je nema smisla analizirati. U svakom slučaju, niko ga ne koristi, jer. vjerovatnoće su date u posebnim tabelama Studentove distribucije (ponekad se zovu tabele Studentovih koeficijenata), ili su ukucane u PC formule.

Dakle, naoružani novim saznanjima, moći ćete razumjeti zvaničnu definiciju Studentove distribucije.
Slučajna varijabla koja se povinuje Studentovoj distribuciji sa k stepeni slobode je omjer nezavisnih slučajnih varijabli

gdje ξ distribuira se prema standardnom normalnom zakonu, i χ 2k predmet distribucije χ 2 c k stepena slobode.

Dakle, formula za Studentov kriterijum za aritmetičku sredinu

je poseban slučaj studentskog odnosa

Iz formule i definicije proizilazi da distribucija Studentovog t-testa zavisi samo od broja stepeni slobode.

At k> 30 t-test se praktično ne razlikuje od standardne normalne distribucije.

Za razliku od hi-kvadrata, t-test može biti jedno- ili dvostrani. Obično se koristi dvostrano, pod pretpostavkom da se odstupanje može dogoditi u oba smjera od srednje vrijednosti. Ali ako uvjet problema dozvoljava odstupanje samo u jednom smjeru, onda je razumno primijeniti jednostrani kriterij. Ovo malo povećava snagu, tk. na fiksnom nivou značajnosti, kritična vrijednost se malo približava nuli.

Uslovi za primjenu Studentovog t-testa

Uprkos činjenici da je Studentovo otkriće svojevremeno napravilo revoluciju u statistici, t-test je još uvijek prilično ograničen u svojoj primjenjivosti, jer sama po sebi dolazi iz pretpostavke o normalna distribucija početni podaci. Ako podaci nisu normalni (što je obično slučaj), tada t-test više neće imati Studentovu distribuciju. Međutim, zbog centralnog granična teorema srednja vrijednost, čak i za abnormalne podatke, brzo dobija zvonastu raspodjelu.

Uzmite u obzir, na primjer, podatke koji imaju izražen nagib udesno, poput hi-kvadrat distribucije sa 5 stupnjeva slobode.

Sada napravimo 20 hiljada uzoraka i promatramo kako se distribucija sredstava mijenja ovisno o njihovoj veličini.

Razlika je prilično uočljiva na malim uzorcima do 15-20 opservacija. Ali onda brzo nestane. Dakle, abnormalnost distribucije, naravno, nije dobra, ali nije kritična.

Najviše od svega, t-kriterijum se „plaši“ od outliera, tj. abnormalna odstupanja. Uzmimo 20 hiljada normalnih uzoraka od 15 opservacija i dodajmo jedan nasumični izuzetak nekima od njih.

Slika je nesrećna. Stvarne frekvencije prosjeka se veoma razlikuju od teorijskih. Korištenje t-distribucije u takvoj situaciji postaje vrlo rizičan poduhvat.

Dakle, u ne baš malim uzorcima (od 15 opservacija), t-test je relativno otporan na nenormalnu distribuciju početnih podataka. Ali odstupanja u podacima snažno iskrivljuju distribuciju t-testa, što, zauzvrat, može dovesti do statističkih grešaka u zaključivanju, tako da anomalna opažanja treba eliminisati. Često se iz uzorka uklanjaju sve vrijednosti koje su izvan ±2 standardne devijacije od srednje vrijednosti.

Primjer testiranja hipoteze matematičkog očekivanja korištenjem Studentovog t-testa u MS Excel-u

Excel ima nekoliko funkcija vezanih za t-distribuciju. Hajde da ih razmotrimo.

STUDENT.DIST - "klasična" lijevostrana Studentova t-distribucija. Ulaz je vrijednost t-kriterijuma, broj stupnjeva slobode i opcija (0 ili 1) koja određuje šta treba izračunati: gustinu ili vrijednost funkcije. Na izlazu dobijamo, respektivno, gustinu ili verovatnoću da će slučajna varijabla biti manja od t-kriterijuma navedenog u argumentu, tj. ljevoruka p-vrijednost.

STUDENT.DIST.2X - dvosmjerna distribucija. Kao argument daju se apsolutna vrijednost (modulo) t-kriterijuma i broj stupnjeva slobode. Na izlazu dobijamo verovatnoću dobijanja takve ili čak veće vrednosti t-kriterijuma (modulo), tj. stvarni nivo značajnosti (p-vrijednost).

STUDENT.DIST.RH - desna t-distribucija. Dakle, 1-STUDENT.DIST(2;5;1) = STUDENT.DIST.PX(2;5) = 0,05097. Ako je t-test pozitivan, onda je rezultirajuća vjerovatnoća p-vrijednost.

STUDENT.INV - koristi se za izračunavanje leve recipročne vrednosti t-distribucije. Argument je vjerovatnoća i broj stupnjeva slobode. Na izlazu dobijamo vrijednost t-kriterijuma koja odgovara ovoj vjerovatnoći. Vjerovatnoća se računa lijevo. Stoga je za lijevi rep potreban sam nivo značaja α , a za desno 1 - α .

STUDENT.ORD.2X je recipročna vrijednost dvostrane Studentove distribucije, tj. t-test vrijednost (modulo). Nivo značajnosti se takođe daje kao ulaz. α . Samo ovaj put, odbrojavanje je sa obe strane u isto vreme, tako da je verovatnoća raspoređena na dva repa. Dakle, STUDENT.OBR (1-0,025; 5) \u003d STUDENT. OBR. 2X (0,05; 5) = 2,57058

STUDENT.TEST je funkcija za testiranje hipoteze o jednakosti matematičkih očekivanja u dva uzorka. Zamjenjuje gomilu kalkulacija, jer. dovoljno je navesti samo dva opsega sa podacima i još par parametara. Izlaz će biti p-vrijednost.

POVJERENJE STUDENTA - izračunavanje intervala povjerenja srednje vrijednosti, uzimajući u obzir t-distribuciju.

Razmotrite ovo studija slučaja. Firma pakuje cement u vreće od 50 kg. Igrom slučaja, u jednoj vreći je dozvoljeno određeno odstupanje od očekivane mase, ali bi opći prosjek trebao ostati 50 kg. Odjel za kontrolu kvaliteta nasumično je izmjerio 9 vreća i dobio sljedeće rezultate: prosječna težina ( ) iznosila je 50,3 kg, standardna devijacija ( s) - 0,5 kg.

Da li je rezultat u skladu s nultom hipotezom da je opći prosjek 50 kg? Drugim riječima, da li je moguće dobiti takav rezultat čisto slučajno, ako oprema radi kako treba i proizvodi prosječno punjenje od 50 kg? Ako se hipoteza ne odbaci, onda se rezultirajuća razlika uklapa u raspon slučajnih fluktuacija, ali ako se hipoteza odbaci, tada je, najvjerojatnije, došlo do kvara u postavkama aparata koji puni vreće. Treba ga provjeriti i prilagoditi.

Kratko stanje u općeprihvaćenoj notaciji izgleda ovako.

H0: μ = 50 kg

H a: μ ≠ 50 kg

Postoje razlozi za pretpostavku da raspodjela zauzetosti torbe slijedi normalnu distribuciju (ili se ne razlikuje mnogo od nje). Dakle, da biste testirali hipotezu matematičkog očekivanja, možete koristiti Studentov t-test. Slučajna odstupanja se mogu pojaviti u bilo kojem smjeru, tako da je potreban dvostrani t-test.

Prvo, primjenjujemo pretpotopna sredstva: ručno izračunavanje t-testa i upoređivanje sa kritičnom vrijednošću tablice. Procijenjeni t-test:

Sada hajde da odredimo da li rezultujući broj prelazi kritični nivo na nivou značajnosti α = 0,05. Koristimo Studentovu tabelu t-distribucije (dostupnu u bilo kom udžbeniku iz statistike).

Kolone pokazuju vjerovatnoću desne strane distribucije, redovi pokazuju broj stupnjeva slobode. Zainteresovani smo za dvostrani t-test sa nivoom značajnosti 0,05, što je ekvivalentno t-vrednosti za polovinu nivoa značajnosti desno: 1 - 0,05 / 2 = 0,975. Broj stepeni slobode je veličina uzorka minus 1, tj. 9 - 1 = 8. Na raskrsnici nalazimo tabelarnu vrijednost t-testa - 2,306. Kada bismo koristili standardnu ​​normalnu distribuciju, tada bi kritična tačka bila 1,96, ali ovdje je više, jer t-distribucija na malim uzorcima ima spljošteniji oblik.

Usporedimo stvarnu (1,8) i tabelarnu vrijednost (2,306). Izračunati kriterij se pokazao manjim od tabelarnog. Dakle, dostupni podaci nisu u suprotnosti sa H 0 hipotezom da je opći prosjek 50 kg (ali to ni ne dokazuju). To je sve što možemo saznati koristeći tabele. Možete, naravno, i dalje pokušati pronaći p-vrijednost, ali ona će biti približna. I, po pravilu, p-vrijednost se koristi za testiranje hipoteza. Dakle, pređimo na Excel.

Ne postoji gotova funkcija za izračunavanje t-testa u Excel-u. Ali to nije zastrašujuće, jer je Studentova formula t-testa prilično jednostavna i može se lako izgraditi u Excel ćeliji.

Dobio sam isti 1.8. Hajde da prvo pronađemo kritičnu vrednost. Uzimamo alfa 0,05, kriterij je dvostran. Potrebna nam je funkcija inverzne vrijednosti t-distribucije za dvostranu hipotezu STUDENT.OBR.2X.

Rezultirajuća vrijednost odsijeca kritično područje. Opaženi t-test ne spada u njega, pa se hipoteza ne odbacuje.

Međutim, ovo je isti način testiranja hipoteze pomoću vrijednosti tabele. Informativnije će biti izračunati p-vrijednost, tj. vjerovatnoća dobivanja uočenog ili čak većeg odstupanja od srednje vrijednosti od 50 kg ako je ova hipoteza tačna. Trebat će vam Studentova funkcija distribucije za dvosmjernu hipotezu STUDENT.DIST.2X.

P-vrijednost je jednaka 0,1096, što je više od prihvatljivog nivoa značajnosti od 0,05 - ne odbacujemo hipotezu. Ali sada možemo suditi o stepenu dokaza. Pokazalo se da je p-vrijednost prilično blizu nivou kada se hipoteza odbacuje, a to dovodi do različitih razmišljanja. Na primjer, da je uzorak premali da bi se otkrilo značajno odstupanje.

Pretpostavimo da je nakon nekog vremena odjel za kontrolu ponovo odlučio provjeriti kako se održava standard punjenja vrećice. Ovoga puta, radi veće pouzdanosti, odabrano je ne 9, već 25 vreća. Intuitivno je jasno da će se širenje prosjeka smanjiti, a samim tim i šanse za pronalazak kvara u sistemu postaju veće.

Recimo da su za uzorak dobijene iste vrijednosti srednje vrijednosti i standardne devijacije kao i prvi put (50,3 odnosno 0,5). Izračunajmo t-test.


Kritična vrijednost za 24 stepena slobode i α = 0,05 je 2,064. Slika ispod pokazuje da t-test spada u područje odbacivanja hipoteze.

Može se zaključiti da se uz vjerovatnoću pouzdanosti veću od 95% opći prosjek razlikuje od 50 kg. Da bismo bili uvjerljiviji, pogledajmo p-vrijednost (zadnji red u tabeli). Vjerovatnoća da se dobije prosjek sa ovim ili čak većim odstupanjem od 50, ako je hipoteza tačna, iznosi 0,0062, odnosno 0,62%, što je gotovo nemoguće sa jednim mjerenjem. Općenito, odbacujemo hipotezu kao malo vjerovatnu.

Izračunavanje intervala pouzdanosti koristeći Studentovu t-distribuciju

Drugo je usko povezano sa testiranjem hipoteza statistička metodaizračunavanje intervala pouzdanosti. Ako vrijednost koja odgovara nultoj hipotezi spada u dobijeni interval, to je ekvivalentno činjenici da Nulta hipoteza nije odbijena. U suprotnom, hipoteza se odbacuje uz odgovarajući nivo pouzdanosti. U nekim slučajevima analitičari uopće ne testiraju hipoteze u klasičnom obliku, već samo izračunavaju intervale povjerenja. Ovaj pristup vam omogućava da izvučete još korisnije informacije.

Izračunajmo intervale povjerenja za prosjek na 9 i 25 opservacija. Za ovo koristimo Excel funkcija POVERENJE STUDENT. Ovdje je, začudo, sve prilično jednostavno. U argumentima funkcije morate navesti samo nivo značaja α , standardna devijacija prema uzorku i veličini uzorka. Na izlazu dobijamo polovičnu širinu intervala pouzdanosti, odnosno vrijednost koju treba izdvojiti na obje strane prosjeka. Nakon izvršenih proračuna i crtanja vizuelnog dijagrama, dobijamo sledeće.

Kao što se može vidjeti, kod uzorka od 9 opservacija vrijednost 50 spada u interval pouzdanosti (hipoteza se ne odbacuje), a kod 25 opservacija ne pada (hipoteza se odbacuje). Istovremeno, u eksperimentu sa 25 vreća, može se tvrditi da sa vjerovatnoćom od 97,5% opći prosjek prelazi 50,1 kg (donja granica intervala povjerenja je 50,094 kg). I to je prilično vrijedna informacija.

Dakle, isti problem smo riješili na tri načina:

1. Drevni pristup, upoređujući izračunatu i tabelarnu vrijednost t-kriterijuma
2. Modernije izračunavanjem p-vrijednosti, dodajući stepen povjerenja u odbacivanje hipoteze.
3. Još informativnije izračunavanjem intervala povjerenja i dobivanjem minimalne vrijednosti opšteg prosjeka.

Važno je zapamtiti da se t-test odnosi na parametarske metode, jer zasnovano na normalnoj distribuciji (ima dva parametra: srednju vrijednost i varijansu). Stoga je za njegovu uspješnu primjenu bitna barem približna normalnost početnih podataka i odsustvo odstupanja.

Na kraju, predlažem da pogledate video o tome kako izvršiti proračune vezane za Studentov t-test u Excelu.

gde je f stepen slobode, koji je definisan kao

Primjer . Dvije grupe studenata su obučavane po dvije različite metode. Na kraju obuke dobili su test tokom celog kursa. Potrebno je procijeniti koliko su značajne razlike u stečenom znanju. Rezultati ispitivanja su prikazani u tabeli 4.

Tabela 4

Izračunajte srednju vrijednost uzorka, varijansu i standardnu ​​devijaciju:

Odredite vrijednost t p formulom t p = 0,45

Prema tabeli 1 (vidi Dodatak), nalazimo kritičnu vrijednost t k za nivo značajnosti p = 0,01

Zaključak: budući da je izračunata vrijednost kriterija manja od kritične vrijednosti od 0,45<2,88 гипотеза Но подтверждается и существенных различий в методиках обучения нет на уровне значимости 0,01.

Algoritam za izračunavanje Studentovog t-testa za zavisne uzorke mjerenja

1. Odredite izračunatu vrijednost t-kriterijuma koristeći formulu

, gdje

2. Izračunajte stepen slobode f

3. Odrediti kritičnu vrijednost t-testa prema tabeli 1 Dodatka.

4. Uporedite izračunate i kritične vrijednosti t-kriterija. Ako je izračunata vrijednost veća ili jednaka kritičnoj vrijednosti, onda se hipoteza o jednakosti srednjih vrijednosti u dva uzorka promjene odbacuje (Ali). U svim ostalim slučajevima, uzima se na datom nivou značaja.

U- kriterijumManna- Whitney

Svrha kriterija

Kriterijum je dizajniran da proceni razlike između dva neparametarska uzorka u smislu nivoa bilo koje osobine, kvantitativno merene. Omogućava vam da identifikujete razlike između malih uzoraka kada n< 30.

Opis kriterija

Ova metoda određuje je li područje preklapanja vrijednosti između dvije serije dovoljno malo. Što je ovo područje manje, veća je vjerovatnoća da su razlike značajne. Empirijska vrijednost U kriterija odražava koliko je velika zona podudarnosti između redova. Dakle, što je manje U, veća je vjerovatnoća da su razlike značajne.

Hipoteze

ALI: Nivo obilježja u grupi 2 nije niži od nivoa obilježja u grupi 1.

HI: Nivo osobine u grupi 2 je niži od nivoa osobine u grupi 1.

Algoritam za izračunavanje Mann-Whitneyjevog kriterija (u)

    Prenesite sve podatke o subjektima na pojedinačne kartice.

    Označite kartice ispitanika uzorka 1 jednom bojom, recimo crvenom, a sve karte iz uzorka 2 drugom, na primjer plavom.

    Sve kartice rasporedite u jedan red prema stepenu rasta atributa, bez obzira kojem uzorku pripadaju, kao da radimo sa jednim velikim uzorkom.


gdje je n 1 broj ispitanika u uzorku 1;

n 2 - broj ispitanika u uzorku 2,

T x - veći od dva suma randa;

n x - broj subjekata u grupi sa većim zbrojem rangova.

9. Odredite kritične vrijednosti U prema tabeli 2 (vidi Dodatak).

Ako je U emp.> U kr0,05, onda je hipoteza No prihvaćena. Ako je U emp. ≤ U cr, onda se odbacuje. Kako manje vrijednosti U, veća je pouzdanost razlika.

Primjer. Uporedite efikasnost dve nastavne metode u dve grupe. Rezultati ispitivanja su prikazani u tabeli 5.

Tabela 5

Prebacimo sve podatke u drugu tabelu, podcrtavajući podatke druge grupe i izvršimo rangiranje ukupnog uzorka (pogledajte algoritam rangiranja u smjernicama za zadatak 3).

Vrijednosti

Pronađite zbroj rangova dva uzorka i odaberite najveći od njih: T x = 113

Izračunajmo empirijsku vrijednost kriterija prema formuli 2: U p = 30.

Odredimo kritičnu vrijednost kriterijuma iz tabele 2 Priloga na nivou značajnosti p = 0,05: U k = 19.

zaključak: budući da je izračunata vrijednost kriterijaUje veći od kritičnog nivoa na nivou značajnosti p = 0,05 i 30 > 19, tada se prihvata hipoteza o jednakosti srednjih vrednosti i razlike u nastavnim metodama su beznačajne.

U toku primjera koristit ćemo fiktivne informacije kako bi čitatelj mogao sam napraviti potrebne transformacije.

Tako smo, na primjer, u toku istraživanja proučavali učinak lijeka A na sadržaj supstance B (u mmol/g) u tkivu C i koncentraciju supstance D u krvi (u mmol/l) kod pacijenata. podijeljeni prema nekom kriteriju E u 3 grupe jednake zapremine (n = 10). Rezultati ove fiktivne studije prikazani su u tabeli:

Sadržaj supstance B, mmol/g

Supstanca D, mmol/l

povećanje koncentracije


Želimo da vas upozorimo da uzorke veličine 10 uzimamo u obzir radi lakše prezentacije podataka i proračuna, a u praksi takva veličina uzorka obično nije dovoljna za donošenje statističkog zaključka.

Kao primjer, razmotrite podatke iz 1. stupca tabele.

Deskriptivna statistika

srednja vrijednost uzorka

Aritmetička sredina, koja se vrlo često naziva jednostavno "prosjek", dobiva se zbrajanjem svih vrijednosti i dijeljenjem ove sume sa brojem vrijednosti u skupu. Ovo se može pokazati pomoću algebarske formule. Skup od n opservacija varijable x može se predstaviti kao x 1 , x 2 , x 3 , ..., x n

Formula za određivanje aritmetičke sredine zapažanja (izgovara se "X sa crticom"):

\u003d (X 1 + X 2 + ... + X n) / n

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

Varijanca uzorka

Jedan od načina da se izmjeri rasipanje podataka je da se odredi koliko svako zapažanje odstupa od aritmetičke sredine. Očigledno, što je veće odstupanje, to je veća varijabilnost, varijabilnost opažanja. Međutim, ne možemo koristiti prosjek ovih odstupanja kao mjera disperzije, jer pozitivna odstupanja kompenzuju negativna odstupanja (njihov zbir je nula). Da bismo riješili ovaj problem, kvadriramo svako odstupanje i pronađemo prosjek kvadrata odstupanja; ova količina se naziva varijacija ili disperzija. Uzmite n zapažanja x 1, x 2, x 3, ..., x n, prosjek koji je jednak. Izračunavamo disperz ovaj, koji se obično nazivas2,ova zapažanja:

Varijanca uzorka ovog indikatora je s 2 = 3,2.

Standardna devijacija

Standardna (srednja kvadratna) devijacija je pozitivna Kvadratni korijen od disperzije. Na primjer, n zapažanjima, to izgleda ovako:

Standardnu ​​devijaciju možemo zamisliti kao neku vrstu srednjeg odstupanja zapažanja od srednje vrijednosti. Izračunava se u istim jedinicama (dimenzijama) kao i originalni podaci.

s = sqrt (s 2) = sqrt (3,2) = 1,79 .

Koeficijent varijacije

Ako standardnu ​​devijaciju podijelite aritmetičkom sredinom i rezultat izrazite kao postotak, dobit ćete koeficijent varijacije.

CV = (1,79 / 13,1) * 100% = 13,7

Srednja greška uzorka

1,79/m²(10) = 0,57;

Studentov koeficijent t (t-test jednog uzorka)

Koristi se za testiranje hipoteze o razlici između srednje vrijednosti i neke poznate vrijednosti m

Broj stepeni slobode izračunava se kao f=n-1.

U ovom slučaju, interval povjerenja za srednju vrijednost je između granica od 11,87 i 14,39.

Za nivo pouzdanosti od 95%, m=11,87 ili m=14,39, tj. = |13,1-11,82| = |13.1-14.38| = 1,28

Shodno tome, u ovom slučaju, za broj stepeni slobode f = 10 - 1 = 9 i nivo pouzdanosti od 95% t=2,26.

Dijalog Osnovne statistike i tabele

U modulu Osnovne statistike i tabele izabrati Deskriptivna statistika.

Otvoriće se dijaloški okvir Deskriptivna statistika.

U polju Varijable izabrati Grupa 1.

Pritiskom uredu, dobijamo tabele rezultata sa deskriptivnom statistikom odabranih varijabli.

Otvoriće se dijaloški okvir T-test jednog uzorka.

Pretpostavimo da znamo da je prosječan sadržaj supstance B u tkivu C 11.

Tabela rezultata sa deskriptivnom statistikom i Studentovim t-testom je sljedeća:

Morali smo odbaciti hipotezu da je prosječan sadržaj supstance B u tkivu C 11.

Budući da je izračunata vrijednost kriterija veća od tabelarne (2.26), nulta hipoteza se odbacuje na odabranom nivou značajnosti, a razlike između uzorka i poznate vrijednosti se priznaju kao statistički značajne. Dakle, ovim metodom se potvrđuje zaključak o postojanju razlika donet po Studentovom kriterijumu.

T-test je razvio William Gosset (1876-1937) za procjenu kvaliteta piva u Guinnessovim pivarama u Dablinu u Irskoj. U vezi sa obavezama prema kompaniji za neotkrivanje poslovnih tajni (Ginisovo rukovodstvo je smatralo takvu upotrebu statističkog aparata u svom radu), Gossetov članak je objavljen 1908. godine u časopisu „Biometrics“ pod pseudonimom „Student“ ( Student).

Studentov kriterijum je usmeren na procenu razlika u vrednostima prosječne vrijednosti dva uzorka koji su raspoređeni po normalnom zakonu. Jedna od glavnih prednosti kriterija je širina njegove primjene. Može se koristiti za poređenje y srednjih vrijednosti, a uzorci možda neće biti jednaki po veličini.

Uslovi za primjenu Studentovog t-testa

Da bi se primenio Studentov t-test, moraju biti ispunjeni sledeći uslovi:

1. Mjerenje može biti .
2. Uzorci koji se upoređuju moraju biti raspoređeni prema uobičajenom zakonu.

Automatsko izračunavanje Studentovog t-testa

Korak 1

Da biste napravili ispravan proračun koristeći ovu skriptu, morate:

1) Odaberite proračun za slučaj sa nepovezanim (nezavisnim) ili povezanim (zavisnim) uzorcima.

2) U prvu kolonu ("Uzorak 1") upisati podatke prvog uzorka, au drugu kolonu ("Uzorak 2") podatke drugog uzorka. Podaci se unose po jedan broj po redu; bez razmaka, praznina itd. Upisuju se samo brojevi. Razlomci brojeva se unose sa "." (tačka).

3) Nakon popunjavanja kolona, ​​kliknite na dugme "Korak 2" da automatski izračunate Studentov t-test.

Dijeli