Kako analizirati male uzorke i opisati rezultate. Bootstrap, mali uzorci, primjena u analizi podataka

Prilikom kontrole kvaliteta robe u ekonomskim istraživanjima, eksperiment se može izvesti na osnovu malog uzorka.

Ispod mali uzorak se podrazumijeva kao nekontinuirano statističko istraživanje, u kojem se populacija uzorka formira od relativno malog broja jedinica opšte populacije. Volumen malog uzorka obično ne prelazi 30 jedinica i može doseći do 4-5 jedinica.

U trgovini, minimalnoj veličini uzorka se pribjegava kada veliki uzorak ili nije moguć ili nije praktičan (na primjer, ako studija uključuje propadanje ili uništavanje uzoraka koji se ispituju).

Vrijednost greške malog uzorka određena je formulama koje se razlikuju od formula za posmatranje uzorka s relativno velikom veličinom uzorka (n>100). Srednja greška malog uzorka u(mu)m.v. izračunato po formuli:

um.v \u003d korijen (Gsquare (m.v.) . / n),

gdje je Gsquare(m.v.) varijansa malog uzorka. *ovo je sigma*

Prema formuli (broj je tamo) imamo:

G0kvadrat=Gkvadrat *n/ (n-1).

Ali pošto je kod malog uzorka n / (n-1) značajan, izračunavanje varijanse malog uzorka se vrši uzimajući u obzir tzv. broj stepeni slobode. Broj stupnjeva slobode podrazumijeva se kao broj opcija koje mogu uzeti proizvoljne vrijednosti bez promjene prosječne vrijednosti. Prilikom određivanja kvadrata varijanse, broj stupnjeva slobode je n-1:

Gsquare (m.v.) \u003d zbroj (xi-x (sa valovitom linijom)) / (n-1).

Granična greška malog uzorka Dm.v. (znak trokuta) određena je formulom:

U ovom slučaju, vrijednost koeficijenta pouzdanosti t zavisi ne samo od date vjerovatnoće povjerenja, već i od broja jedinica uzorka n. Za pojedinačne vrijednosti t i n, vjerovatnoća pouzdanosti malog uzorka određena je posebnim Studentovim tabelama, u kojima su date distribucije standardiziranih odstupanja:

t= (x(sa talasastom linijom) –x(sa linijom)) / Gm.v.

Studentske tabele su date u udžbenicima iz matematičke statistike. Evo nekih vrijednosti iz ovih tabela koje karakteriziraju vjerovatnoću da marginalna greška malog uzorka neće premašiti t puta prosječnu grešku:

St=P[(x(sa valovitom linijom) –x(sa linijom)

Kako se veličina uzorka povećava, Studentova distribucija se približava normalnoj raspodjeli, a na 20 se već malo razlikuje od normalne distribucije.

Prilikom provođenja istraživanja malih uzoraka, važno je imati na umu da što je manji uzorak, to je veća razlika između Studentove distribucije i normalna distribucija. Kod minimalne veličine uzorka (n=4) ova razlika je vrlo značajna, što ukazuje na smanjenje tačnosti rezultata malog uzorka.

Uz pomoć malog uzorka u trgovini rješava se niz praktičnih problema, prije svega, uspostavljanje granice u kojoj se nalazi opći prosjek osobine koja se proučava.

Budući da se kod malog uzorka kao pouzdana vjerovatnoća praktično uzima vrijednost od 0,95 ili 0,99, onda za određivanje granične greške uzorkovanja Dm.v. Koriste se sljedeća očitanja Studentove raspodjele.

Uzorci u kojima posmatranje pokriva mali broj jedinica (n< 30), принято называть малыми выборками. Они обычно применяются в том случае, когда невозможно или нецелесообразно использовать большую выборку (исследование качества продукции, если это связано с ее разрушением, в частности на прочность, на продолжительность срока службы и т.д.).

Granična greška malog uzorka određena je formulom:

Prosječna greška malog uzorka:

gdje je varijansa malog uzorka:

gdje je srednja vrijednost karakteristike u uzorku;

Broj stepeni slobode

Koeficijent pouzdanosti malog uzorka, koji ne zavisi samo od date verovatnoće poverenja, već i od broja jedinica uzorka.

Vjerovatnoća da je opći prosjek u određenim granicama određena je formulom

gdje je vrijednost Studentove funkcije.

Da bi se izračunao koeficijent pouzdanosti, vrijednost funkcije određena je formulom:

Zatim se, prema Studentovoj tabeli raspodjele (vidi Dodatak 4), u zavisnosti od vrijednosti funkcije i broja stupnjeva, određuje vrijednost.

Funkcija se također koristi za određivanje vjerojatnosti da stvarno normalizirano odstupanje neće premašiti vrijednost tablice.


Tema 7. Statistička studija odnosa: Koncept statističke povezanosti. Vrste i oblici statističke povezanosti. Zadaci statističkog proučavanja odnosa pojava. Osobine veza društveno-ekonomskih pojava. Osnovne metode statističkog proučavanja odnosa.

korelacija - odnos koji se ne pojavljuje u svakom pojedinačnom slučaju, već u masi slučajeva u prosječnim vrijednostima u obliku trenda.

Statistička studija ima za cilj da dobije model zavisnosti za svoje praktična upotreba. Rješenje ovog problema provodi se sljedećim redoslijedom.

1. Logička analiza suštine proučavanog fenomena i uzročno-posledičnih veza. Kao rezultat, indikator učinka je postavljen (y), faktori njegove promjene, karakterizirani indikatorima (x (, x 2, x 3,..., X"). Odnos dvije karakteristike (u i X) pozvao korelacija parova. Uticaj više faktora na efektivnu osobinu naziva se višestruka korelacija.

U općem smjeru komunikacija može biti ravno i obrnuto. Sa direktnim vezama sa povećanjem osobine x znak se takođe povećava y, sa obrnutom - sa povećanjem znaka X sign at smanjuje se.

2. Prikupljanje primarnih informacija i njihova provjera homogenosti i normalne distribucije. Za procjenu homogenosti populacije koristi se koeficijent varijacije prema karakteristikama faktora

Skup se smatra homogenim ako koeficijent varijacije ne prelazi 33%. Provjera normalnosti distribucije proučavanih faktorskih znakova ( x ( , x 2 , x 3 ,..., X") izvedeno po pravilu tri sigma. Rezultate testa za normalnu distribuciju treba prikazati u obliku tabele.

Statistika malog uzorka

Općenito je prihvaćeno da je početak S. m. ili, kako je često nazivaju, „mala n“ statistika, ustanovljena je u prvoj deceniji 20. veka objavljivanjem dela W. Gosseta, u koji je postavio t-distribuciju koju je postulirao „student“ koji kasnije stekao svetsku slavu. U to vrijeme, Gosset je radio kao statističar za Guinnessove pivare. Jedna od njegovih dužnosti bila je analiziranje uzastopnih serija bačvi svježe skuvanog stouta. Iz razloga koje nikada nije objasnio, Gosset je eksperimentirao s idejom da značajno smanji broj uzoraka uzetih iz vrlo veliki broj bačve u skladištima pivare, za selektivnu kontrolu kvaliteta portera. To ga je navelo da postulira t-distribuciju. Pošto je povelja Guinnessovih pivara zabranila svojim zaposlenicima da objavljuju rezultate studije, Gosset je objavio rezultate svog eksperimenta upoređujući kontrolu kvaliteta uzorkovanja koristeći t-distribuciju malog uzorka i tradicionalnu z-distribuciju (normalnu distribuciju) anonimno, pod pseudonim "Student" (Student - odakle potiče naziv t-Studentova distribucija).

t-distribucija. Teorija t-distribucije, kao i teorija z-distribucije, koristi se za testiranje Nulta hipoteza da su dva uzorka jednostavno nasumični uzorci iz iste populacije i stoga izračunata statistika (npr. srednja vrijednost i standardna devijacija) su nepristrasne procjene parametara opšte populacije. Međutim, za razliku od teorije normalne distribucije, teorija t-distribucije za male uzorke ne zahtijeva prethodno znanje ili tačne procjene matematičko očekivanje i varijanse opšte populacije. Štaviše, iako testiranje razlike između srednjih vrednosti dva velika uzorka za statističku značajnost zahteva fundamentalnu pretpostavku o normalnoj distribuciji karakteristika populacije, teorija t-distribucije ne zahteva pretpostavke o parametrima.

Dobro je poznato da su normalno raspoređene karakteristike opisane jednom krivom - Gaussovom krivom, koja zadovoljava sljedeću jednačinu:

Sa t-distribucijom, cijela porodica krivulja predstavljena je sljedećom formulom:

Zato jednadžba za t uključuje gama funkciju, što u matematici znači da kako se n mijenja ovu jednačinuće zadovoljiti drugu krivu.

Stepeni slobode

U jednadžbi za t, n označava broj stupnjeva slobode (df) povezanih s procjenom varijanse populacije (S2), što je drugi trenutak bilo koje generirajuće funkcije momenata, kao što je jednačina za t-distribuciju. U S., broj stupnjeva slobode pokazuje koliko je karakteristika ostalo slobodnih nakon djelomične upotrebe u određenoj vrsti analize. U t-distribuciji, jedno od odstupanja od srednje vrijednosti uzorka je uvijek fiksno, jer zbir svih takvih odstupanja mora biti jednak nuli. Ovo utiče na zbir kvadrata pri izračunavanju varijanse uzorka kao nepristrasne procene parametra S2 i dovodi do činjenice da se dobija df jednak broju mjerenja minus jedan za svaki uzorak. Dakle, u formulama i postupcima za izračunavanje t-statistike za testiranje nulte hipoteze df = n - 2.

F-prostorna podjela. Nul hipoteza testirana t-testom je da su dva uzorka nasumično izvučena iz iste populacije ili su nasumično izvučena iz dvije različite populacije sa istom varijansom. Ali šta ako trebate analizirati više grupa? Odgovor na ovo pitanje tražio se dvadeset godina nakon što je Gosset otkrio t-distribuciju. Dvojica najistaknutijih statističara 20. veka bila su direktno uključena u njegovu proizvodnju. Jedan - najveći engleski statističar R. A. Fisher, koji je predložio prvu teoriju. formulacije čiji je razvoj doveo do F-distribucije; njegov rad na teoriji malih uzoraka, razvijajući Gossetove ideje, objavljen je sredinom 1920-ih (Fisher, 1925). Drugi je George Snedecor, jedan od prvih američkih statističara, koji je razvio način za upoređivanje dva nezavisna uzorka bilo koje veličine izračunavanjem omjera dvije procjene varijanse. On je ovaj omjer nazvao F-razmjerom, po Fischeru. Rezultati istraživanja. Snedekor je doveo do činjenice da je F-distribucija počela da se specificira kao distribucija omjera dvije statistike c2, svaka sa svojim stupnjevima slobode:

Iz ovoga je proizašao Fisherov klasični rad o analizi varijanse, statističkoj tehnici koja je eksplicitno orijentirana na analizu malih uzoraka.

Distribucija uzorkovanja F (gdje je n = df) predstavljena je sljedećom jednadžbom:

Kao iu slučaju t-distribucije, gama funkcija ukazuje da postoji porodica distribucija koje zadovoljavaju jednačinu za F. Međutim, u ovom slučaju analiza uključuje dvije veličine df: broj stupnjeva slobode za brojnik i za nazivnik F-razmjera.

Tabele za procjenu t- i F-statistike. Prilikom testiranja nulte hipoteze korištenjem C. zasnovanog na teoriji velikih uzoraka, obično je potrebna samo jedna referentna tablica - tablica normalnih odstupanja (z), koja vam omogućava da odredite površinu ispod normalne krivulje između bilo koje dvije vrijednosti od z na x-osi. Međutim, tabele za t- i F-distribuciju su nužno predstavljene u skupu tabela, pošto su ove tabele zasnovane na višestrukim distribucijama koje su rezultat variranja broja stepeni slobode. Iako su t- i F-distribucije distribucije gustine vjerovatnoće, poput normalne raspodjele za velike uzorke, one se razlikuju od ove druge u pogledu četiri momenta koja se koriste za njihovo opisivanje. T-distribucija je, na primjer, simetrična (primijetite t2 u svojoj jednadžbi) za sve df, ali postaje sve više i više vršna kako se veličina uzorka smanjuje. Vrhunske krive (sa većim od normalnog kurtozisa) imaju tendenciju da budu manje asimptotične (tj. bliže x-osi na krajevima distribucije) nego krive s normalnim ekscesom, kao što je Gaussova kriva. Ova razlika dovodi do primjetnih neslaganja između tačaka na x-osi koje odgovaraju vrijednostima t i z. Sa df = 5 i bilateralnim nivoom a jednakim 0,05, t = 2,57, dok je odgovarajući z = 1,96. Dakle, t = 2,57 ukazuje na statističku značajnost na nivou od 5%. Međutim, u slučaju normalne krive, z = 2,57 (tačnije 2,58) bi već ukazivalo na nivo statističke značajnosti od 1%. Slična poređenja se mogu napraviti sa F-distribucijom, jer je t jednako F kada je broj uzoraka dva.

Šta čini "mali" uzorak?

Svojevremeno se postavljalo pitanje koliki uzorak treba da bude da bi se smatrao malim. Jednostavno ne postoji definitivan odgovor na ovo pitanje. Međutim, uobičajeno je da se df = 30 smatra uslovnom granicom između malog i velikog uzorka.Osnova za ovu donekle proizvoljnu odluku je rezultat poređenja t-distribucije sa normalnom distribucijom. Kao što je gore navedeno, neslaganje između vrijednosti t i z ima tendenciju povećanja sa smanjenjem i smanjenja s povećanjem df. U stvari, t počinje da se približava z blizu mnogo prije graničnog slučaja kada je t = z za df = ∞. Jednostavan vizualni pregled tabličnih vrijednosti t omogućava vam da vidite da ova aproksimacija postaje prilično brza, počevši od df = 30 i više. Komparativne vrijednosti t (pri df = 30) i z su, respektivno: 2,04 i 1,96 za p = 0,05; 2,75 i 2,58 za p = 0,01; 3,65 i 3,29 za p = 0,001.

Ostale statistike za "male" uzorke

Iako su statistički testovi kao što su t i F posebno dizajnirani za primjenu na male uzorke, oni su podjednako primjenjivi i na velike uzorke. Međutim, postoje mnogi drugi. statističke metode, namijenjen za analizu malih uzoraka i često se koristi u tu svrhu. Oni misle na tzv. neparametarske metode ili metode bez distribucije. U osnovi, S. koji se pojavljuje u ovim metodama je namijenjen za primjenu na mjerenja dobivena korištenjem skala koje ne zadovoljavaju definiciju omjera ili intervalnih skala. Najčešće su to ordinalne (rang) ili nazivne mjere. Neparametrijski S. ne zahtijevaju pretpostavke o parametrima distribucije, posebno u odnosu na procjene varijanse, jer ordinalne i nominalne skale isključuju sam koncept varijanse. Iz tog razloga se neparametarske metode koriste i za mjerenja dobijena korištenjem intervalnih i omjernih skala kada se analiziraju mali uzorci i postoji mogućnost da se naruše osnovne pretpostavke potrebne za primjenu parametarskih metoda. Među takvim C., koji se razumno može primijeniti na male uzorke, su: Fisherov test egzaktne vjerovatnoće, Friedmanova dvofaktorska neparametarska (rang) analiza varijanse, Kendall-ov koeficijent korelacije ranga t, Kendall-ov koeficijent podudarnosti (W), Kruskalov H-kriterijum - Wallace za neparametarsku (rang) jednosmjernu analizu varijanse, Mann-Whitney U-test, test medijane, test znakova, Spearmanov koeficijent korelacije ranga r i Wilcoxonov t-test.

Prilikom kontrole kvaliteta robe u ekonomskim istraživanjima, eksperiment se može izvesti na osnovu malog uzorka.

Ispod mali uzorak se podrazumijeva kao nekontinuirano statističko istraživanje, u kojem se populacija uzorka formira od relativno malog broja jedinica opšte populacije. Volumen malog uzorka obično ne prelazi 30 jedinica i može doseći do 4 - 5 jedinica.

Prosječna greška malog uzorka izračunava se po formuli:

,

gdje
je varijansa malog uzorka.

Prilikom utvrđivanja varijanse broj stepeni slobode je n-1:

.

Marginalna greška malog uzorka
određuje se formulom

U ovom slučaju, vrijednost koeficijenta pouzdanosti t zavisi ne samo od date vjerovatnoće povjerenja, već i od broja jedinica uzorka n. Za pojedinačne vrijednosti t i n, vjerovatnoća pouzdanosti malog uzorka određena je posebnim Studentovim tabelama (tabela 9.1.), u kojima su date distribucije standardiziranih devijacija:

.

Budući da se prilikom provođenja malog uzorka vrijednost od 0,59 ili 0,99 praktično uzima kao pouzdana vjerovatnoća, onda za određivanje marginalne greške malog uzorka
Koriste se sljedeća očitanja t-distribucije:

Metode za proširenje karakteristika uzorka na opću populaciju.

Metoda uzorkovanja se najčešće koristi za dobijanje karakteristika opšte populacije prema relevantnim pokazateljima uzorka. Ovisno o ciljevima istraživanja, to se provodi ili direktnim preračunavanjem indikatora uzorka za opštu populaciju, ili izračunavanjem faktora korekcije.

direktna metoda proračuna. Sastoji se u tome da indikatori uzorka udio ili srednje proširuje se na opću populaciju, uzimajući u obzir grešku uzorkovanja.

Dakle, u trgovini se utvrđuje broj nestandardnih proizvoda primljenih u seriji robe. Da bi se to postiglo (uzimajući u obzir prihvaćeni stepen vjerovatnoće), indikatori udjela nestandardnih proizvoda u uzorku se množe sa brojem proizvoda u cijeloj seriji robe.

Metoda korekcijskih faktora. Koristi se u slučajevima kada je svrha metode uzorkovanja da se preciziraju rezultati kompletnog računovodstva.

U statističkoj praksi ovaj metod se koristi za preciziranje podataka godišnjih popisa stoke u vlasništvu stanovništva. Da bi se to postiglo, nakon sumiranja podataka kompletnog računovodstva, praktikuje se anketa uzorka od 10% uz određivanje takozvanog „procenta potcjenjivanja“.

Metode odabira jedinica iz opće populacije.

U statistici se koriste različite metode formiranja skupova uzoraka, što je određeno ciljevima istraživanja i zavisi od specifičnosti predmeta proučavanja.

Osnovni uslov za sprovođenje uzorka je da se spreči pojava sistematskih grešaka koje proizilaze iz kršenja principa jednakih mogućnosti svake jedinice opšte populacije da uđe u uzorak. Prevencija sistematskih grešaka postiže se upotrebom naučno utemeljenih metoda za formiranje uzorka populacije.

Postoje sljedeći načini odabira jedinica iz opće populacije:

1) individualna selekcija - pojedinačne jedinice se biraju u uzorku;

2) grupni odabir - u uzorak spadaju kvalitativno homogene grupe ili serije jedinica koje se proučavaju;

3) kombinovana selekcija je kombinacija individualne i grupne selekcije.

Metode selekcije određene su pravilima za formiranje populacije uzorka.

Uzorak može biti:

Zapravo-slučajno;

Mechanical;

tipično;

Serial;

Kombinovano.

Samonasumično uzorkovanje sastoji se u tome što se uzorak formira kao rezultat slučajnog (nenamjernog) odabira pojedinačnih jedinica iz opće populacije. U ovom slučaju, broj jedinica odabranih u skupu uzoraka obično se određuje na osnovu prihvaćenog udjela uzorka.

Udio uzorka je omjer broja jedinica u populaciji uzorka n prema broju jedinica u općoj populaciji N, tj.

.

Dakle, sa 5% uzorka iz serije robe od 2.000 jedinica. veličina uzorka n je 100 jedinica. (5 * 2000:100), a sa uzorkom od 20% to će biti 400 jedinica. (20*2000:100) itd.

Mehaničko uzorkovanje sastoji se u tome da se odabir jedinica u uzorku vrši iz opće populacije, podijeljene u jednake intervale (grupe). U ovom slučaju, veličina intervala u opštoj populaciji jednaka je recipročnoj proporciji uzorka.

Dakle, kod uzorka od 2% bira se svaka 50. jedinica (1:0,02), kod uzorka od 5% svaka 20. jedinica (1:0,05) itd.

Dakle, u skladu sa prihvaćenom proporcijom selekcije, opšta populacija je takoreći mehanički podeljena na jednake grupe. Iz svake grupe u uzorku se bira samo jedna jedinica.

Važna karakteristika mehaničkog uzorkovanja je da se formiranje populacije uzorka može izvršiti bez pribjegavanja popisu. U praksi se često koristi redoslijed kojim su jedinice stanovništva zapravo raspoređene. Na primjer, redoslijed izlaza gotovih proizvoda sa transportera ili proizvodne linije, redosljed kojim se jedinice serije robe postavljaju tokom skladištenja, transporta, prodaje itd.

Tipičan uzorak. Kod tipičnog uzorka, populacija se prvo dijeli na homogene tipične grupe. Zatim se iz svake tipične grupe vrši pojedinačni odabir jedinica u uzorak slučajnim ili mehaničkim uzorkom.

Tipično uzorkovanje se obično koristi u proučavanju složenih statističkih populacija. Na primjer, u uzorku istraživanja produktivnosti rada trgovačkih radnika, koji se sastoji od odvojenih grupa prema kvalifikacijama.

Važna karakteristika tipičnog uzorka je da daje preciznije rezultate u poređenju sa drugim metodama odabira jedinica u populaciji uzorka.

Za utvrđivanje prosečna greška Tipičan uzorak koristi sljedeće formule:

ponovni izbor

,

selekcija koja se ne ponavlja

,

Disperzija se određuje prema sljedećim formulama:

,

At single stage U uzorku se svaka odabrana jedinica odmah podvrgava proučavanju po datoj osnovi. Ovo je slučaj za pravilno nasumično i serijsko uzorkovanje.

At višestepeni uzorak se bira iz opće populacije pojedinačnih grupa, a pojedinačne jedinice se biraju iz grupa. Ovako se pravi tipičan uzorak mehaničkom metodom odabira jedinica u populaciji uzorka.

Kombinovano uzorak može biti dvostepeni. U ovom slučaju, opća populacija se prvo dijeli na grupe. Zatim se biraju grupe, au okviru ovih se biraju pojedinačne jedinice.

Prilikom kontrole kvaliteta robe u ekonomskim istraživanjima, eksperiment se može izvesti na osnovu malog uzorka.

Ispod mali uzorak se podrazumijeva kao nekontinuirano statističko istraživanje, u kojem se populacija uzorka formira od relativno malog broja jedinica opšte populacije. Volumen malog uzorka obično ne prelazi 30 jedinica i može doseći do 4 - 5 jedinica.

Prosječna greška malog uzorka izračunava se po formuli:

,

gdje
je varijansa malog uzorka.

Prilikom utvrđivanja varijanse broj stepeni slobode je n-1:

.

Marginalna greška malog uzorka
određuje se formulom

U ovom slučaju, vrijednost koeficijenta pouzdanosti t zavisi ne samo od date vjerovatnoće povjerenja, već i od broja jedinica uzorka n. Za pojedinačne vrijednosti t i n, vjerovatnoća pouzdanosti malog uzorka određena je posebnim Studentovim tabelama (tabela 9.1.), u kojima su date distribucije standardiziranih devijacija:

.

Budući da se prilikom provođenja malog uzorka vrijednost od 0,59 ili 0,99 praktično uzima kao pouzdana vjerovatnoća, onda za određivanje marginalne greške malog uzorka
Koriste se sljedeća očitanja t-distribucije:

Metode za proširenje karakteristika uzorka na opću populaciju.

Metoda uzorkovanja se najčešće koristi za dobijanje karakteristika opšte populacije prema relevantnim pokazateljima uzorka. Ovisno o ciljevima istraživanja, to se provodi ili direktnim preračunavanjem indikatora uzorka za opštu populaciju, ili izračunavanjem faktora korekcije.

direktna metoda proračuna. Sastoji se u tome da indikatori uzorka udio ili srednje proširuje se na opću populaciju, uzimajući u obzir grešku uzorkovanja.

Dakle, u trgovini se utvrđuje broj nestandardnih proizvoda primljenih u seriji robe. Da bi se to postiglo (uzimajući u obzir prihvaćeni stepen vjerovatnoće), indikatori udjela nestandardnih proizvoda u uzorku se množe sa brojem proizvoda u cijeloj seriji robe.

Metoda korekcijskih faktora. Koristi se u slučajevima kada je svrha metode uzorkovanja da se preciziraju rezultati kompletnog računovodstva.

U statističkoj praksi ovaj metod se koristi za preciziranje podataka godišnjih popisa stoke u vlasništvu stanovništva. Da bi se to postiglo, nakon sumiranja podataka kompletnog računovodstva, praktikuje se anketa uzorka od 10% uz određivanje takozvanog „procenta potcjenjivanja“.

Metode odabira jedinica iz opće populacije.

U statistici se koriste različite metode formiranja skupova uzoraka, što je određeno ciljevima istraživanja i zavisi od specifičnosti predmeta proučavanja.

Osnovni uslov za sprovođenje uzorka je da se spreči pojava sistematskih grešaka koje proizilaze iz kršenja principa jednakih mogućnosti svake jedinice opšte populacije da uđe u uzorak. Prevencija sistematskih grešaka postiže se upotrebom naučno utemeljenih metoda za formiranje uzorka populacije.

Postoje sljedeći načini odabira jedinica iz opće populacije:

1) individualna selekcija - pojedinačne jedinice se biraju u uzorku;

2) grupni odabir - u uzorak spadaju kvalitativno homogene grupe ili serije jedinica koje se proučavaju;

3) kombinovana selekcija je kombinacija individualne i grupne selekcije.

Metode selekcije određene su pravilima za formiranje populacije uzorka.

Uzorak može biti:

Zapravo-slučajno;

Mechanical;

tipično;

Serial;

Kombinovano.

Samonasumično uzorkovanje sastoji se u tome što se uzorak formira kao rezultat slučajnog (nenamjernog) odabira pojedinačnih jedinica iz opće populacije. U ovom slučaju, broj jedinica odabranih u skupu uzoraka obično se određuje na osnovu prihvaćenog udjela uzorka.

Udio uzorka je omjer broja jedinica u populaciji uzorka n prema broju jedinica u općoj populaciji N, tj.

.

Dakle, sa 5% uzorka iz serije robe od 2.000 jedinica. veličina uzorka n je 100 jedinica. (5 * 2000:100), a sa uzorkom od 20% to će biti 400 jedinica. (20*2000:100) itd.

Mehaničko uzorkovanje sastoji se u tome da se odabir jedinica u uzorku vrši iz opće populacije, podijeljene u jednake intervale (grupe). U ovom slučaju, veličina intervala u opštoj populaciji jednaka je recipročnoj proporciji uzorka.

Dakle, kod uzorka od 2% bira se svaka 50. jedinica (1:0,02), kod uzorka od 5% svaka 20. jedinica (1:0,05) itd.

Dakle, u skladu sa prihvaćenom proporcijom selekcije, opšta populacija je takoreći mehanički podeljena na jednake grupe. Iz svake grupe u uzorku se bira samo jedna jedinica.

Važna karakteristika mehaničkog uzorkovanja je da se formiranje populacije uzorka može izvršiti bez pribjegavanja popisu. U praksi se često koristi redoslijed kojim su jedinice stanovništva zapravo raspoređene. Na primjer, redoslijed izlaza gotovih proizvoda sa transportera ili proizvodne linije, redosljed kojim se jedinice serije robe postavljaju tokom skladištenja, transporta, prodaje itd.

Tipičan uzorak. Kod tipičnog uzorka, populacija se prvo dijeli na homogene tipične grupe. Zatim se iz svake tipične grupe vrši pojedinačni odabir jedinica u uzorak slučajnim ili mehaničkim uzorkom.

Tipično uzorkovanje se obično koristi u proučavanju složenih statističkih populacija. Na primjer, u uzorku istraživanja produktivnosti rada trgovačkih radnika, koji se sastoji od odvojenih grupa prema kvalifikacijama.

Važna karakteristika tipičnog uzorka je da daje preciznije rezultate u poređenju sa drugim metodama odabira jedinica u populaciji uzorka.

Za određivanje prosječne greške tipičnog uzorka koriste se sljedeće formule:

ponovni izbor

,

selekcija koja se ne ponavlja

,

Disperzija se određuje prema sljedećim formulama:

,

At single stage U uzorku se svaka odabrana jedinica odmah podvrgava proučavanju po datoj osnovi. Ovo je slučaj za pravilno nasumično i serijsko uzorkovanje.

At višestepeni uzorak se bira iz opće populacije pojedinačnih grupa, a pojedinačne jedinice se biraju iz grupa. Ovako se pravi tipičan uzorak mehaničkom metodom odabira jedinica u populaciji uzorka.

Kombinovano uzorak može biti dvostepeni. U ovom slučaju, opća populacija se prvo dijeli na grupe. Zatim se biraju grupe, au okviru ovih se biraju pojedinačne jedinice.

Dijeli