Cum să analizezi mostre mici și să descrii rezultatele. Bootstrap, mostre mici, aplicare în analiza datelor

La controlul calității mărfurilor în cercetarea economică, experimentul poate fi efectuat pe baza unui eșantion mic.

Sub mostra mica se înțelege ca o anchetă statistică necontinuă, în care populația eșantion este formată dintr-un număr relativ mic de unități ale populației generale. Volumul unei probe mici de obicei nu depășește 30 de unități și poate ajunge până la 4-5 unități.

În comerț, se recurge la o dimensiune minimă a eșantionului atunci când un eșantion mare fie nu este posibil, fie nu este practic (de exemplu, dacă studiul implică deteriorarea sau distrugerea probelor examinate).

Valoarea erorii unui eșantion mic este determinată de formule diferite de formulele pentru observarea eșantionului cu o dimensiune relativ mare a eșantionului (n>100). Eroarea medie a unui eșantion mic u(mu)m.v. calculat prin formula:

um.v \u003d rădăcină (Gsquare (m.v.) . / n),

unde Gsquare(m.v.) este varianța unui eșantion mic. *aceasta este sigma*

Conform formulei (numărul este acolo) avem:

G0pătrat=Gpătrat *n/ (n-1).

Dar întrucât cu un eșantion mic n/(n-1) este semnificativ, calculul varianței unui eșantion mic se face ținând cont de așa-numitul număr de grade de libertate. Numărul de grade de libertate este înțeles ca numărul de opțiuni care pot lua valori arbitrare fără a modifica valoarea medie. Când se determină varianța Gpătrat, numărul de grade de libertate este n-1:

Gpătrat (m.v.) \u003d suma (xi-x (cu o linie ondulată)) / (n-1).

Eroarea marginală a unui eșantion mic Dm.v. (semnul triunghiului) este determinată de formula:

În acest caz, valoarea coeficientului de încredere t depinde nu numai de probabilitatea de încredere dată, ci și de numărul de unități de eșantion n. Pentru valorile individuale ale lui t și n, probabilitatea de încredere a unui eșantion mic este determinată de tabele speciale Student, în care sunt date distribuțiile abaterilor standardizate:

t= (x(cu linie ondulată) –x(cu linie)) / Gm.v.

Tabelele elevilor sunt date în manuale de statistică matematică. Iată câteva valori din aceste tabele care caracterizează probabilitatea ca eroarea marginală a unui eșantion mic să nu depășească de t ori eroarea medie:

St=P[(x(cu o linie ondulată) –x(cu o linie)

Pe măsură ce dimensiunea eșantionului crește, distribuția Student se apropie de distribuția normală, iar la 20 ea diferă deja puțin de distribuția normală.

Atunci când se efectuează anchete cu eșantionuri mici, este important să rețineți că, cu cât dimensiunea eșantionului este mai mică, cu atât este mai mare diferența dintre distribuția Studentului și distributie normala. Cu o dimensiune minimă a eșantionului (n=4), această diferență este foarte semnificativă, ceea ce indică o scădere a preciziei rezultatelor unui eșantion mic.

Prin intermediul unui eșantion mic în comerț se rezolvă o serie de probleme practice, în primul rând, stabilirea unei limite în care se află media generală a trăsăturii studiate.

Deoarece la efectuarea unui eșantion mic, valoarea de 0,95 sau 0,99 este practic luată ca probabilitate de încredere, atunci pentru a determina eroarea marginală de eșantionare Dm.v. Sunt utilizate următoarele citiri de distribuție a Studentului.

Eșantioane în care observația acoperă un număr mic de unități (n< 30), принято называть малыми выборками. Они обычно применяются в том случае, когда невозможно или нецелесообразно использовать большую выборку (исследование качества продукции, если это связано с ее разрушением, в частности на прочность, на продолжительность срока службы и т.д.).

Eroarea marginală a unui eșantion mic este determinată de formula:

Eroarea medie a unui eșantion mic:

unde este varianța unui eșantion mic:

unde este valoarea medie a caracteristicii din eșantion;

Numărul de grade de libertate

Coeficientul de încredere al unui eșantion mic, care depinde nu numai de o probabilitate de încredere dată, ci și de numărul de unități de eșantion.

Probabilitatea ca media generală să se încadreze în anumite limite este determinată de formulă

unde este valoarea funcției Student.

Pentru a calcula coeficientul de încredere, valoarea funcției este determinată de formula:

Apoi, conform tabelului de distribuție a Studentului (vezi Anexa 4), în funcție de valoarea funcției și numărul de grade, se determină valoarea.

Funcția este, de asemenea, utilizată pentru a determina probabilitățile ca abaterea normalizată reală să nu depășească valoarea tabelului.


Tema 7. Studiul statistic al relaţiei: Conceptul de conexiune statistică. Tipuri și forme de conexiune statistică. Sarcini de studiu statistic al relaţiei fenomenelor. Caracteristici ale legăturilor fenomenelor socio-economice. Metode de bază de studiu statistic al relațiilor.

corelație - o relație care nu apare în fiecare caz individual, ci în masa de cazuri în valori medii sub forma unei tendințe.

Studiu statistic urmărește obținerea unui model de dependență pentru acesta uz practic. Rezolvarea acestei probleme se realizează în următoarea secvență.

1. Analiza logică a esenței fenomenului studiat și a relațiilor cauză-efect. Ca urmare, indicatorul de performanță este setat (y), factori ai schimbării sale, caracterizați prin indicatori (x (, x 2, x 3,..., X"). Relația dintre două caracteristici (lași X) numit corelație de pereche. Se numește influența mai multor factori asupra caracteristicii eficiente corelație multiplă.

În direcția generală de comunicare poate fi Dreptși verso. Cu legături directe cu o creștere a trăsăturii X creste si semnul y, cu revers – cu o creștere a semnului X semn la scade.

2. Colectarea informațiilor primare și verificarea omogenității și distribuției normale a acestora. Pentru aprecierea omogenității populației se folosește coeficientul de variație după caracteristicile factorilor

Mulțimea este considerată omogenă dacă coeficientul de variație nu depășește 33%. Verificarea normalității distribuției semnelor factorilor studiate ( x ( , x 2 , x 3 ,..., X") efectuate folosind regula trei sigma. Rezultatele testului pentru distribuția normală trebuie prezentate sub formă de tabel.

Statistici pentru eșantion mici

Este general acceptat că începutul lui S. m. sau, așa cum este adesea numită, statistica „n mic”, a fost stabilită în primul deceniu al secolului XX prin publicarea lucrării lui W. Gosset, în care a plasat distribuția t postulată de „studentul” care a câștigat ulterior faima mondială. La acea vreme, Gosset lucra ca statistician pentru fabricile de bere Guinness. Una dintre sarcinile sale era să analizeze loturi succesive de butoaie de stout proaspăt preparate. Din motive pe care nu le-a explicat niciodată cu adevărat, Gosset a experimentat ideea de a reduce foarte mult numărul de probe prelevate din un numar mare butoaie în depozitele fabricii de bere, pentru controlul selectiv al calității portarului. Acest lucru l-a determinat să postuleze distribuția t. Deoarece charta fabricilor de bere Guinness le-a interzis angajaților lor să publice rezultatele studiului, Gosset a publicat în mod anonim rezultatele experimentului său care compară controlul calității eșantionării utilizând o distribuție t a eșantionului mic și o distribuție z tradițională (distribuție normală), în mod anonim. pseudonim „Student” (Student - de unde provine numele t-distribuția Studentului).

distribuție t. Teoria distribuției t, ca și teoria distribuției z, este folosită pentru a testa ipoteza nulă că cele două eșantioane sunt pur și simplu eșantioane aleatorii din aceeași populație și, prin urmare, statisticile calculate (de exemplu, media și deviație standard) fiind estimări imparțiale ale parametrilor populației generale. Cu toate acestea, spre deosebire de teoria distribuției normale, teoria distribuției t pentru eșantioane mici nu necesită cunoștințe a priori sau estimări exacte așteptări matematiceși varianța populației generale. Mai mult, deși testarea diferenței dintre mediile a două eșantioane mari pentru semnificația statistică necesită o presupunere fundamentală despre distribuția normală a caracteristicilor populației, teoria distribuției t nu necesită ipoteze despre parametri.

Este bine cunoscut faptul că caracteristicile distribuite în mod normal sunt descrise de o singură curbă - curba Gauss, care satisface următoarea ecuație:

Cu o distribuție t, o întreagă familie de curbe este reprezentată de următoarea formulă:

De aceea, ecuația pentru t include funcția gamma, ceea ce în matematică înseamnă că pe măsură ce n se modifică această ecuație va satisface o altă curbă.

Grade de libertate

În ecuația pentru t, n denotă numărul de grade de libertate (df) asociat cu estimarea varianței populației (S2), care este al doilea moment al oricărei funcții generatoare de momente, cum ar fi ecuația pentru distribuția t. În S., numărul de grade de libertate indică câte caracteristici au rămas libere după utilizarea lor parțială într-un anumit tip de analiză. Într-o distribuție t, una dintre abaterile de la media eșantionului este întotdeauna fixă, deoarece suma tuturor acestor abateri trebuie să fie egală cu zero. Acest lucru afectează suma pătratelor atunci când se calculează varianța eșantionului ca o estimare imparțială a parametrului S2 și duce la faptul că se obține df egală cu numărul măsurători minus una pentru fiecare probă. Prin urmare, în formulele și procedurile de calcul a statisticilor t pentru testarea ipotezei nule df = n - 2.

Diviziunea F-spațială. Ipoteza nulă testată prin testul t este că cele două eșantioane au fost extrase aleatoriu din aceeași populație sau au fost extrase aleatoriu din două populații diferite cu aceeași varianță. Dar dacă trebuie să analizați mai multe grupuri? Răspunsul la această întrebare a fost căutat timp de douăzeci de ani după ce Gosset a descoperit distribuția t. Doi dintre cei mai proeminenți statisticieni ai secolului al XX-lea au fost implicați direct în producerea acestuia. Unul - cel mai mare statistician englez R. A. Fisher, care a propus prima teorie. formulări, a căror dezvoltare a condus la distribuția F; lucrarea sa despre teoria eșantioanelor mici, care dezvoltă ideile lui Gosset, a fost publicată la mijlocul anilor 1920 (Fisher, 1925). Un altul este George Snedecor, unul dintre primii statisticieni americani, care a dezvoltat o modalitate de a compara două eșantioane independente de orice dimensiune prin calcularea raportului a două estimări ale varianței. El a numit acest raport raportul F, după Fischer. Rezultatele cercetării. Snedecor a condus la faptul că distribuția F a început să fie specificată ca distribuție a raportului a două statistici c2, fiecare cu propriile grade de libertate:

De aici a rezultat lucrarea clasică a lui Fisher privind analiza varianței, o tehnică statistică orientată în mod explicit către analiza eșantioanelor mici.

Distribuția de eșantionare F (unde n = df) este reprezentată de următoarea ecuație:

Ca și în cazul distribuției t, funcția gamma indică faptul că există o familie de distribuții care satisfac ecuația pentru F. În acest caz însă, analiza include două mărimi de df: numărul de grade de libertate pentru numărător și pentru numitorul raportului F.

Tabele pentru estimarea statisticilor t și F. Când testați ipoteza nulă folosind C. pe baza teoriei eșantioanelor mari, de obicei este necesar un singur tabel de referință - tabelul abaterilor normale (z), care vă permite să determinați aria de sub curba normală între oricare două valori de z pe axa x. Cu toate acestea, tabelele pentru distribuțiile t și F sunt prezentate în mod necesar într-un set de tabele, deoarece aceste tabele se bazează pe distribuții multiple rezultate din variarea numărului de grade de libertate. Deși distribuțiile t și F sunt distribuții de densitate de probabilitate, ca și distribuția normală pentru eșantioane mari, ele diferă de acestea din urmă în ceea ce privește cele patru momente utilizate pentru a le descrie. Distribuția t, de exemplu, este simetrică (observați t2 în ecuația sa) pentru toate df, dar devine din ce în ce mai maximă pe măsură ce dimensiunea eșantionului scade. Curbele cu vârf (cu curtoză mai mare decât normală) tind să fie mai puțin asimptotice (adică, mai aproape de axa x la capetele distribuției) decât curbele cu kurtoză normală, cum ar fi curba Gauss. Această diferență duce la discrepanțe vizibile între punctele de pe axa x corespunzătoare valorilor lui t și z. Cu df = 5 și nivel bilateral a egal cu 0,05, t = 2,57, în timp ce z-ul corespunzător = 1,96. Prin urmare, t = 2,57 indică semnificație statistică la nivelul de 5%. Totuși, în cazul unei curbe normale, z = 2,57 (mai precis 2,58) ar indica deja un nivel de semnificație statistică de 1%. Se pot face comparații similare cu distribuția F, deoarece t este egal cu F atunci când numărul de eșantioane este două.

Ce constituie un eșantion „mic”?

La un moment dat, s-a pus întrebarea cât de mare ar trebui să fie eșantionul pentru a fi considerat mic. Pur și simplu nu există un răspuns definitiv la această întrebare. Cu toate acestea, se obișnuiește să se considere df = 30 ca o limită condiționată între un eșantion mic și un eșantion mare.Baza pentru această decizie oarecum arbitrară este rezultatul comparării distribuției t cu distribuția normală. După cum sa menționat mai sus, discrepanța dintre valorile lui t și z tinde să crească odată cu descreșterea și să scadă odată cu creșterea df. De fapt, t începe să se apropie de z cu mult înainte de cazul limită când t = z pentru df = ∞. O simplă examinare vizuală a valorilor tabelare ale lui t vă permite să vedeți că această aproximare devine destul de rapidă, începând de la df = 30 și mai sus. Valorile comparative ale lui t (la df = 30) și z sunt, respectiv: 2,04 și 1,96 pentru p = 0,05; 2,75 și 2,58 pentru p = 0,01; 3,65 și 3,29 pentru p = 0,001.

Alte statistici pentru mostre „mici”.

Deși testele statistice precum t și F sunt concepute special pentru a fi aplicate eșantioanelor mici, ele sunt la fel de aplicabile și eșantioanelor mari. Există, totuși, multe altele. metode statistice, destinat analizei probelor mici și adesea folosit în acest scop. Ei înseamnă așa-numitul. metode neparametrice sau fără distribuție. Practic, S. care apar în aceste metode sunt destinate a fi aplicate măsurătorilor obținute folosind scale care nu satisfac definiția scalelor de rapoarte sau intervale. Cel mai adesea acestea sunt măsurători ordinale (de rang) sau nominale. S. neparametrică nu necesită ipoteze despre parametrii distribuției, în special, în ceea ce privește estimările de varianță, deoarece scalele ordinale și nominale exclud însuși conceptul de varianță. Din acest motiv, metodele neparametrice sunt utilizate și pentru măsurătorile obținute folosind scale de interval și raport atunci când sunt analizate eșantioane mici și există posibilitatea ca ipotezele de bază necesare aplicării metodelor parametrice să fie încălcate. Printre astfel de C., care pot fi aplicate în mod rezonabil la eșantioane mici, se numără: testul probabilității exacte al lui Fisher, analiza neparametrică (rang) a varianței cu doi factori a lui Friedman, coeficientul de corelație a rangului Kendall t, coeficientul de concordanță al lui Kendall (W), criteriul H al lui Kruskal. - Wallace pentru analiza neparametrică (rang) unidirecțională a varianței, testul U Mann-Whitney, testul mediană, testul semnului, coeficientul de corelație a rangului Spearman r și testul t Wilcoxon.

La controlul calității mărfurilor în cercetarea economică, experimentul poate fi efectuat pe baza unui eșantion mic.

Sub mostra mica se înțelege ca o anchetă statistică necontinuă, în care populația eșantion este formată dintr-un număr relativ mic de unități ale populației generale. Volumul unei probe mici de obicei nu depășește 30 de unități și poate ajunge până la 4 - 5 unități.

Eroarea medie a unui eșantion mic este calculată prin formula:

,

Unde
este varianța unui eșantion mic.

La determinarea varianţei numărul de grade de libertate este n-1:

.

Eroarea marginală a unui eșantion mic
este determinat de formula

În acest caz, valoarea coeficientului de încredere t depinde nu numai de probabilitatea de încredere dată, ci și de numărul de unități de eșantion n. Pentru valorile individuale ale lui t și n, probabilitatea de încredere a unui eșantion mic este determinată de tabele speciale Student (Tabelul 9.1.), în care sunt date distribuțiile abaterilor standardizate:

.

Deoarece, atunci când se efectuează un eșantion mic, valoarea de 0,59 sau 0,99 este practic luată ca probabilitate de încredere, atunci pentru a determina eroarea marginală a unui eșantion mic
Sunt utilizate următoarele citiri ale distribuției t:

Metode de extindere a caracteristicilor eșantionului la populația generală.

Metoda de eșantionare este folosită cel mai adesea pentru a obține caracteristicile populației generale în funcție de indicatorii relevanți ai eșantionului. În funcție de obiectivele cercetării, aceasta se realizează fie prin recalcularea directă a indicatorilor eșantionului pentru populația generală, fie prin calcularea factorilor de corecție.

metoda de calcul direct. Constă în faptul că indicatorii eşantionului împart sau mediu se extinde la populația generală, ținând cont de eroarea de eșantionare.

Deci, în comerț, se determină numărul de produse nestandard primite într-un lot de mărfuri. Pentru a face acest lucru (ținând cont de gradul de probabilitate acceptat), indicatorii ponderii produselor nestandard din eșantion sunt înmulțiți cu numărul de produse din întregul lot de mărfuri.

Metoda factorilor de corecție. Este utilizat în cazurile în care scopul metodei de eșantionare este de a rafina rezultatele contabilității complete.

În practica statistică, această metodă este utilizată pentru a rafina datele recensământurilor anuale ale animalelor deținute de populație. Pentru a face acest lucru, după rezumarea datelor de contabilitate completă, se practică o anchetă prin eșantion de 10% cu determinarea așa-numitului „procent de subestimare”.

Metode de selectare a unităților din populația generală.

În statistică, se folosesc diverse metode de formare a seturilor de probe, care este determinată de obiectivele studiului și depinde de specificul obiectului de studiu.

Principala condiție pentru efectuarea unei anchete prin sondaj este prevenirea apariției erorilor sistematice care decurg din încălcarea principiului egalității de șanse pentru fiecare unitate a populației generale de a intra în eșantion. Prevenirea erorilor sistematice se realizează ca urmare a utilizării metodelor bazate științific pentru formarea unei populații eșantion.

Există următoarele modalități de a selecta unități din populația generală:

1) selecție individuală - unitățile individuale sunt selectate în eșantion;

2) selecția grupului - în eșantion se încadrează grupuri sau serii de unități în studiu calitativ omogene;

3) selecția combinată este o combinație de selecție individuală și de grup.

Metodele de selecție sunt determinate de regulile de formare a populației de eșantionare.

Eșantionul poate fi:

De fapt-aleatorie;

Mecanic;

tipic;

Serial;

Combinate.

Eșantionare auto-aleatorie constă în faptul că eşantionul se formează ca urmare a selecţiei aleatorii (neintenţionate) a unităţilor individuale din populaţia generală. În acest caz, numărul de unități selectate în setul de eșantion este de obicei determinat pe baza proporției acceptate din eșantion.

Ponderea eșantionului este raportul dintre numărul de unități din populația eșantion n și numărul de unități din populația generală N, i.e.

.

Deci, cu o probă de 5% dintr-un lot de mărfuri de 2.000 de unități. dimensiunea eșantionului n este de 100 de unități. (5 * 2000:100), iar cu o probă de 20% vor fi 400 de unități. (20*2000:100) etc.

Prelevare mecanică constă în faptul că selecţia unităţilor din eşantion se face din populaţia generală, împărţită în intervale (grupe) egale. În acest caz, mărimea intervalului în populația generală este egală cu reciproca proporției eșantionului.

Deci, cu un eșantion de 2%, se selectează fiecare a 50-a unitate (1:0,02), cu un eșantion de 5%, fiecare a 20-a unitate (1:0,05), etc.

Astfel, în conformitate cu proporția acceptată de selecție, populația generală este, parcă, împărțită mecanic în grupuri egale. Doar o unitate este selectată din fiecare grup din eșantion.

O caracteristică importantă a eșantionării mecanice este că formarea unei populații de eșantion poate fi efectuată fără a recurge la listare. În practică, este adesea folosită ordinea în care sunt plasate efectiv unitățile de populație. De exemplu, secvența de producție a produselor finite dintr-un transportor sau linie de producție, ordinea în care unitățile dintr-un lot de mărfuri sunt plasate în timpul depozitării, transportului, vânzării etc.

Probă tipică. Cu un eșantion tipic, populația este mai întâi împărțită în grupuri tipice omogene. Apoi, din fiecare grup tipic, o selecție individuală a unităților din eșantion este făcută printr-un eșantion aleator sau mecanic.

Eșantionarea tipică este de obicei utilizată în studiul populațiilor statistice complexe. De exemplu, într-un sondaj eșantion al productivității muncii a lucrătorilor din comerț, constând din grupuri separate în funcție de calificări.

O caracteristică importantă a unui eșantion tipic este că oferă rezultate mai precise în comparație cu alte metode de selectare a unităților dintr-o populație de eșantion.

Pentru determinare eroare medie Un eșantion tipic utilizează următoarele formule:

reselectare

,

selecție nerepetitivă

,

Dispersia este determinată de următoarele formule:

,

La o singură etapăÎn eșantion, fiecare unitate selectată este imediat supusă studiului pe o bază dată. Acesta este cazul eșantionării corecte aleatorii și în serie.

La în mai multe etape eșantionul este selectat din populația generală a grupurilor individuale, iar unitățile individuale sunt selectate din grupuri. Așa se face un eșantion tipic cu o metodă mecanică de selectare a unităților din populația eșantionului.

Combinate proba poate fi în două etape. În acest caz, populația generală este mai întâi împărțită în grupuri. Apoi sunt selectate grupurile, iar în cadrul acestora din urmă sunt selectate unități individuale.

La controlul calității mărfurilor în cercetarea economică, experimentul poate fi efectuat pe baza unui eșantion mic.

Sub mostra mica se înțelege ca o anchetă statistică necontinuă, în care populația eșantion este formată dintr-un număr relativ mic de unități ale populației generale. Volumul unei probe mici de obicei nu depășește 30 de unități și poate ajunge până la 4 - 5 unități.

Eroarea medie a unui eșantion mic este calculată prin formula:

,

Unde
este varianța unui eșantion mic.

La determinarea varianţei numărul de grade de libertate este n-1:

.

Eroarea marginală a unui eșantion mic
este determinat de formula

În acest caz, valoarea coeficientului de încredere t depinde nu numai de probabilitatea de încredere dată, ci și de numărul de unități de eșantion n. Pentru valorile individuale ale lui t și n, probabilitatea de încredere a unui eșantion mic este determinată de tabele speciale Student (Tabelul 9.1.), în care sunt date distribuțiile abaterilor standardizate:

.

Deoarece, atunci când se efectuează un eșantion mic, valoarea de 0,59 sau 0,99 este practic luată ca probabilitate de încredere, atunci pentru a determina eroarea marginală a unui eșantion mic
Sunt utilizate următoarele citiri ale distribuției t:

Metode de extindere a caracteristicilor eșantionului la populația generală.

Metoda de eșantionare este folosită cel mai adesea pentru a obține caracteristicile populației generale în funcție de indicatorii relevanți ai eșantionului. În funcție de obiectivele cercetării, aceasta se realizează fie prin recalcularea directă a indicatorilor eșantionului pentru populația generală, fie prin calcularea factorilor de corecție.

metoda de calcul direct. Constă în faptul că indicatorii eşantionului împart sau mediu se extinde la populația generală, ținând cont de eroarea de eșantionare.

Deci, în comerț, se determină numărul de produse nestandard primite într-un lot de mărfuri. Pentru a face acest lucru (ținând cont de gradul de probabilitate acceptat), indicatorii ponderii produselor nestandard din eșantion sunt înmulțiți cu numărul de produse din întregul lot de mărfuri.

Metoda factorilor de corecție. Este utilizat în cazurile în care scopul metodei de eșantionare este de a rafina rezultatele contabilității complete.

În practica statistică, această metodă este utilizată pentru a rafina datele recensământurilor anuale ale animalelor deținute de populație. Pentru a face acest lucru, după rezumarea datelor de contabilitate completă, se practică o anchetă prin eșantion de 10% cu determinarea așa-numitului „procent de subestimare”.

Metode de selectare a unităților din populația generală.

În statistică, se folosesc diverse metode de formare a seturilor de probe, care este determinată de obiectivele studiului și depinde de specificul obiectului de studiu.

Principala condiție pentru efectuarea unei anchete prin sondaj este prevenirea apariției erorilor sistematice care decurg din încălcarea principiului egalității de șanse pentru fiecare unitate a populației generale de a intra în eșantion. Prevenirea erorilor sistematice se realizează ca urmare a utilizării metodelor bazate științific pentru formarea unei populații eșantion.

Există următoarele modalități de a selecta unități din populația generală:

1) selecție individuală - unitățile individuale sunt selectate în eșantion;

2) selecția grupului - în eșantion se încadrează grupuri sau serii de unități în studiu calitativ omogene;

3) selecția combinată este o combinație de selecție individuală și de grup.

Metodele de selecție sunt determinate de regulile de formare a populației de eșantionare.

Eșantionul poate fi:

De fapt-aleatorie;

Mecanic;

tipic;

Serial;

Combinate.

Eșantionare auto-aleatorie constă în faptul că eşantionul se formează ca urmare a selecţiei aleatorii (neintenţionate) a unităţilor individuale din populaţia generală. În acest caz, numărul de unități selectate în setul de eșantion este de obicei determinat pe baza proporției acceptate din eșantion.

Ponderea eșantionului este raportul dintre numărul de unități din populația eșantion n și numărul de unități din populația generală N, i.e.

.

Deci, cu o probă de 5% dintr-un lot de mărfuri de 2.000 de unități. dimensiunea eșantionului n este de 100 de unități. (5 * 2000:100), iar cu o probă de 20% vor fi 400 de unități. (20*2000:100) etc.

Prelevare mecanică constă în faptul că selecţia unităţilor din eşantion se face din populaţia generală, împărţită în intervale (grupe) egale. În acest caz, mărimea intervalului în populația generală este egală cu reciproca proporției eșantionului.

Deci, cu un eșantion de 2%, se selectează fiecare a 50-a unitate (1:0,02), cu un eșantion de 5%, fiecare a 20-a unitate (1:0,05), etc.

Astfel, în conformitate cu proporția acceptată de selecție, populația generală este, parcă, împărțită mecanic în grupuri egale. Doar o unitate este selectată din fiecare grup din eșantion.

O caracteristică importantă a eșantionării mecanice este că formarea unei populații de eșantion poate fi efectuată fără a recurge la listare. În practică, este adesea folosită ordinea în care sunt plasate efectiv unitățile de populație. De exemplu, secvența de producție a produselor finite dintr-un transportor sau linie de producție, ordinea în care unitățile dintr-un lot de mărfuri sunt plasate în timpul depozitării, transportului, vânzării etc.

Probă tipică. Cu un eșantion tipic, populația este mai întâi împărțită în grupuri tipice omogene. Apoi, din fiecare grup tipic, o selecție individuală a unităților din eșantion este făcută printr-un eșantion aleator sau mecanic.

Eșantionarea tipică este de obicei utilizată în studiul populațiilor statistice complexe. De exemplu, într-un sondaj eșantion al productivității muncii a lucrătorilor din comerț, constând din grupuri separate în funcție de calificări.

O caracteristică importantă a unui eșantion tipic este că oferă rezultate mai precise în comparație cu alte metode de selectare a unităților dintr-o populație de eșantion.

Pentru a determina eroarea medie a unui eșantion tipic, se folosesc următoarele formule:

reselectare

,

selecție nerepetitivă

,

Dispersia este determinată de următoarele formule:

,

La o singură etapăÎn eșantion, fiecare unitate selectată este imediat supusă studiului pe o bază dată. Acesta este cazul eșantionării corecte aleatorii și în serie.

La în mai multe etape eșantionul este selectat din populația generală a grupurilor individuale, iar unitățile individuale sunt selectate din grupuri. Așa se face un eșantion tipic cu o metodă mecanică de selectare a unităților din populația eșantionului.

Combinate proba poate fi în două etape. În acest caz, populația generală este mai întâi împărțită în grupuri. Apoi sunt selectate grupurile, iar în cadrul acestora din urmă sunt selectate unități individuale.

Acțiune