Kis minták elemzése és az eredmények leírása. Bootstrap, kis minták, alkalmazás adatelemzésben

A közgazdasági kutatás során az áruk minőségének ellenőrzésekor a kísérlet kis minta alapján is elvégezhető.

Alatt kis minta alatt nem folyamatos statisztikai felmérést értünk, amelyben a minta sokaságát az általános sokaság viszonylag kis számú egységéből alakítják ki. Egy kis minta térfogata általában nem haladja meg a 30 egységet, és elérheti a 4-5 egységet is.

A kereskedelemben a minimális mintanagysághoz folyamodnak, ha a nagy minta nem lehetséges, vagy nem praktikus (például ha a vizsgálat a vizsgált minták károsodásával vagy megsemmisítésével jár).

A kis minta hibájának értékét a viszonylag nagy mintaméretű (n>100) mintamegfigyelés képleteitől eltérő képletek határozzák meg. Kis minta átlagos hibája u(mu)m.v. képlettel számolva:

um.v \u003d gyökér (Gnégyzet (m.v.) . / n),

ahol Gsquare(m.v.) egy kis minta szórása. *ez a szigma*

A képlet szerint (a szám ott van) a következőket kapjuk:

G0négyzet=Gnégyzet *n/ (n-1).

De mivel kis mintánál n / (n-1) szignifikáns, a kis minta szórásának számítása az úgynevezett szabadsági fokok számának figyelembevételével történik. A szabadsági fokok száma alatt azon opciók számát értjük, amelyek tetszőleges értékeket vehetnek fel az átlagérték megváltoztatása nélkül. A Gsquare variancia meghatározásakor a szabadsági fokok száma n-1:

Gnégyzet (m.v.) \u003d összeg (xi-x (hullámvonallal)) / (n-1).

Egy kis minta Dm.v határhibáját (háromszög jel) a következő képlet határozza meg:

Ebben az esetben a t konfidencia együttható értéke nemcsak az adott konfidenciavalószínűségtől függ, hanem az n mintaegységek számától is. A t és n egyedi értékeire egy kis minta konfidenciavalószínűségét speciális Student-táblázatok határozzák meg, amelyekben megadják a szabványos eltérések eloszlását:

t= (x(hullámvonallal) –x(vonallal)) / Gm.v.

A tanulói táblázatokat a matematikai statisztika tankönyvei tartalmazzák. Íme néhány érték ezekből a táblázatokból, amelyek annak valószínűségét jellemzik, hogy egy kis minta határhibája nem haladja meg az átlagos hiba t-szeresét:

St=P[(x(hullámos vonallal) –x(vonallal)

A minta méretének növekedésével a Student-féle eloszlás megközelíti a normál eloszlást, és 20-nál már alig tér el a normál eloszlástól.

Kis mintás felmérések végzésekor fontos szem előtt tartani, hogy minél kisebb a mintanagyság, annál nagyobb a különbség a Student-féle megoszlás, ill. normális eloszlás. Minimális mintanagyságnál (n=4) ez a különbség nagyon szignifikáns, ami a kis minta eredményeinek pontosságának csökkenését jelzi.

A kereskedelemben egy kis minta segítségével számos gyakorlati probléma megoldódik, mindenekelőtt egy határ megállapítása, amelyben a vizsgált tulajdonság általános átlaga található.

Mivel kis mintavételnél gyakorlatilag a 0,95 vagy 0,99 értéket veszik konfidenciavalószínűségnek, így a határmintavételi hiba meghatározásához Dm.v. A következő Student-féle eloszlási értékek kerülnek felhasználásra.

Olyan minták, amelyekben a megfigyelés kis számú egységet fed le (n< 30), принято называть малыми выборками. Они обычно применяются в том случае, когда невозможно или нецелесообразно использовать большую выборку (исследование качества продукции, если это связано с ее разрушением, в частности на прочность, на продолжительность срока службы и т.д.).

Egy kis minta határhibáját a következő képlet határozza meg:

Egy kis minta átlagos hibája:

hol van egy kis minta szórása:

ahol a jellemző átlagos értéke a mintában;

A szabadságfokok száma

Kis minta konfidencia együtthatója, amely nem csak egy adott konfidenciavalószínűségtől, hanem a mintaegységek számától is függ.

A képlet határozza meg annak valószínűségét, hogy az általános átlag bizonyos határok között van

ahol a Student-függvény értéke.

A megbízhatósági együttható kiszámításához a függvény értékét a következő képlet határozza meg:

Ezután a Student-féle eloszlási táblázat szerint (lásd 4. melléklet) a függvény értékétől és a fokszámoktól függően megtörténik az érték meghatározása.

A függvény arra is szolgál, hogy meghatározza annak valószínűségét, hogy a tényleges normalizált eltérés nem haladja meg a táblázat értékét.


7. témakör A kapcsolat statisztikai vizsgálata: A statisztikai összefüggés fogalma. A statisztikai kapcsolatok típusai és formái. A jelenségek kapcsolatának statisztikai vizsgálatának feladatai. A társadalmi-gazdasági jelenségek összefüggéseinek jellemzői. Az összefüggések statisztikai vizsgálatának alapvető módszerei.

korreláció - olyan kapcsolat, amely nem minden egyes esetben jelenik meg, hanem az esetek tömegében átlagos értékekben, trend formájában.

Statisztikai tanulmány arra törekszik, hogy függőségi modellt kapjon gyakorlati használat. A probléma megoldását a következő sorrendben hajtjuk végre.

1. A vizsgált jelenség lényegének és ok-okozati összefüggéseinek logikai elemzése. Ennek eredményeként a teljesítménymutató be van állítva (y), változásának tényezőit, mutatókkal jellemezve (x (, x 2, x 3,..., X"). Két jellemző kapcsolata (nál nélÉs X) hívott páros korreláció. Számos tényező hatását a hatásos jellemzőre ún többszörös korreláció.

A kommunikáció általános irányában lehet egyenesÉs fordított. Közvetlen kapcsolatokkal a tulajdonság növekedésével x a jel is növekszik y, fordított - előjel növekedésével x jel nál nél csökken.

2. Elsődleges információk összegyűjtése, homogenitási és normál eloszlási ellenőrzése. A sokaság homogenitásának értékeléséhez a faktorjellemzők szerinti variációs együtthatót használjuk

A halmaz akkor tekinthető homogénnek, ha a variációs együttható nem haladja meg a 33%-ot. A vizsgált faktorjelek eloszlásának normalitásának ellenőrzése ( x ( , x 2 , x 3 ,..., X") a három szigma szabály alapján történik. A normál eloszlás vizsgálatának eredményeit táblázatos formában kell bemutatni.

Kismintás statisztikák

Általánosan elfogadott, hogy az eleje S. m. vagy ahogy szokták nevezni: „kis n” statisztika, a 20. század első évtizedében jött létre W. Gosset munkája publikálásával, amelyben a „tanuló” által feltételezett t-eloszlást helyezte el. később világhírre tett szert. Gosset akkoriban statisztikusként dolgozott a Guinness sörfőzdéknél. Egyik feladata az volt, hogy elemezze a frissen főzött stout hordóinak egymást követő tételeit. Olyan okok miatt, amelyeket soha nem magyarázott meg igazán, Gosset azzal az ötlettel kísérletezett, hogy jelentősen csökkentse a egy nagy szám hordók a sörfőzde raktáraiban, a portás szelektív minőségellenőrzésére. Ez arra késztette, hogy feltegye a t-eloszlást. Mivel a Guinness sörfőzdék alapszabálya megtiltotta alkalmazottaik számára a tanulmány eredményeinek közzétételét, Gosset a mintavétel minőség-ellenőrzését kismintás t-eloszlást és hagyományos z-eloszlást (normál eloszlást) alkalmazó kísérletének eredményeit anonim módon tette közzé. "Student" álnév (Student - honnan származik a t-Student elnevezése).

t-eloszlás. A t-eloszláselméletet a z-eloszláselmélethez hasonlóan a tesztelésre használjuk null hipotézist hogy a két minta egyszerűen véletlenszerű minta ugyanabból a sokaságból, és ezért a számított statisztikák (pl. átlag és szórás) az általános sokaság paramétereinek elfogulatlan becslései. A normál eloszlás elméletétől eltérően azonban a kis minták t-eloszlásának elmélete nem igényel előzetes ismereteket vagy pontos becsléseket matematikai elvárásés az általános populáció varianciája. Sőt, bár két nagy minta átlaga közötti különbség statisztikai szignifikancia szempontjából történő tesztelése alapvető feltételezést igényel a sokaság jellemzőinek normális eloszlásáról, a t-eloszláselmélet nem követeli meg a paraméterekre vonatkozó feltételezéseket.

Köztudott, hogy a normál eloszlású jellemzőket egyetlen görbe írja le - a Gauss-görbe, amely kielégíti a következő egyenletet:

T-eloszlás esetén a görbék egész családját a következő képlet ábrázolja:

Ezért a t egyenlete tartalmazza a gamma-függvényt, ami a matematikában azt jelenti, hogy ahogy n változik ezt az egyenletet egy másik görbét is kielégít.

A szabadság fokai

A t egyenletében n jelöli a sokaságvariancia-becsléshez (S2) társított szabadsági fokok számát (df), amely a pillanatok bármely generáló függvényének, például a t-eloszlás egyenletének második momentuma. Az S.-ben a szabadsági fokok száma azt jelzi, hogy hány jellemző maradt szabadon egy bizonyos típusú elemzésben való részleges felhasználásuk után. A t-eloszlásban a mintaátlagtól való eltérések egyike mindig rögzített, mivel az összes ilyen eltérés összegének nullával kell egyenlőnek lennie. Ez befolyásolja a négyzetek összegét, amikor a minta varianciáját az S2 paraméter torzítatlan becsléseként számítjuk ki, és azt a tényt eredményezi, hogy df-t kapunk. egyenlő a számmal mérések mínusz egy minden mintára. Ezért a t-statisztika számítási képleteiben és eljárásaiban a nullhipotézis teszteléséhez df = n - 2.

F-tér felosztás. A t-próbával tesztelt nullhipotézis az, hogy a két mintát véletlenszerűen ugyanabból a sokaságból vették, vagy véletlenszerűen két különböző populációból, azonos varianciával. De mi van akkor, ha több csoportot kell elemeznie? Erre a kérdésre húsz évig keresték a választ, miután Gosset felfedezte a t-eloszlást. A 20. század két legkiemelkedőbb statisztikusa közvetlenül részt vett a készítésében. Az egyik - a legnagyobb angol statisztikus R. A. Fisher, aki javasolta az első elméletet. készítmények, amelyek fejlesztése az F-eloszláshoz vezetett; az 1920-as évek közepén jelent meg a kis minták elméletével foglalkozó, Gosset elképzeléseit fejlesztő munkája (Fisher, 1925). Egy másik George Snedecor, az egyik első amerikai statisztikus, aki kifejlesztett egy módszert két független, tetszőleges méretű minta összehasonlítására a variancia két becslésének arányának kiszámításával. Ezt az arányt Fischer után F-aránynak nevezte. Kutatási eredmények. Snedekor oda vezetett, hogy az F-eloszlást két, saját szabadságfokkal rendelkező c2 statisztika arányának eloszlásaként kezdték meghatározni:

Ebből született Fisher klasszikus varianciaanalízis-műve, amely statisztikai technika kifejezetten a kis minták elemzésére irányul.

Az F mintavételi eloszlást (ahol n = df) a következő egyenlet ábrázolja:

Akárcsak a t-eloszlás esetében, a gamma-függvény azt jelzi, hogy létezik olyan eloszláscsalád, amely kielégíti az F egyenletét. Ebben az esetben azonban az elemzés két df-mennyiséget tartalmaz: a szabadságfokok számát az F-re. számláló és az F-arány nevezője.

Táblázatok a t- és F-statisztika becsléséhez. A nullhipotézis C. használatával a nagy minták elméletén alapuló tesztelésekor általában csak egy referenciatáblázatra van szükség - a normál eltérések táblázatára (z), amely lehetővé teszi a normálgörbe alatti terület meghatározását bármely két érték között z-ből az x tengelyen. A t- és F-eloszlások tábláit azonban szükségszerűen táblázatkészletben kell bemutatni, mivel ezek a táblák a szabadságfokok számának változásából adódó többszörös eloszláson alapulnak. Bár a t- és az F-eloszlás valószínűségi sűrűségeloszlás, akárcsak a nagy minták normális eloszlása, a leírásukra használt négy momentum tekintetében eltérnek az utóbbitól. A t-eloszlás például szimmetrikus (figyeljük meg a t2-t az egyenletében) minden df-re, de a minta méretének csökkenésével egyre csúcsosabbá válik. A csúcsos görbék (a normálnál nagyobb görbülettel) általában kevésbé aszimptotikusak (azaz közelebb vannak az x-tengelyhez az eloszlás végein), mint a normál görbék, például a Gauss-görbe. Ez a különbség észrevehető eltérésekhez vezet az x tengely pontjai között, amelyek megfelelnek a t és z értékeinek. Ha df = 5 és kétoldali a szint 0,05, t = 2,57, míg a megfelelő z = 1,96. Ezért a t = 2,57 statisztikai szignifikanciát jelez 5%-os szinten. Normális görbe esetén azonban z = 2,57 (pontosabban 2,58) már 1%-os statisztikai szignifikanciaszintet jelezne. Hasonló összehasonlítások tehetők az F-eloszlással, mivel t egyenlő F-vel, ha a minták száma kettő.

Mit jelent a "kis" minta?

Egy időben felvetődött a kérdés, hogy mekkora legyen a minta ahhoz, hogy kicsinek tekintsük. Erre a kérdésre egyszerűen nincs végleges válasz. A kis és nagy minta közötti feltételes határnak azonban szokás tekinteni df = 30. Ennek a kissé önkényes döntésnek az alapja a t-eloszlás és a normál eloszlás összehasonlítása. Amint fentebb megjegyeztük, a t és z értékei közötti eltérés általában nő, ha csökken, és csökken a df növekedésével. Valójában t már jóval a határeset előtt kezd közeledni z-hez, amikor t = z df = ∞ esetén. A t táblázatos értékeinek egyszerű vizuális vizsgálatával láthatja, hogy ez a közelítés meglehetősen gyors lesz, df = 30-tól kezdve. t (df = 30-nál) és z összehasonlító értéke: 2,04 és 1,96 p = 0,05 esetén; 2,75 és 2,58 p = 0,01 esetén; 3,65 és 3,29 p = 0,001 esetén.

Egyéb statisztikák a "kis" mintákról

Bár az olyan statisztikai teszteket, mint a t és az F kifejezetten kis mintákra tervezték, ugyanúgy alkalmazhatók nagy mintákra is. Vannak azonban sokan mások is. statisztikai módszerek, amelyet kis minták elemzésére szánnak, és gyakran használnak erre a célra. Értik az ún. nem paraméteres vagy eloszlásmentes módszerek. Alapvetően az ezekben a módszerekben megjelenő S.-t olyan skálákkal végzett mérésekre kívánjuk alkalmazni, amelyek nem felelnek meg az arány- vagy intervallumskálák definíciójának. Leggyakrabban ezek ordinális (rang) vagy névleges mérések. A nem-parametrikus S. nem igényel feltételezéseket az eloszlás paramétereiről, különös tekintettel a varianciabecslésekre, mivel az ordinális és nominális skálák kizárják a variancia fogalmát. Emiatt kis minták elemzésekor intervallum- és arányskálákkal nyert méréseknél nem-paraméteres módszereket is alkalmaznak, és fennáll annak a lehetősége, hogy a parametrikus módszerek alkalmazásához szükséges alapfeltevés sérül. Az ilyen C.-k, amelyek ésszerűen alkalmazhatók kis mintákra, a következők: Fisher-féle egzakt valószínűségi teszt, Friedman-féle kéttényezős nemparametrikus (rang) varianciaanalízis, Kendall t rangkorrelációs együtthatója, Kendall konkordancia együtthatója (W), Kruskal H-kritérium - Wallace nem-paraméteres (rang) egyirányú varianciaanalízishez, Mann-Whitney U-próbához, medián teszthez, előjelteszthez, Spearman r rangkorrelációs együtthatójához és Wilcoxon t-próbához.

A közgazdasági kutatás során az áruk minőségének ellenőrzésekor a kísérlet kis minta alapján is elvégezhető.

Alatt kis minta alatt nem folyamatos statisztikai felmérést értünk, amelyben a minta sokaságát az általános sokaság viszonylag kis számú egységéből alakítják ki. Egy kis minta térfogata általában nem haladja meg a 30 egységet, és elérheti a 4-5 egységet is.

Egy kis minta átlagos hibáját a következő képlettel számítjuk ki:

,

ahol
egy kis minta szórása.

Az eltérés meghatározásakor a szabadsági fokok száma n-1:

.

Kis minta határhibája
képlet határozza meg

Ebben az esetben a t konfidencia együttható értéke nemcsak az adott konfidenciavalószínűségtől függ, hanem az n mintaegységek számától is. Egyedi t és n értékek esetén egy kis minta konfidenciavalószínűségét speciális Student-táblázatok határozzák meg (9.1. táblázat), amelyekben a szórás eloszlását adjuk meg:

.

Mivel kis minta levezetésekor gyakorlatilag a 0,59 vagy 0,99 értéket veszik konfidenciavalószínűségnek, így egy kis minta határhibájának meghatározásához
A következő t-eloszlási értékeket használják:

Módszerek a minta jellemzőinek kiterjesztésére az általános sokaságra.

A mintavételi módszert leggyakrabban az általános sokaság jellemzőinek a minta releváns mutatói szerint történő megszerzésére alkalmazzák. Ez a kutatás céljaitól függően vagy a mintamutatók általános sokaságra vonatkozó közvetlen újraszámításával, vagy korrekciós tényezők számításával történik.

közvetlen számítási módszer. Abból áll, hogy a minta mutatói osztoznak vagy közepes kiterjed az általános sokaságra, figyelembe véve a mintavételi hibát.

Tehát a kereskedelemben meghatározzák az árutételben kapott nem szabványos termékek számát. Ehhez (figyelembe véve az elfogadott valószínűségi fokot) a nem szabványos termékek mintában való részesedésének mutatóit megszorozzuk a teljes árutételben lévő termékek számával.

A korrekciós tényezők módszere. Olyan esetekben alkalmazzák, amikor a mintavételi módszer célja a teljes könyvelés eredményeinek finomítása.

A statisztikai gyakorlatban ezzel a módszerrel pontosítják a lakosság tulajdonában lévő állatállomány éves összeírásainak adatait. Ennek érdekében a teljes számvitel adatainak összesítése után 10%-os mintavételezést végeznek az ún. „alulbecslési százalék” meghatározásával.

Módszerek az egységek kiválasztására az általános sokaságból.

A statisztikában a mintakészletek kialakításának különféle módszereit alkalmazzák, amelyeket a vizsgálat céljai határoznak meg, és a vizsgálat tárgyának sajátosságaitól függenek.

A mintavételes felmérés lebonyolításának fő feltétele az esélyegyenlőség elvének megsértéséből adódó szisztematikus hibák előfordulásának megelőzése a teljes sokaság minden egysége számára a mintába kerülésben. A szisztematikus hibák megelőzése a mintapopuláció kialakítására szolgáló, tudományosan megalapozott módszerek alkalmazásával érhető el.

A következő módokon lehet egységeket kiválasztani az általános sokaságból:

1) egyéni kiválasztás – a mintában egyedi egységek kerülnek kiválasztásra;

2) csoportkiválasztás - minőségileg homogén csoportok vagy vizsgált egységek sorozatai kerülnek a mintába;

3) a kombinált szelekció egyéni és csoportos szelekció kombinációja.

A kiválasztási módszereket a mintavételi sokaság kialakítására vonatkozó szabályok határozzák meg.

A minta lehet:

Valójában véletlenszerű;

Mechanikai;

tipikus;

Sorozatszám;

Kombinált.

Önvéletlen mintavétel abban áll, hogy a minta az általános sokaságból az egyes egységek véletlenszerű (nem szándékos) kiválasztásának eredményeként jön létre. Ebben az esetben a mintakészletben kiválasztott egységek számát általában a minta elfogadott aránya alapján határozzák meg.

A mintarészesedés az n minta sokaságban lévő egységek számának az N általános sokaság egységeinek számához viszonyított aránya, azaz.

.

Tehát egy 2000 egységnyi árutétel 5%-os mintájával. n mintaméret 100 egység. (5 * 2000:100), 20%-os mintával pedig 400 egység lesz. (20*2000:100) stb.

Mechanikus mintavétel abból áll, hogy a mintában szereplő egységek kiválasztása az általános sokaságból történik, egyenlő intervallumokra (csoportokra) osztva. Ebben az esetben az intervallum nagysága az általános sokaságban megegyezik a minta arányának reciprokával.

Tehát 2%-os mintánál minden 50. egység kerül kiválasztásra (1:0.02), 5%-os mintánál minden 20. egység (1:0.05) stb.

Így az általános populáció a szelekció elfogadott arányának megfelelően mechanikusan egyenlő csoportokra oszlik. A minta minden csoportjából csak egy egység kerül kiválasztásra.

A mechanikus mintavétel fontos jellemzője, hogy a mintapopuláció kialakítása a listázás igénybevétele nélkül is elvégezhető. A gyakorlatban gyakran használják azt a sorrendet, amelyben a népességegységek ténylegesen el vannak helyezve. Például a késztermékek szállítószalagról vagy gyártósorról történő kibocsátási sorrendje, az árutétel egységeinek elhelyezése a tárolás, szállítás, értékesítés stb. során.

Tipikus minta. Tipikus mintával a sokaságot először homogén tipikus csoportokra osztjuk. Ezután minden tipikus csoportból véletlenszerű vagy mechanikus mintával egyénileg kiválasztják az egységeket a mintába.

A tipikus mintavételt általában összetett statisztikai sokaságok vizsgálatánál alkalmazzák. Például a kereskedelemben dolgozók munkatermelékenységének mintavételes felmérésében, amely képzettség szerint külön csoportokból áll.

A tipikus minta fontos jellemzője, hogy pontosabb eredményeket ad a mintapopuláció egységeinek kiválasztásának más módszereihez képest.

Meghatározására átlagos hiba Egy tipikus minta a következő képleteket használja:

újraválasztás

,

nem ismétlődő kiválasztás

,

A diszperziót a következő képletekkel határozzuk meg:

,

Nál nél egyetlen szakasz A mintában minden kiválasztott egységet adott alapon azonnal vizsgálatnak vetnek alá. Ez a helyzet a megfelelő véletlenszerű és soros mintavételnél.

Nál nél többlépcsős a mintát az egyes csoportok általános sokaságából, az egyes egységeket pedig a csoportokból választják ki. Így készül egy tipikus minta a mintapopuláció egységeinek kiválasztásának mechanikus módszerével.

Kombinált a minta lehet kétlépcsős. Ebben az esetben az általános lakosságot először csoportokra osztják. Ezután kiválasztásra kerülnek a csoportok, az utóbbiakon belül pedig az egyes egységek.

A közgazdasági kutatás során az áruk minőségének ellenőrzésekor a kísérlet kis minta alapján is elvégezhető.

Alatt kis minta alatt nem folyamatos statisztikai felmérést értünk, amelyben a minta sokaságát az általános sokaság viszonylag kis számú egységéből alakítják ki. Egy kis minta térfogata általában nem haladja meg a 30 egységet, és elérheti a 4-5 egységet is.

Egy kis minta átlagos hibáját a következő képlettel számítjuk ki:

,

ahol
egy kis minta szórása.

Az eltérés meghatározásakor a szabadsági fokok száma n-1:

.

Kis minta határhibája
képlet határozza meg

Ebben az esetben a t konfidencia együttható értéke nemcsak az adott konfidenciavalószínűségtől függ, hanem az n mintaegységek számától is. Egyedi t és n értékek esetén egy kis minta konfidenciavalószínűségét speciális Student-táblázatok határozzák meg (9.1. táblázat), amelyekben a szórás eloszlását adjuk meg:

.

Mivel kis minta levezetésekor gyakorlatilag a 0,59 vagy 0,99 értéket veszik konfidenciavalószínűségnek, így egy kis minta határhibájának meghatározásához
A következő t-eloszlási értékeket használják:

Módszerek a minta jellemzőinek kiterjesztésére az általános sokaságra.

A mintavételi módszert leggyakrabban az általános sokaság jellemzőinek a minta releváns mutatói szerint történő megszerzésére alkalmazzák. Ez a kutatás céljaitól függően vagy a mintamutatók általános sokaságra vonatkozó közvetlen újraszámításával, vagy korrekciós tényezők számításával történik.

közvetlen számítási módszer. Abból áll, hogy a minta mutatói osztoznak vagy közepes kiterjed az általános sokaságra, figyelembe véve a mintavételi hibát.

Tehát a kereskedelemben meghatározzák az árutételben kapott nem szabványos termékek számát. Ehhez (figyelembe véve az elfogadott valószínűségi fokot) a nem szabványos termékek mintában való részesedésének mutatóit megszorozzuk a teljes árutételben lévő termékek számával.

A korrekciós tényezők módszere. Olyan esetekben alkalmazzák, amikor a mintavételi módszer célja a teljes könyvelés eredményeinek finomítása.

A statisztikai gyakorlatban ezzel a módszerrel pontosítják a lakosság tulajdonában lévő állatállomány éves összeírásainak adatait. Ennek érdekében a teljes számvitel adatainak összesítése után 10%-os mintavételezést végeznek az ún. „alulbecslési százalék” meghatározásával.

Módszerek az egységek kiválasztására az általános sokaságból.

A statisztikában a mintakészletek kialakításának különféle módszereit alkalmazzák, amelyeket a vizsgálat céljai határoznak meg, és a vizsgálat tárgyának sajátosságaitól függenek.

A mintavételes felmérés lebonyolításának fő feltétele az esélyegyenlőség elvének megsértéséből adódó szisztematikus hibák előfordulásának megelőzése a teljes sokaság minden egysége számára a mintába kerülésben. A szisztematikus hibák megelőzése a mintapopuláció kialakítására szolgáló, tudományosan megalapozott módszerek alkalmazásával érhető el.

A következő módokon lehet egységeket kiválasztani az általános sokaságból:

1) egyéni kiválasztás – a mintában egyedi egységek kerülnek kiválasztásra;

2) csoportkiválasztás - minőségileg homogén csoportok vagy vizsgált egységek sorozatai kerülnek a mintába;

3) a kombinált szelekció egyéni és csoportos szelekció kombinációja.

A kiválasztási módszereket a mintavételi sokaság kialakítására vonatkozó szabályok határozzák meg.

A minta lehet:

Valójában véletlenszerű;

Mechanikai;

tipikus;

Sorozatszám;

Kombinált.

Önvéletlen mintavétel abban áll, hogy a minta az általános sokaságból az egyes egységek véletlenszerű (nem szándékos) kiválasztásának eredményeként jön létre. Ebben az esetben a mintakészletben kiválasztott egységek számát általában a minta elfogadott aránya alapján határozzák meg.

A mintarészesedés az n minta sokaságban lévő egységek számának az N általános sokaság egységeinek számához viszonyított aránya, azaz.

.

Tehát egy 2000 egységnyi árutétel 5%-os mintájával. n mintaméret 100 egység. (5 * 2000:100), 20%-os mintával pedig 400 egység lesz. (20*2000:100) stb.

Mechanikus mintavétel abból áll, hogy a mintában szereplő egységek kiválasztása az általános sokaságból történik, egyenlő intervallumokra (csoportokra) osztva. Ebben az esetben az intervallum nagysága az általános sokaságban megegyezik a minta arányának reciprokával.

Tehát 2%-os mintánál minden 50. egység kerül kiválasztásra (1:0.02), 5%-os mintánál minden 20. egység (1:0.05) stb.

Így az általános populáció a szelekció elfogadott arányának megfelelően mechanikusan egyenlő csoportokra oszlik. A minta minden csoportjából csak egy egység kerül kiválasztásra.

A mechanikus mintavétel fontos jellemzője, hogy a mintapopuláció kialakítása a listázás igénybevétele nélkül is elvégezhető. A gyakorlatban gyakran használják azt a sorrendet, amelyben a népességegységek ténylegesen el vannak helyezve. Például a késztermékek szállítószalagról vagy gyártósorról történő kibocsátási sorrendje, az árutétel egységeinek elhelyezése a tárolás, szállítás, értékesítés stb. során.

Tipikus minta. Tipikus mintával a sokaságot először homogén tipikus csoportokra osztjuk. Ezután minden tipikus csoportból véletlenszerű vagy mechanikus mintával egyénileg kiválasztják az egységeket a mintába.

A tipikus mintavételt általában összetett statisztikai sokaságok vizsgálatánál alkalmazzák. Például a kereskedelemben dolgozók munkatermelékenységének mintavételes felmérésében, amely képzettség szerint külön csoportokból áll.

A tipikus minta fontos jellemzője, hogy pontosabb eredményeket ad a mintapopuláció egységeinek kiválasztásának más módszereihez képest.

Egy tipikus minta átlagos hibájának meghatározásához a következő képleteket használjuk:

újraválasztás

,

nem ismétlődő kiválasztás

,

A diszperziót a következő képletekkel határozzuk meg:

,

Nál nél egyetlen szakasz A mintában minden kiválasztott egységet adott alapon azonnal vizsgálatnak vetnek alá. Ez a helyzet a megfelelő véletlenszerű és soros mintavételnél.

Nál nél többlépcsős a mintát az egyes csoportok általános sokaságából, az egyes egységeket pedig a csoportokból választják ki. Így készül egy tipikus minta a mintapopuláció egységeinek kiválasztásának mechanikus módszerével.

Kombinált a minta lehet kétlépcsős. Ebben az esetben az általános lakosságot először csoportokra osztják. Ezután kiválasztásra kerülnek a csoportok, az utóbbiakon belül pedig az egyes egységek.

Részvény