Valószínűségi és statisztikai módszerek alkalmazhatók. Valószínűségi és statisztikai módszerek

A három fő lehetőségnek - teljes bizonyosság, kockázat és bizonytalanság melletti döntéshozatal - összhangban a döntéshozatali módszerek és algoritmusok három fő típusra oszthatók: analitikus, statisztikai és fuzzy formalizáción alapuló. A döntési mód kiválasztása minden konkrét esetben a feladat, a rendelkezésre álló kiindulási adatok, a rendelkezésre álló problémamodellek, a döntési környezet, a döntési folyamat, a megkívánt megoldási pontosság, valamint az elemző személyes preferenciái alapján történik.

Egyes információs rendszerekben az algoritmus-kiválasztási folyamat automatizálható:

A megfelelő automatizált rendszer különféle típusú algoritmusok (algoritmuskönyvtár) használatára képes;

A rendszer interaktívan felszólítja a felhasználót, hogy válaszoljon számos kérdésre a vizsgált probléma fő jellemzőivel kapcsolatban;

A rendszer a felhasználói válaszok eredménye alapján a legmegfelelőbb (az abban meghatározott kritériumoknak megfelelő) algoritmust kínálja a könyvtárból.

2.3.1 Valószínűségi-statisztikai döntéshozatali módszerek

Valószínűségi-statisztikai döntéshozatali módszereket (MPD) akkor alkalmaznak, ha a meghozott döntések hatékonysága olyan valószínűségi változóktól függ, amelyekre ismert valószínűségi eloszlási törvények és egyéb statisztikai jellemzők. Sőt, minden döntés a sok lehetséges kimenetel egyikéhez vezethet, és minden kimenetelnek van egy bizonyos előfordulási valószínűsége, amely kiszámítható. Valószínűségi jellemzők segítségével ismertetjük a problémahelyzetet jellemző mutatókat is, ilyen DPR-nél a döntéshozó mindig fennáll annak a veszélye, hogy rossz eredményt kap, amihez vezérelve választja ki az optimális megoldást az átlagolt statisztikai jellemzők alapján. véletlenszerű tényezők, vagyis a döntés kockázati körülmények között történik.

A gyakorlatban gyakran alkalmaznak valószínűségszámítási és statisztikai módszereket, amikor a mintaadatokból levont következtetéseket a teljes sokaságra (például mintából egy teljes termékcsoportra) átvisszük. Ebben az esetben azonban minden konkrét helyzetben először fel kell mérni a kellően megbízható valószínűségi és statisztikai adatok megszerzésének alapvető lehetőségét.

A valószínűségszámítás és a matematikai statisztika gondolatainak és eredményeinek a döntéshozatal során történő felhasználása során az alap az matematikai modell, amelyben az objektív összefüggések valószínűségszámítással fejeződnek ki. A valószínűségek elsősorban a véletlenszerűségek leírására szolgálnak, amelyeket a döntések meghozatalakor figyelembe kell venni. Ez egyaránt vonatkozik a nemkívánatos lehetőségekre (kockázatokra) és a vonzó lehetőségekre ("szerencsés véletlen").

A valószínűségi-statisztikai döntéshozatali módszerek lényege a valószínűségi modellek alkalmazása, amelyek becslésen és hipotézisek mintajellemzők segítségével történő tesztelésén alapulnak..

Hangsúlyozzuk, hogy a mintajellemzők felhasználásának logikája az elméleti modelleken alapuló döntéshozatalhoz két párhuzamos fogalomsorozat egyidejű használatát foglalja magában– elmélettel (valószínűségi modell) és gyakorlattal kapcsolatos (minta megfigyelési eredményekről). Például az elméleti valószínűség megfelel a mintából talált gyakoriságnak. A matematikai elvárás (elméleti sorozat) megfelel a minta számtani átlagának (gyakorlati sorozat). A minta jellemzői általában az elméleti jellemzők becslései.

Ezeknek a módszereknek az előnyei közé tartozik az a képesség, hogy figyelembe vehetőek a különféle események alakulásának forgatókönyvei és azok valószínűségei. E módszerek hátránya, hogy a számításoknál használt szcenárió-valószínűségeket a gyakorlatban általában nagyon nehéz megszerezni.

Egy konkrét valószínűség-statisztikai döntéshozatali módszer alkalmazása három szakaszból áll:

Az átmenet a gazdasági, vezetési, technológiai valóságról az elvont matematikai és statisztikai sémára, i.e. ellenőrzési rendszer valószínűségi modelljének felépítése, technológiai folyamat, döntéshozatali eljárás, különös tekintettel a statisztikai ellenőrzés eredményeire stb.

Számítások elvégzése és következtetések levonása tisztán matematikai eszközökkel valószínűségi modell keretein belül;

Valós helyzetre vonatkozó matematikai és statisztikai következtetések értelmezése és megfelelő döntés meghozatala (például a termék minőségének a megállapított követelményeknek való megfelelőségéről vagy nem megfelelőségéről, a technológiai folyamat kiigazításának szükségességéről stb.), így különösen, következtetések (a hibás termékegységek arányáról egy tételben, a technológiai folyamat szabályozott paramétereinek eloszlásának egy meghatározott formájáról stb.).

Egy valós jelenség valószínűségi modelljét felépítettnek kell tekinteni, ha a vizsgált mennyiségek és a köztük lévő összefüggések valószínűségszámítással vannak kifejezve. A valószínűségi modell megfelelőségét különösen statisztikai módszerekkel támasztják alá a hipotézisek tesztelésére.

A matematikai statisztikákat általában három részre osztják a megoldandó problémák típusa szerint: adatleírásra, becslésre és hipotézisvizsgálatra. A feldolgozott statisztikai adatok típusa szerint a matematikai statisztika négy területre oszlik:

Egydimenziós statisztika (valószínűségi változók statisztikája), amelyben a megfigyelés eredményét valós szám írja le;

Többdimenziós Statisztikai analízis, ahol az objektum feletti megfigyelés eredményét több szám (vektor) írja le;

Véletlenszerű folyamatok és idősorok statisztikája, ahol a megfigyelés eredménye egy függvény;

Nem numerikus jellegű objektumok statisztikái, amelyekben a megfigyelés eredménye nem numerikus jellegű, például halmaz (geometriai ábra), rendezés, vagy mérés eredményeként kapott minőségi tulajdonság.

Példa arra, hogy mikor célszerű valószínűségi-statisztikai modelleket használni.

Bármely termék minőségének ellenőrzésekor abból mintát vesznek annak eldöntésére, hogy az előállított terméktétel megfelel-e a megállapított követelményeknek. A mintaellenőrzés eredményei alapján következtetést vonunk le a teljes tételre vonatkozóan. Ebben az esetben nagyon fontos elkerülni a szubjektivitást a minta kialakítása során, vagyis szükséges, hogy az ellenőrzött tétel minden termékegysége azonos valószínűséggel kerüljön kiválasztásra a mintába. A tétel alapján történő választás ilyen helyzetben nem kellően objektív. Ezért termelési körülmények között a mintában szereplő termelési egységek kiválasztása általában nem sorsolással, hanem speciális véletlenszám-táblázatokkal vagy számítógépes véletlenszám-generátorok segítségével történik.

A technológiai folyamatok statisztikai szabályozása során a matematikai statisztika módszerei alapján a folyamatok statisztikai ellenőrzésére szabályokat és terveket dolgoznak ki, amelyek célja a technológiai folyamatok zavarának időben történő észlelése, és intézkedések megtétele azok kiigazítására és az olyan termékek kibocsátásának megakadályozására, amelyek nem felel meg a megállapított követelményeknek. Ezen intézkedések célja a termelési költségek és az alacsony minőségű termékek szállításából származó veszteségek csökkentése. Statisztikai átvétel-ellenőrzéssel, a matematikai statisztika módszerei alapján minőség-ellenőrzési terveket készítenek a terméktételekből származó minták elemzésével. A nehézség abban rejlik, hogy sikerül helyesen felépíteni valószínűségi-statisztikai döntéshozatali modelleket, amelyek alapján meg lehet válaszolni a fent feltett kérdéseket. A matematikai statisztikában erre a célra valószínűségi modelleket és hipotézisvizsgálati módszereket dolgoztak ki3.

Ezenkívül számos vezetői, ipari, gazdasági, nemzetgazdasági helyzetben más típusú problémák merülnek fel - a valószínűségi eloszlások jellemzőinek és paramétereinek becslési problémái.

Illetve a technológiai folyamatok pontosságának és stabilitásának statisztikai elemzése során olyan minőségi mutatókat kell értékelni, mint a szabályozott paraméter átlagértéke és elterjedésének mértéke a vizsgált folyamatban. A valószínűségszámítás szerint átlagértékként valószínűségi változó célszerű ennek matematikai elvárását, illetve a szórás statisztikai jellemzőjeként a szórást, szórást vagy variációs együtthatót használni. Ez felveti a kérdést: hogyan lehet megbecsülni ezeket a statisztikai jellemzőket a mintaadatokból, és milyen pontossággal lehet ezt megtenni? A szakirodalomban sok hasonló példa található. Ezek mindegyike bemutatja, hogy a valószínűségszámítás és a matematikai statisztika hogyan használható fel a termelésirányításban a statisztikai termékminőség-menedzsment területére vonatkozó döntések meghozatalakor.

Konkrét alkalmazási területeken széleskörűen alkalmazható valószínűségi-statisztikai és specifikus módszereket egyaránt alkalmaznak. Például a termelésirányításnak a termékminőség-ellenőrzés statisztikai módszereivel foglalkozó részében alkalmazott matematikai statisztikát (beleértve a kísérletek tervezését is) alkalmazzák. Módszerei segítségével a technológiai folyamatok pontosságának és stabilitásának statisztikai elemzése, valamint a minőség statisztikai értékelése történik. A konkrét módszerek közé tartoznak a termékminőség statisztikai átvétel-ellenőrzési módszerei, a technológiai folyamatok statisztikai szabályozása, a megbízhatóság értékelése és ellenőrzése stb.

A termelésirányításban különösen a termékminőség optimalizálása és a szabványoknak való megfelelés biztosítása során különösen fontos a statisztikai módszerek alkalmazása a termék életciklusának kezdeti szakaszában, pl. a kísérleti tervezési fejlesztések kutatás előkészítésének szakaszában (termékekre vonatkozó ígéretes követelmények kialakítása, előtervezés, kísérleti tervfejlesztési feladatmeghatározás). Ennek oka a termék életciklusának kezdeti szakaszában rendelkezésre álló információk korlátozottsága, valamint a műszaki lehetőségek és a jövőbeni gazdasági helyzet előrejelzésének szükségessége.

A legelterjedtebb valószínűség-statisztikai módszerek a regresszióanalízis, a faktoranalízis, a varianciaanalízis, a kockázatértékelés statisztikai módszerei, a szcenárió módszer stb. Egyre nagyobb jelentőséget kap a statisztikai módszerek területe, amely a nem numerikus jellegű statisztikai adatok elemzésére irányul. minőségi és heterogén jellemzőkre vonatkozó mérési eredmények. A nem numerikus objektumok statisztikájának egyik fő alkalmazása a statisztikai döntések és szavazási problémák elméletéhez kapcsolódó szakértői értékelések elmélete és gyakorlata.

Az ember szerepe a statisztikai döntéselmélet módszereit alkalmazó problémamegoldásban a probléma megfogalmazása, azaz a valós probléma megfelelő modellbe hozása, az események valószínűségeinek statisztikai adatok alapján történő meghatározása, valamint hagyja jóvá a kapott optimális megoldást.

1. rész. Az alkalmazott statisztika alapja

1.2.3. Valószínűségi-statisztikai döntéshozatali módszerek lényege

Hogyan használják a valószínűségszámítás és a matematikai statisztika megközelítéseit, elképzeléseit és eredményeit a döntéshozatalban?

Az alap egy valós jelenség vagy folyamat valószínűségi modellje, azaz. olyan matematikai modell, amelyben az objektív összefüggéseket valószínűségszámítással fejezik ki. A valószínűségek elsősorban a döntéshozatal során figyelembe veendő bizonytalanságok leírására szolgálnak. Ez egyaránt vonatkozik a nemkívánatos lehetőségekre (kockázatokra) és a vonzó lehetőségekre ("szerencsés véletlen"). Néha a véletlenszerűséget szándékosan vezetik be a helyzetbe, például sorsoláskor, az ellenőrzési egységek véletlenszerű kiválasztásakor, sorsoláskor vagy fogyasztói felmérések során.

A valószínűségszámítás lehetővé teszi más valószínűségek kiszámítását, amelyek érdekesek a kutató számára. Például a címer kiesésének valószínűségével kiszámítható, hogy 10 érmefeldobás során legalább 3 címer esik ki. Egy ilyen számítás egy valószínűségi modellen alapul, amely szerint az érmefeldobásokat független kísérletek sémája írja le, emellett a címer és a rács egyformán valószínű, ezért ezeknek az eseményeknek a valószínűsége ½. Bonyolultabb az a modell, amely az érmefeldobás helyett a kimeneti egység minőségének ellenőrzését veszi figyelembe. A megfelelő valószínűségi modell azon a feltételezésen alapul, hogy a különböző termelési egységek minőségellenőrzését független tesztek rendszere írja le. Az érmefeldobási modellel ellentétben új paramétert – a valószínűséget – be kell vezetni R hogy a termék hibás. A modell teljes mértékben le lesz írva, ha feltételezzük, hogy minden termelési egység azonos valószínűséggel hibás. Ha az utolsó feltevés hamis, akkor a modellparaméterek száma nő. Például feltételezhetjük, hogy minden termelési egységnek megvan a maga valószínűsége, hogy hibás.

Beszéljünk egy minőség-ellenőrzési modellről, amely minden termékegységre közös hibavalószínűséggel rendelkezik R. Ahhoz, hogy a modell elemzése során „elérjük a számot”, cserére van szükség R valamilyen konkrét értékre. Ehhez túl kell lépni egy valószínűségi modell keretein, és a minőségellenőrzés során kapott adatokhoz kell fordulni. A matematikai statisztika megoldja az inverz problémát a valószínűségszámítás tekintetében. Célja, hogy a megfigyelések (mérések, elemzések, tesztek, kísérletek) eredményei alapján következtetéseket vonjon le a valószínűségi modell alapjául szolgáló valószínűségekre vonatkozóan. Például az ellenőrzés során a hibás termékek előfordulási gyakorisága alapján következtetések vonhatók le a hibásság valószínűségére (lásd fent Bernoulli tételét). A Csebisev-egyenlőtlenség alapján következtetéseket vontak le a hibás termékek előfordulási gyakoriságának és a hibásság valószínűségének egy bizonyos értéket felvevő hipotézisnek való megfeleléséről.

Így a matematikai statisztika alkalmazása egy jelenség vagy folyamat valószínűségi modelljén alapul. Két párhuzamos fogalomsorozatot használnak - az elmélettel kapcsolatosakat (valószínűségi modell) és a gyakorlattal kapcsolatosakat (a megfigyelési eredmények mintája). Például az elméleti valószínűség megfelel a mintából talált gyakoriságnak. A matematikai elvárás (elméleti sorozat) megfelel a minta számtani átlagának (gyakorlati sorozat). A minta jellemzői általában az elméleti jellemzők becslései. Ugyanakkor az elméleti sorozathoz kapcsolódó mennyiségek „a kutatók fejében járnak”, az eszmevilágra vonatkoznak (Platón ógörög filozófus szerint), közvetlen mérésre nem állnak rendelkezésre. A kutatók csak szelektív adatokkal rendelkeznek, amelyek segítségével egy elméleti valószínűségi modell számukra érdekes tulajdonságait próbálják megállapítani.

Miért van szükség valószínűségi modellre? A helyzet az, hogy csak a segítségével lehetséges egy adott minta elemzési eredményeivel megállapított tulajdonságokat átvinni más mintákra, valamint a teljes, úgynevezett általános sokaságra. A „populáció” kifejezést a vizsgált egységek nagy, de véges sokaságára használják. Például Oroszország összes lakosáról vagy Moszkvában az instant kávét fogyasztók összességéről. A marketing vagy szociológiai felmérések célja, hogy a több száz vagy több ezer fős mintától kapott kijelentéseket több millió fős populációhoz továbbítsák. A minőség-ellenőrzés során a termékek egy tétele általános populációként működik.

Ahhoz, hogy a következtetéseket egy mintából egy nagyobb sokaságba vigyük át, szükség van bizonyos feltételezésekre a minta jellemzőinek és a nagyobb sokaság jellemzőinek kapcsolatáról. Ezek a feltételezések megfelelő valószínűségi modellen alapulnak.

Természetesen lehetséges a mintaadatok feldolgozása egyik vagy másik valószínűségi modell használata nélkül. Például kiszámíthatja a minta számtani átlagát, kiszámíthatja bizonyos feltételek teljesítésének gyakoriságát stb. A számítások eredményei azonban csak egy adott mintára vonatkoznak, a segítségükkel kapott következtetések más halmazba átvitele helytelen. Ezt a tevékenységet néha „adatelemzésnek” is nevezik. A valószínűség-statisztikai módszerekkel összehasonlítva az adatelemzésnek korlátozott a kognitív értéke.

Tehát a valószínűségi-statisztikai döntéshozatali módszerek lényege a becslésen és a hipotézisek mintajellemzők segítségével történő tesztelésén alapuló valószínűségi modellek alkalmazása.

Hangsúlyozzuk, hogy a mintajellemzők elméleti modelleken alapuló döntéshozatalhoz való felhasználásának logikája két párhuzamos fogalomsorozat egyidejű alkalmazását foglalja magában, amelyek közül az egyik valószínűségi modelleknek, a másik pedig mintaadatoknak felel meg. Sajnos számos, általában elavult vagy elõírásos szellemben megírt irodalmi forrásban nem tesznek különbséget a szelektív és az elméleti jellemzõk között, ami az olvasókban értetlenséghez és tévedésekhez vezet a statisztikai módszerek gyakorlati alkalmazása során.

Előző

Az életjelenségeknek, mint általában az anyagi világ minden jelenségének, van két elválaszthatatlanul összefüggő oldala: a minőségi, közvetlenül érzékszervileg érzékelhető, és a mennyiségi, amelyet a számolás és a mérés segítségével számokkal fejeznek ki.

A különféle természeti jelenségek vizsgálata során a minőségi és a mennyiségi mutatókat egyidejűleg alkalmazzák. Kétségtelenül csak a minőségi és mennyiségi oldal egységében tárul fel a legteljesebben a vizsgált jelenségek lényege. A valóságban azonban vagy az egyik, vagy a másik mutatót kell használni.

Kétségtelen, hogy a kvantitatív módszerek, mivel objektívebbek és pontosabbak, előnyt jelentenek az objektumok minőségi jellemzőivel szemben.

Maguk a mérési eredmények, bár ismert értékkel bírnak, még mindig nem elegendőek ahhoz, hogy levonjuk belőlük a szükséges következtetéseket. A tömeges tesztelés során összegyűjtött digitális adatok csak nyers tényanyag, amely megfelelő matematikai feldolgozást igényel. A digitális adatok feldolgozása - rendezése, rendszerezése nélkül nem lehetséges a bennük foglalt információk kinyerése, az egyes összesítő mutatók megbízhatóságának értékelése, a közöttük észlelt eltérések megbízhatóságának ellenőrzése. Ez a munka megköveteli, hogy a szakemberek bizonyos ismeretekkel rendelkezzenek, képesek legyenek helyesen általánosítani és elemezni a kísérletben gyűjtött adatokat. Ennek az ismeretanyagnak a rendszere a statisztika – elsősorban az elméleti és alkalmazott tudományterületek kutatási eredményeinek elemzésével foglalkozó tudomány – tartalma.

Szem előtt kell tartani, hogy a matematikai statisztika és a valószínűségszámítás tisztán elméleti, elvont tudományok; statisztikai aggregátumokat tanulmányoznak, tekintet nélkül azok alkotóelemeinek sajátosságaira. A matematikai statisztika módszerei és a mögötte meghúzódó valószínűségszámítás a legkülönfélébb tudományterületeken alkalmazható, így a bölcsészettudományokon is.

A jelenségek tanulmányozása nem egyedi megfigyeléseken történik, amelyek véletlenszerűnek, atipikusnak bizonyulhatnak, nem fejezik ki teljesen a jelenség lényegét, hanem homogén megfigyelések halmazán, amelyek többet adnak teljes körű információ a vizsgált tárgyról. A viszonylag homogén alanyok egy bizonyos csoportját, amelyeket a közös tanulmányozás egyik vagy másik jellemzője szerint kombinálnak, statisztikainak nevezünk.

összesített. A halmaz bizonyos számú homogén megfigyelést vagy regisztrációt egyesít.

A halmazt alkotó elemeket annak tagjainak vagy változatainak nevezzük. . Opciók egy jellemző egyedi megfigyelései vagy számértékei. Tehát, ha egy jellemzőt X-nek (nagy) jelölünk, akkor annak értékeit vagy változatait x-el (kicsi) jelöljük, azaz. x 1, x 2 stb.

A készletet alkotó opciók teljes számát térfogatának nevezzük, és n (kicsi) betűvel jelöljük.

Ha a homogén objektumok teljes halmazát összességében vetjük alá a felmérésnek, azt általános, általános halmaznak nevezzük.. A halmaz ilyen folyamatos leírására példa lehet az országos népszámlálás, az állatok teljes statisztikai nyilvántartása az ország. Állapotáról és tulajdonságairól természetesen a lakosság teljes felmérése nyújt a legteljesebb információt. Ezért természetes, hogy a kutatók arra törekszenek, hogy a lehető legtöbb megfigyelést összesítsék.

A valóságban azonban ritkán van szükség a lakosság összes tagjának felmérésére. Egyrészt azért, mert ez a munka sok időt és munkát igényel, másrészt számos okból és különböző körülmények miatt nem mindig kivitelezhető. Tehát az általános sokaság folyamatos felmérése helyett általában annak egy részét, az úgynevezett mintapopulációt vagy mintát vetik alá vizsgálatnak. Ez az a modell, amely alapján a teljes népesség egészét megítélik. Például ahhoz, hogy megtudjuk egy adott régió vagy körzet tervezett népességnövekedésének átlagos növekedését, egyáltalán nem szükséges az adott területen élő összes toborzót megmérni, hanem elég egy részét megmérni.

1. A mintának elég reprezentatívnak, vagy tipikusnak kell lennie, pl. így elsősorban azokból a lehetőségekből áll, amelyek a legteljesebben tükrözik az általános lakosságot. Ezért a mintaadatok feldolgozásának megkezdéséhez gondosan felülvizsgálják azokat, és eltávolítják az egyértelműen atipikus opciókat. Például a gazdálkodó által gyártott termékek bekerülési értékének elemzésekor az azon időszakok költségét, amikor a gazdálkodó nem volt teljesen ellátva alkatrészekkel vagy nyersanyagokkal, ki kell zárni.

2. A mintának objektívnek kell lennie. A minta kialakításakor nem lehet önkényesen eljárni, összetételébe csak azokat a lehetőségeket vonni be, amelyek tipikusnak tűnnek, és az összes többit elutasítani. A jóindulatú mintát előítéletek nélkül, sorsolás vagy lottó módszerével készítik, amikor az általános sokaság egyik lehetőségének sincs semmi előnye a többihez képest - beleesni vagy nem a mintapopulációba. Más szóval, a mintát a véletlenszerű kiválasztás elve szerint kell elkészíteni, anélkül, hogy az összetételét befolyásolná.

3. A mintának minőségileg homogénnek kell lennie. Ugyanabban a mintában nem szerepelhet különböző feltételek mellett kapott adatok, például a különböző létszámmal beszerzett termékek költsége.

6.2. A megfigyelési eredmények csoportosítása

A kísérletek és megfigyelések eredményeit általában számok formájában írják be a regisztrációs kártyákra vagy egy naplóba, néha pedig egyszerűen papírlapokra - nyilatkozatot vagy nyilvántartást kapnak. Az ilyen kezdeti dokumentumok általában nem egy, hanem több jelről tartalmaznak információkat, amelyek szerint megfigyeléseket tettek. Ezek a dokumentumok szolgálják a mintaképzés fő forrását. Ez általában így történik: az elsődleges dokumentumtól különálló papírlapon, pl. kartotékba, naplóba vagy kivonatba írják ki annak az attribútumnak a számértékeit, amelyre a sokaságot képezik. Az ilyen halmazban lévő változatok általában véletlenszerű számok tömege formájában jelennek meg. Ezért az első lépés az ilyen anyagok feldolgozása felé annak racionalizálása, rendszerezése - a változat csoportosítása statisztikai táblázatok vagy sorokat.

A mintaadatok csoportosításának egyik leggyakoribb formája a statisztikai táblázatok. Szemléltető értékűek, mutatnak néhány általános eredményt, az egyes elemek helyzetét a teljes megfigyelési sorozatban.

A mintaadatok elsődleges csoportosításának másik formája a rangsorolási módszer, azaz. az opció helye egy bizonyos sorrendben - az attribútum értékeinek növelésével vagy csökkentésével. Ennek eredményeként egy úgynevezett rangsorolt ​​sorozatot kapunk, amely megmutatja, hogy egy adott jellemző mennyiben és milyen módon változik. Például van egy minta a következő összetételből:

5,2,1,5,7,9,3,5,4,10,4,5,7,3,5, 9,4,12,7,7

Látható, hogy egyes egységeknél a jel 1-ről 12-re változik. Növekvő sorrendben felsorolva:

1,2,3,3,4,4,4,5,5,5,5,7,7,7,7,9,9,10,12.,

Ennek eredményeként a változó jellemző értékeinek tartományos sorozatát kaptuk.

Nyilvánvaló, hogy az itt bemutatott rangsorolási módszer csak kis mintákra alkalmazható. Nál nél nagy számok megfigyelések, rangsorolás nehéz, mert a sorozat olyan hosszú, hogy értelmét veszti.

A nagyszámú megfigyelésnél szokás a mintát kettős sor formájában rangsorolni, azaz. a rangsorolt ​​sorozat egyes változatainak gyakoriságát vagy gyakoriságát jelölve. Egy jellemző rangsorolt ​​értékeinek ilyen kettős sorozatát variációs sorozatnak vagy eloszlási sorozatnak nevezzük. A variációs sorozat legegyszerűbb példája a fent rangsorolt ​​adatok lehetnek, ha a következőképpen vannak elrendezve:

Funkcióértékek

(opciók) 1 2 3 4 5 7 9 10 12

ismételhetőség

(opcionális) frekvenciák 1 1 2 3 5 4 2 1 1

A variációs sorozat megmutatja, hogy az egyes változatok milyen gyakorisággal fordulnak elő egy adott populációban, hogyan oszlanak el, aminek nagy jelentősége van, ami lehetővé teszi a variációs minták és a mennyiségi tulajdonságok variációs tartományának megítélését. A variációs sorozatok felépítése megkönnyíti a tetszőleges statisztikai sokaságra jellemző összesített mutatók - a számtani átlag és az átlagértékük körüli szórás vagy diszperzió - számítását.

A variációs sorozatok két típusból állnak: szakaszos és folyamatos. Nem folytonos variációs sorozatot kapunk diszkrét mennyiségek elosztásával, amelyek számlálójeleket tartalmaznak. Ha az előjel folyamatosan változik, pl. a sokaság minimális változatától a maximumig tetszőleges értéket vehet fel, akkor az utóbbi folyamatos variációs sorozatban oszlik el.

Egy diszkréten változó jellemző variációs sorozatának megalkotásához elegendő a megfigyelések teljes halmazát rangsorolt ​​sorozatok formájában elhelyezni, jelezve az egyes változatok gyakoriságát. Példaként 267 alkatrész méret szerinti megoszlását mutatjuk be (5.4. táblázat).

6.1. táblázat. Az alkatrészek méret szerinti megoszlása.

Folyamatosan változó jellemzőkből álló variációs sorozat felépítéséhez fel kell osztania a teljes variációt a minimálistól a maximális változatig külön csoportokra vagy intervallumokra (tól-ig), amelyeket osztályoknak nevezünk, majd a sokaság összes változatát el kell osztani ezen osztályok között. . Ennek eredményeként egy dupla variációs sorozatot kapunk, amelyben a frekvenciák már nem az egyes konkrét opciókra vonatkoznak, hanem a teljes intervallumra, pl. A frekvenciákról kiderül, hogy nem változatok, hanem osztályok.

Az általános variáció osztályokra bontása az osztályintervallum skáláján történik, amelynek azonosnak kell lennie a variációs sorozat minden osztályára. Az osztályintervallum értékét i-vel jelöljük (az intervallum szóból - intervallum, távolság); az határozza meg következő képlet

, (6.1)

ahol: i – osztályintervallum, amelyet egész számnak veszünk;

- maximális és minimális minta lehetőségek;

lg.n azon osztályok számának logaritmusa, amelyekre a minta fel van osztva.

Az osztályok számát tetszőlegesen állítjuk be, de figyelembe véve azt a tényt, hogy az osztályok száma némileg függ a minta méretétől: minél nagyobb a minta, annál több osztály legyen, és fordítva - kisebb mintaszámmal kisebb mintaszámmal. óraszámot kell felvenni. A tapasztalat azt mutatja, hogy még kis mintákban sem szabad 5-6 osztálynál kevesebbet beállítani, amikor variációs sorozatok formájában kell csoportosítani az opciókat. Ha 100-150 lehetőség van, akkor az órák száma 12-15-re növelhető. Ha a sokaság 200-300 opcióból áll, akkor 15-18 osztályra osztják, stb. Természetesen ezek az ajánlások nagyon feltételesek, és nem fogadhatók el bevett szabályként.

Az osztályokra bontásnál minden konkrét esetben számos különböző körülményt kell figyelembe venni annak érdekében, hogy a statisztikai anyagok feldolgozása a legpontosabb eredményt adja.

Az osztályintervallum beállítása és a minta osztályokra osztása után a változatot osztályokra osztják, és meghatározzák az egyes osztályok variációinak (gyakoriságainak) számát. Ennek eredményeként egy variációs sorozatot kapunk, amelyben a frekvenciák nem az egyes opciókra, hanem bizonyos osztályokra vonatkoznak. A variációs sorozat összes gyakoriságának összege egyenlő legyen a minta méretével, azaz

(6.2)

ahol:
- összegzés jele;

p a frekvencia.

n a minta mérete.

Ha nincs ilyen egyenlőség, akkor a változat osztályonkénti feladásakor hiba történt, amit ki kell küszöbölni.

Általában egy változat osztályonkénti feladásához egy segédtáblázatot állítanak össze, amelyben négy oszlop található: 1) osztályok ezen attribútum szerint (-tól -ig); 2) - az osztályok átlagértéke, 3) az opció feladása osztályonként, 4) az osztályok gyakorisága (lásd 6.2. táblázat)

Az opciók osztályonkénti közzététele nagy figyelmet igényel. Ugyanazt az opciót nem szabad kétszer megjelölni, vagy ugyanazok az opciók különböző osztályokba tartoznak. Az opciók osztályonkénti elosztásának hibáinak elkerülése érdekében javasolt, hogy ne az összesítésben keressük ugyanazokat az opciókat, hanem osztjuk szét az osztályok között, ami nem ugyanaz. Ennek a szabálynak a figyelmen kívül hagyása, ami a tapasztalatlan kutatók munkájában történik, sok időt vesz igénybe egy változat közzétételekor, és ami a legfontosabb, hibákhoz vezet.

6.2. táblázat. Feladási lehetőség osztályonként

Osztályhatárok

Az osztály jelentése (x)

Osztályfrekvenciák (p), %

abszolút

relatív

Miután befejeztük az opció feladását és az egyes osztályokhoz tartozó számukat, folyamatos variációs sorozatot kapunk. Nem folytonos variációs sorozattá kell alakítani. Ehhez, mint már említettük, az osztályok szélsőértékeinek fele összegét vesszük. Így például az első osztály mediánértékét, amely 8,8, a következőképpen kapjuk meg:

(8,6+9,0):2=8,8.

Az oszlop második értékét (9,3) hasonló módon számítjuk ki:

(9,01+9,59):2=9,3 stb.

Az eredmény egy nem folytonos variációs sorozat, amely a vizsgált tulajdonság szerinti eloszlást mutatja (6.3. táblázat).

6.3. táblázat. Variációs sorozat

A mintaadatok variációs sorozatok formájában történő csoportosításának kettős célja van: egyrészt segédműveletként szükséges a teljes mutatók számításánál, másrészt az eloszlási sorozatok a jellemzők változási mintáját mutatják, ami nagyon fontos. . Ennek a mintázatnak a pontosabb megjelenítése érdekében a variációs sorozatokat grafikusan, hisztogram formájában szokás ábrázolni (6.1. ábra).


6.1. ábra Vállalkozások létszám szerinti megoszlása

oszlopdiagram egy változat eloszlását ábrázolja egy jellemző folyamatos változásával. A téglalapok az osztályoknak felelnek meg, magasságuk pedig az egyes osztályokban található opciók száma. Ha a hisztogram téglalapok csúcsainak felezőpontjaiból leengedjük a merőlegeseket az abszcissza tengelyre, majd ezeket a pontokat összekapcsoljuk, akkor egy folytonos változású gráfot kapunk, amelyet sokszögnek vagy eloszlássűrűségnek nevezünk.

Valószínűségi-statisztikai módszerek gazdasági rendszerek modellezésére


Bevezetés


Általános szabály, hogy egy megfigyelt valószínűségi változó eloszlási törvényének azonosításának feladatát (strukturális-paraméteres azonosítás) általában a valószínűségi eloszlás törvényének olyan paraméteres modelljének kiválasztásának problémájaként értelmezik, amely a legjobban illeszkedik a kísérleti megfigyelések eredményeihez. A mérőműszerek véletlenszerű hibái nem olyan gyakran esnek a normál törvény hatálya alá, pontosabban nem olyan gyakran írja le őket jól a modell normális törvény. A mérőműszerek és rendszerek eltérő fizikai elveken, különböző mérési módszereken és a mérőjelek eltérő átalakításán alapulnak. A mérési hibák, mint mennyiségek számos, véletlenszerű és nem véletlenszerű, állandóan vagy epizodikusan ható tényező hatásának eredménye. Ezért egyértelmű, hogy csak bizonyos (elméleti és műszaki) előfeltételek teljesülése esetén lehet a mérési hibákat kellően jól leírni a normál törvényi modellben.

Általánosságban elmondható, hogy a valódi eloszlási törvény (természetesen ha létezik), amely egy adott mérőrendszer hibáit leírja, minden azonosítási kísérletünk ellenére ismeretlen marad (marad). Mérési adatok és elméleti megfontolások alapján csak olyan valószínűségi modellt választhatunk, amely bizonyos értelemben a legjobban közelíti ezt az igaz törvényt. Ha a megszerkesztett modell megfelelő, vagyis az alkalmazott kritériumok nem adnak okot az elutasításra, akkor e modell alapján ki lehet számítani a mérőműszer hibájának véletlenszerű komponensének minden érdeklődésre számot tartó valószínűségi jellemzőjét. számunkra, ami csak a mérési hiba nem kizárt szisztematikus (nem megfigyelt vagy nem regisztrált) összetevője miatt fog eltérni a valódi értékektől. Kicsisége jellemzi a mérések helyességét. A megfigyelt valószínűségi változók leírására használható lehetséges valószínűségi eloszlási törvények halmaza nem korlátozott. Nincs értelme az azonosítás feladatának kitűzni a megfigyelt mennyiség valódi eloszlási törvényének megtalálását. Csak azt a problémát tudjuk megoldani, hogy egy adott készletből válasszuk ki a legjobb modellt. Például abból a paraméteres törvényhalmazból és alkalmazásokban használt terjesztési halmazok és hivatkozások találhatók a szakirodalomban.

Az eloszlási törvény szerkezeti-paraméteres azonosításának klasszikus megközelítése. A klasszikus megközelítés alatt az eloszlási törvény kiválasztásának algoritmusát értjük, amely teljes mértékben a matematikai statisztika apparátusán alapul.


1. Elemi fogalmak arról véletlenszerű események, mennyiségek és függvények


Láttuk már, hogy sok kísérletnél nincs különbség az események valószínűségének kiszámításában, miközben ezekben a kísérletekben az elemi eredmények nagyon eltérőek. De éppen az események valószínűsége kell, hogy érdekeljen bennünket, és nem az elemi eredmények terének felépítése. Ezért itt az ideje, hogy minden ilyen „hasonló” kísérletben a legkülönbözőbb elemi eredmények helyett például számokat használjunk. Más szóval, minden elemi eredményhez társítani kell néhányat valós szám, és csak számokkal dolgozhat.

Legyen adott a valószínűségi tér.

26. meghatározás.Funkció hívott valószínűségi változó, ha bármilyen Borel készlethez sok eseményről van szó, i.e. tartozik - algebra .

Sok , amely azokból az elemi eredményekből áll , amelyekre tartozik , a halmaz teljes inverz képének nevezzük.

Megjegyzés 9 . Általában hagyjuk a függvényt sokaktól működik a sokaságba , és adottak -algebrák És részhalmazok És illetőleg. Funkció hívott mérhető, ha bármilyen készlethez teljes prototípusa tartozik .

Megjegyzés 10. Az olvasó, aki nem akar bajlódni a kapcsolódó absztrakciókkal -eseményalgebrák és mérhetőséggel, biztonságosan feltételezhetik, hogy az elemi eredmények bármely halmaza esemény, és ezért egy valószínűségi változó tetszőlegesfunkciótól ban ben . Ez a gyakorlatban nem okoz gondot, így ebben a bekezdésben mindent átugorhat.

Most, miután megszabadultunk a kíváncsi olvasóktól, próbáljuk megérteni, miért van szüksége egy valószínűségi változónak mérhetőségre.

Ha egy valószínűségi változót adunk meg , előfordulhat, hogy ki kell számítanunk az űrlap valószínűségeit , , , (és általában a soron lévő Borel-halmazokba esés valószínűsége). Ez csak akkor lehetséges, ha a valószínűség jele alatti halmazok események, mert valószínűségcsak ezen van egy függvény definiálva -események algebra. A mérhetőség követelménye megegyezik bármely Borel-készletre vonatkozó ténnyel valószínűségét határozzák meg.

A 26. definícióban mást is követelhetünk. Ha például egy esemény találatot szeretne bármely intervallumban: , vagy bármely félidőben: .

Ellenőrizzük például, hogy a 26. és 27. definíció egyenértékű:

27. meghatározás. Funkció Valószínűségi változónak nevezzük, ha bármilyen valós sok -algebrához tartozik .

Bizonyíték a 26., 27. definíciók egyenértékűsége.

Ha - valószínűségi változó a 26. definíció értelmében, akkor a 27. definíció értelmében egy valószínűségi változó lesz, mivel bármely intervallum egy Borel készlet.

Bizonyítsuk be, hogy fordítva is igaz. Legyen bármilyen intervallumra Kész . Be kell bizonyítanunk, hogy ugyanez igaz minden Borel-készletre.

Gyűjts bőven a valós sor összes olyan részhalmaza, amelyek előképei események. Sok már tartalmazza az összes intervallumot . Most mutassuk meg, hogy a készlet egy -algebra. Definíció szerint, akkor és csak akkor, ha a halmaz tartozik .

1. Győződjünk meg róla . De és ezért .

2. Győződjünk meg róla bárkinek . Legyen . Azután , mivel - -algebra.

3. Győződjünk meg róla bármilyen . Legyen mindenkinek . De - -algebra, szóval

Ezt bebizonyítottuk - -algebra és tartalmazza az összes intervallumot a vonalon. De - a legkisebb -algebrák, amelyek a vonal összes intervallumát tartalmazzák. Következésképpen, tartalmazza: .

Mondjunk példákat mérhető és nem mérhető függvényekre.

25. példa. Feldobjuk a kockát. Legyen , és két függvényt ban ben állítsd be így: , . Még nincs beállítva -algebra , nem beszélhetünk mérhetőségről. Néhányhoz képest mérhető függvény -algebrák , nem biztos, hogy ugyanaz a másiknál.

Ha van egy halmaz az összes részhalmazból , azután És valószínűségi változók, mivel az elemi eredmények bármely halmazához tartozik , beleértve vagy . Írhat megfeleltetést a valószínűségi változók értékei között És és ezeknek az értékeknek a formában való felvételének valószínűsége "valószínűségi eloszlási táblák"vagy röviden "eloszlási táblázatok":

Itt .


2. Hagyjuk - események algebra négy készletből áll:



azok. egy esemény bizonyos és lehetetlen események kivételével páros vagy páratlan számú pont elvesztése. Győződjön meg arról, hogy egy ilyen viszonylag szegény -algebra , sem nem véletlen változók, mert nem mérhetők. Vegyük, mondjuk . Látjuk, hogy és


2. Valószínűségi változók numerikus jellemzői


Várható érték.Egy X diszkrét valószínűségi változó matematikai elvárása, amely véges számú xi értéket vesz fel pi valószínűséggel, az összeg:


(6a)


Egy X folytonos valószínűségi változó matematikai elvárása az x értékei és az f(x) valószínűségi eloszlássűrűség szorzata:


(6b)


A (6b) nem megfelelő integrált abszolút konvergensnek tételezzük fel (egyébként azt mondjuk, hogy az M(X) matematikai elvárás nem létezik). A matematikai elvárás az X valószínűségi változó átlagos értékét jellemzi. Dimenziója egybeesik a valószínűségi változó dimenziójával. Tulajdonságok matematikai elvárás:



Diszperzió.Az X valószínűségi változó varianciája a következő szám:



A diszperzió egy X valószínűségi változó értékeinek M (X) átlagos értékéhez viszonyított szóródásának jellemzője. A variancia dimenziója egyenlő a valószínűségi változó négyzetes dimenziójával. A variancia (8) és a matematikai elvárás (5) definíciója alapján egy diszkrét valószínűségi változóra és (6) egy folytonos valószínűségi változóra, hasonló kifejezéseket kapunk a variancia számára:



Itt m = M(X).

Diszperziós tulajdonságok:


(10)


Szórás:


(11)


Mivel a szórás dimenziója megegyezik egy valószínűségi változó dimenziójával, ezért gyakrabban használják a szórást, mint a szórást.

elosztási pillanatok.A matematikai elvárás és variancia fogalma több speciális esete általános fogalom valószínűségi változók numerikus jellemzőihez - eloszlási momentumok. Egy valószínűségi változó eloszlási momentumait egy valószínűségi változó néhány egyszerű függvényének matematikai elvárásaiként mutatjuk be. Így az x0 ponthoz viszonyított k rendű momentum az M (X - x0) k matematikai elvárás. Az x = 0 origóhoz viszonyított pillanatokat kezdeti momentumoknak nevezzük, és jelölésük:


(12)


Az első sorrend kezdeti momentuma a figyelembe vett valószínűségi változó eloszlási központja:


(13)


Az x = m eloszlási központra vonatkozó momentumokat központi momentumoknak nevezzük, és jelöljük:


(14)


A (7)-ből az következik, hogy az elsőrendű központi momentum mindig nulla:


(15)


A centrális momentumok nem függenek a valószínűségi változó értékeinek origójától, mivel állandó C értékkel való eltolással az eloszlási középpontja ugyanazzal a C értékkel tolódik el, és a középponttól való eltérés nem változik:


X - m \u003d (X - C) - (m - C).


Most már nyilvánvaló, hogy a szórás egy másodrendű központi momentum:


(16)


Aszimmetria.központi pillanat harmadik sorrend:


(17)


az eloszlás ferdeségének becslésére szolgál. Ha az eloszlás szimmetrikus az x = m ponthoz képest, akkor a harmadrendű központi momentum egyenlő lesz nullával (valamint az összes páratlan sorrendű központi momentum). Ezért, ha a harmadrendű központi momentum eltér nullától, akkor az eloszlás nem lehet szimmetrikus. Az aszimmetria mértékét dimenzió nélküli aszimmetria együtthatóval becsüljük meg:


(18)


Az aszimmetria-együttható előjele (18) jobb- vagy baloldali aszimmetriát jelez (2. ábra).


Rizs. 1. Az eloszlási ferdeség típusai


Felesleg.központi pillanat negyedik rend:


(19)


az úgynevezett kurtosis becslésére szolgál, amely meghatározza az eloszlási görbe meredekségét (hegyességét) az eloszlás középpontja közelében a normál eloszlási görbéhez képest. Mivel normál eloszlásra , akkor a következő értéket veszik kurtosisnak:


(20)


ábrán A 3. ábra példákat mutat be eloszlási görbékre különböző kurtosis értékekkel. Normál eloszlás esetén E = 0. A normálnál hegyesebb görbék pozitív görbülettel rendelkeznek, a laposabbak negatív.


Rizs. 2. Különböző meredekségi fokú eloszlási görbék (kurtózis)


A matematikai statisztika mérnöki alkalmazásaiban a magasabb rendű momentumokat általában nem használják.

Divatdiszkrét valószínűségi változó a legvalószínűbb értéke. A folytonos valószínűségi változó módusa az az értéke, amelynél a valószínűségi sűrűség maximális (2. ábra). Ha az eloszlási görbének van egy maximuma, akkor az eloszlást unimodálisnak nevezzük. Ha az eloszlási görbének egynél több maximuma van, akkor az eloszlást polimodálisnak nevezzük. Néha vannak olyan eloszlások, amelyek görbéinek nem maximuma, hanem minimuma van. Az ilyen eloszlásokat antimodálisnak nevezzük. Általános esetben egy valószínűségi változó módusa és matematikai elvárása nem esik egybe. Speciális esetben egy modális, pl. módussal, szimmetrikus eloszlással, és feltéve, hogy van matematikai elvárás, ez utóbbi egybeesik az eloszlás módusával és szimmetriaközéppontjával.

KözépsőX valószínűségi változó a Me értéke, amelyre az egyenlőség érvényesül: azok. ugyanilyen valószínű, hogy az X valószínűségi változó kisebb vagy nagyobb lesz, mint Me. Geometriailag a medián annak a pontnak az abszcisszája, ahol az eloszlási görbe alatti területet kettévágják. Szimmetrikus modális eloszlás esetén a medián, módus és átlag megegyezik.


. A valószínűségi változók eloszlási törvényeinek statisztikai értékelése


Az általános sokaság a vizsgálandó objektumok összessége vagy az összes megfigyelés lehetséges eredménye ugyanazok a feltételek egy tárgy felett.

mintavevő készlet vagy a minta objektumok halmaza vagy egy objektum megfigyelésének eredményei, amelyeket véletlenszerűen választanak ki az általános sokaságból.

Minta nagyságaa mintában lévő objektumok vagy megfigyelések száma.

A minta fajlagos értékeit az X valószínűségi változó megfigyelt értékeinek nevezzük. A megfigyelt értékeket rögzítjük a protokollban. A protokoll egy táblázat. Az összeállított jegyzőkönyv a beérkezett anyag feldolgozásának rögzítésének elsődleges formája. A megbízható, megbízható következtetések levonásához a mintának megfelelően reprezentatívnak kell lennie a mennyiséget tekintve. A nagy minta a számok rendezetlen halmaza. A vizsgálathoz a mintát vizuálisan rendezett formába hozzák. Ehhez a protokoll megkeresi egy valószínűségi változó legnagyobb és legkisebb értékét. A minta növekvő sorrendben az 1. táblázatban látható.

1. táblázat: Protokoll

8,66-5,49-4,11-3,48-2,9-2,32-1,82-1,09-0,440,64-8,31-4,71-3,92-3,41-2,85-2,31-1,82-1,01-0,430,71-8,23-4,68-3,85-3,33-2,83-2,29-1,8-0,99-0,430,73-7,67-4,6-3,85-3,25-2,77-2,27-1,77-0,95-0,310,99-6,64-4,43-3,81-3,08-2,72-2,25-1,73-0,89-0,31,03-6,6-4,38-3,8-3,07-2,67-2,19-1,38-0,70,041,05-6,22-4,38-3,77-3,01-2,6-2,15-1,32-0,560,081,13-5,87-4,25-3,73-3,01-2,49-2,09-1,3-0,510,151,76-5,74-4,18-3,59-2,99-2,37-2,01-1,28-0,490,262,95-5,68-4,14-3,49-2,98-2,33-1,91-1,24-0,480,534,42

Mintavételi tartománya különbség a legnagyobb és a legkisebb érték X valószínűségi változó:

A minta tartománya k intervallumra - számjegyre van felosztva. A számjegyek száma a mintavételi tartomány méretétől függően 8 és 25 között van beállítva, ebben lejáratú papírok vegyük k = 10.

Ekkor az intervallum hossza egyenlő lesz:

A protokollban megszámoljuk az egyes intervallumokba eső megfigyelt értékek számát, jelöljük őket m1, m2, ..., m10. .

Hívjuk mi találati gyakoriságvalószínűségi változó az i intervallumban. Ha egy valószínűségi változó bármely megfigyelt értéke egybeesik az intervallum végével, akkor a valószínűségi változónak ez az értéke megegyezés szerint az egyik intervallumhoz van hozzárendelve.

Miután meghatároztuk a mi frekvenciákat, meghatározzuk frekvenciákvalószínűségi változó, azaz. megtaláljuk a mi gyakoriságok arányát az összes megfigyelt értékhez képest n.

Gyakoriság, teljesség feltétele -

Keresse meg az egyes intervallumok közepét: .

Készítsünk egy táblázatot 2

Intervallum határértékek táblázata és a megfelelő frekvenciák , ahol i = 1, 2, 3, …, k, statisztikai sorozatnak nevezzük. Egy statisztikai sorozat grafikus ábrázolását hisztogramnak nevezzük. A következőképpen épül fel: az intervallumokat az abszcissza mentén ábrázoljuk, és minden ilyen intervallumon, mint az alapon, egy téglalapot szerkesztünk, amelynek területe megegyezik a megfelelő frekvenciával.

, - a téglalap magassága, .


2. táblázat

Intervallum számaAz intervallum bal szegélyeAz intervallum jobb határaIntervallumAz intervallum közepeAz intervallum gyakoriságaAz intervallum gyakorisága A téglalap magassága .030.02293-6.044-4.736(-6.044; -4.736)-5.3940.064-6.407;.3940.040. -4.082200.2015295-3.428-2.12 (- 3,428, -222) -2.774260.260.19886-2.12-0.812 (-2,12; -0,812) -1.466180.180.13767-0.8120.496 (-0,812, 0,496) -0.158140.140.107080.4961.804 (0.496; 1.804)1.1590.090.068891.8043.112(1.804; 3.112)2.45810.010.0076103.1124.42(3.112; 4.42 )1.00716sum.

3. ábra


A statisztikai eloszlásfüggvény egy olyan valószínűségi változó gyakorisága, amely nem haladja meg az adott X értéket:

Egy X diszkrét valószínűségi változó esetén a statisztikai eloszlásfüggvényt a következő képlettel találjuk meg:

A statisztikai eloszlásfüggvényt kiterjesztett formában írjuk:

ahol az i intervallum közepe, és a megfelelő frekvenciák, ahol i=1, 2,…, k.

A statisztikai eloszlásfüggvény grafikonja egy lépcsős egyenes, melynek töréspontjai az intervallumok felezőpontjai, a végső ugrások pedig a megfelelő frekvenciákkal egyenlők.


3. ábra


Statisztikai sorozat numerikus jellemzőinek számítása

Statisztikai matematikai elvárás,

statisztikai variancia,

Statisztikai szórás.

Statisztikai elvárásvagy statisztikai közepesaz X valószínűségi változó megfigyelt értékeinek számtani átlaga.

Statisztikai szóródásszámtani középértéknek nevezzük, ill

A nagy mintaszám mellett a képletekkel végzett számítások nehézkes számításokhoz vezetnek. A számítások egyszerűsítése érdekében határokkal ellátott statisztikai sorozatot használnak és a frekvenciák , ahol i = 1, 2, 3, …, k, keresse meg az intervallumok felezőpontjait , majd a kijelölés összes eleme , ami az intervallumba esett , helyébe egyetlen érték lép , akkor lesznek olyan értékek minden intervallumban.

ahol - a megfelelő intervallum átlagértéke ;- intervallum gyakoriság

4. táblázat Numerikus jellemzők

Frekvencia pixipi (xi-m) ^ 2 (xi-m) ^ 2 * pi1-8.0060.04-0.320231.04-0.320231.486911.03-0.200918.51856.55563-5.390.04 -0.21568.971940.3568.971940.35894-4.0820.20-0.81642.847050.56945 -2,7740,26-0,72120,143880,03746-1,4660,18-0,26390,862450,15527 Statisztikai átlag -2,3947 Statisztikai variancia 5,3822Statisztikai szórás2,3200

Meghatározza a valószínűségi változó megfigyelt értékeinek csoportosítási középpontjának helyzetét.

, jellemezze a valószínűségi változó megfigyelt értékeinek szóródását körül

Minden statisztikai eloszlásban elkerülhetetlenül vannak véletlenszerűség elemei. A nagyon nagy számú megfigyeléssel azonban ezek a balesetek kisimulnak, és a véletlenszerű jelenségek felfedik a benne rejlő törvényszerűséget.

A statisztikai anyagok feldolgozásakor el kell dönteni, hogy egy adott statisztikai sorozathoz hogyan válasszunk elméleti görbét. Ennek az elméleti eloszlási görbének kell kifejeznie a statisztikai eloszlás lényeges jellemzőit – ezt a feladatot a statisztikai sorozatok simításának vagy kiegyenlítésének feladatának nevezzük.

Néha általános forma egy X valószínűségi változó eloszlása ​​ennek a valószínűségi változónak a természetéből következik.

Legyen az X valószínűségi változó valamilyen mérés eredménye fizikai mennyiség eszköz.

X \u003d egy fizikai mennyiség pontos értéke + műszerhiba.

A készülék véletlenszerű hibája a mérés során teljes jellegű, és a normál törvény szerint oszlik meg. Ezért az X valószínűségi változó azonos eloszlású, azaz. normális eloszlás valószínűségi sűrűséggel:


Ahol , , .


Paraméterek És úgy határozzuk meg, hogy az elméleti eloszlás numerikus jellemzői megegyezzenek a statisztikai eloszlás megfelelő numerikus jellemzőivel. Normális eloszlás esetén azt feltételezzük ,,, akkor a normál eloszlási függvény a következő formában lesz:

5. táblázat Szintezési görbe

Intervallum száma Intervallum középső Xi táblázatos függvény normál görbe 1-8.0060-2.41870.02140.00922-6.6980-1.85490.07140.03083-5.3900-1.29110.17340.07474-4.0820-0.72730.30620.13205- 2.7740-0.16350.39360.1697M-2.394700.39890.17206-1.46600.40030.36820.15877-0.15800.96410.25070.108081.15001.52790.12420 .05802.4 09170.04480.0193103.76602.65550.01170.0051

Pontokból elméleti normálgörbét készítünk ugyanazon a diagramon a statisztikai sorozat hisztogramjával (Hiba! A hivatkozási forrás nem található).


6. ábra


A statisztikai eloszlásfüggvény simítása

Statisztikai eloszlásfüggvény igazítsuk a normáltörvény eloszlásfüggvényéhez:



ahol ,,a Laplace függvény.


7. táblázat Eloszlási függvény

Intervallum száma Intervallum középső Xi Laplace függvény elosztási függvény 1-8.0060-2.4187-0.4980.00782-6.6980-1,8549-0.46820.03183-5.3900.03183-5.0170.09834-0.0170.09834-0.0170.2335-0.26650.23355-2.740-0.1635-2.740-0.1635-0.06490.4351M-2.3947000.50006-1,46600. 40030.15550.65557-0.15800.96410.33250.832581.15001, 52790,43670,936792,45802,09170,48180,09170,48180,9818602,69,650,6

Megszerkesztjük az elméleti eloszlásfüggvény pontonkénti diagramját / a statisztikai eloszlásfüggvény grafikonjával együtt.


6. ábra


Tanulmányozzuk az X valószínűségi változót matematikai várakozással és diszperzió , mindkét paraméter ismeretlen.

Legyen х1, х2, х3, …, хn egy X valószínűségi változó n független megfigyelésének eredményeként kapott minta. Az х1, х2, х3, …, хn értékek véletlenszerűségének hangsúlyozására átírjuk őket formájában:

Х1, Х2, Х3, …, Хn, ahol Хi a Х valószínűségi változó értéke az i-edik kísérletben.

Ezen kísérleti adatok alapján meg kell becsülni egy valószínűségi változó matematikai elvárását és varianciáját. Az ilyen becsléseket pontbecsléseknek nevezzük, és m és D becsléseként vehetjük a statisztikai várakozást és statisztikai variancia , ahol



A kísérlet előtt az X1, X2, X3, ..., Xn minta független valószínűségi változók halmaza, amelyeknek matematikai elvárása és varianciája van, ami azt jelenti, hogy a valószínűségi eloszlás megegyezik magával az X valószínűségi változóval.


ahol i = 1, 2, 3, …, n.


Ez alapján megtaláljuk a valószínűségi változó matematikai elvárását és szórását (a matematikai elvárás tulajdonságait felhasználva).

Így a statisztikai átlag matematikai elvárása egyenlő a mért érték m matematikai elvárásának pontos értékével és a statisztikai átlag szórásával n-szer kisebb, mint az egyes mérési eredmények szórása.


nál nél


Ez azt jelenti, hogy nagy N minta esetén a statisztikai átlag szinte nem véletlenszerű érték, csak kis mértékben tér el az m valószínűségi változó pontos értékétől. Ezt a törvényt törvénynek nevezik nagy számok Csebisev.

A matematikai elvárások és variancia ismeretlen értékeinek pontbecslései vannak nagyon fontos a statikus adatok feldolgozásának kezdeti szakaszában. Hátránya, hogy nem tudni, milyen pontossággal adják meg a becsült paramétert.

Legyen az adott mintára X1, X2, X3, …, Xn pontos statisztikai becslések És , akkor az X valószínűségi változó numerikus karakterisztikája megközelítőleg egyenlő lesz . Kis méretű mintánál a streaming becslés kérdése elengedhetetlen, mert m és között , D és az eltérések nem elég nagyok. Ezenkívül a gyakorlati problémák megoldása során nemcsak az m és a D közelítő értékét kell megtalálni, hanem értékelni kell azok pontosságát és megbízhatóságát is. Legyen , azaz egy pontbecslés m-re. Ez nyilvánvaló minél pontosabban határozza meg m-t, annál kisebb a különbség modulusa . Legyen , ahol ?>0, akkor annál kevesebb ?, annál pontosabb a m becslése. Ily módon ?>0 a paraméterbecslés pontosságát jellemzi. A statisztikai módszerek azonban nem teszik lehetővé, hogy kategorikusan kijelentsük, hogy m valódi értékének becslése kielégít , csak a valószínűségről beszélhetünk ?, amivel ez az egyenlőtlenség kielégül:

Ily módon ?- ezt bizalmi szintvagy a becslés megbízhatósága, jelentése ? előre kiválasztják a megoldandó probléma függvényében. Megbízhatóság ? 0,9-et szokás választani; 0,95; 0,99; 0,999. Az ilyen valószínűségű események gyakorlatilag biztosak. Egy adott megbízhatósági szinthez a ?>0 számot találhatja tól től .

Ezután megkapjuk az intervallumot , amely valószínűséggel fedi ? az m elvárás valódi értéke, ennek az intervallumnak a hossza 2 ?. Ezt az intervallumot ún megbízhatósági intervallum. És ez a módszer az ismeretlen m paraméter becslésére - intervallum.



Adjunk meg egy Х1, Х2, Х3, …, Хn mintát, és ez a minta találja meg, ,.

Meg kell találni a konfidencia intervallumot matematikai elvárásra m megbízhatósági valószínűséggel ?. Érték egy valószínűségi változó matematikai elvárással, .

Véletlenszerű érték totális természetű, nagy mintaszám mellett a normálishoz közeli törvény szerint oszlik el. Ekkor annak a valószínűsége, hogy egy valószínűségi változó az intervallumba esik, egyenlő lesz:


Ahol


Ahol a Laplace függvény.

A (3) képletből és a Laplace-függvény táblázataiból megtaláljuk a számot ?>0 és írja be a konfidencia intervallumot a pontos értékhez X valószínűségi változó megbízhatósággal ?.

Ebben a tanfolyami munka, az érték ? cserélje ki , majd a (3) képlet a következő formában jelenik meg:

Keressük a konfidencia intervallumot , amely tartalmazza a matematikai elvárást. Nál nél ? = 0,99, n = 100, ,.

a Laplace-táblázatok szerint:

Innen? = 0,5986.

Konfidenciaintervallum, amelyben 99%-os valószínűséggel a matematikai elvárás pontos értéke van.


Következtetés

véletlenszerű eloszlás gazdasági

A strukturális-paraméteres azonosítás problémáinak megoldása korlátozott mintamérettel, ami a metrológusok számára általában megvan, súlyosbítja a problémát. Ebben az esetben még fontosabb a statisztikai elemzési módszerek alkalmazásának helyessége. a legjobb statisztikai tulajdonságokkal és a legnagyobb teljesítményű kritériumokkal rendelkező becslések alkalmazása.

Az azonosítási problémák megoldása során célszerű a klasszikus megközelítésre hagyatkozni. Az azonosítás során ajánlatos az eloszlási törvények szélesebb körét figyelembe venni, beleértve a törvények keverékei formájában megjelenő modelleket is. Ebben az esetben bármely empirikus eloszlás mindig képesek leszünk megfelelő, statisztikailag szignifikánsan alátámasztott matematikai modell felépítésére.

A felhasználásra és a fejlesztésre kell összpontosítani szoftverrendszerek, megoldást nyújtva az eloszlási törvények szerkezeti-paraméteres azonosításának problémáira bármilyen rögzített megfigyelés (mérés) esetén, pl. modern módszerek statisztika elemző elemzés, a számítógépes modellezési módszerek széleskörű, de helyes felhasználása a kutatásban. Láttuk már, hogy sok kísérletnél nincs különbség az események valószínűségének kiszámításában, miközben ezekben a kísérletekben az elemi eredmények nagyon eltérőek. De éppen az események valószínűsége kell, hogy érdekeljen bennünket, és nem az elemi eredmények terének felépítése. Ezért itt az ideje, hogy minden ilyen „hasonló” kísérletben a legkülönbözőbb elemi eredmények helyett például számokat használjunk. Más szóval, minden elemi eredményhez hozzá kell rendelni valamilyen valós számot, és csak számokkal kell működni.

Küldje el a jó munkát a tudásbázis egyszerű. Használja az alábbi űrlapot

Azok a hallgatók, végzős hallgatók, fiatal tudósok, akik tanulmányaikban és munkájuk során használják fel a tudásbázist, nagyon hálásak lesznek Önnek.

közzétett http://www.allbest.ru/

közzétett http://www.allbest.ru/

Bevezetés

1. Khi-négyzet eloszlás

Következtetés

Függelék

Bevezetés

Hogyan hasznosulnak életünkben a valószínűségszámítás megközelítései, ötletei és eredményei? matematikai négyzetelmélet

Az alap egy valós jelenség vagy folyamat valószínűségi modellje, azaz. olyan matematikai modell, amelyben az objektív összefüggéseket valószínűségszámítással fejezik ki. A valószínűségek elsősorban a döntéshozatal során figyelembe veendő bizonytalanságok leírására szolgálnak. Ez egyaránt vonatkozik a nemkívánatos lehetőségekre (kockázatokra) és a vonzó lehetőségekre (" Szerencsés eset"). Néha a véletlenszerűséget szándékosan vezetik be a helyzetbe, például sorsoláskor, az ellenőrzési egységek véletlenszerű kiválasztásakor, sorsoláskor vagy fogyasztói felmérések során.

A valószínűségszámítás lehetővé teszi más valószínűségek kiszámítását, amelyek érdekesek a kutató számára.

Egy jelenség vagy folyamat valószínűségi modellje a matematikai statisztika alapja. Két párhuzamos fogalomsorozatot használnak - az elmélettel kapcsolatosakat (valószínűségi modell) és a gyakorlattal kapcsolatosakat (a megfigyelési eredmények mintája). Például az elméleti valószínűség megfelel a mintából talált gyakoriságnak. A matematikai elvárás (elméleti sorozat) megfelel a minta számtani átlagának (gyakorlati sorozat). A minta jellemzői általában az elméleti jellemzők becslései. Ugyanakkor az elméleti sorozathoz kapcsolódó mennyiségek "a kutatók fejében járnak", az eszmevilágra vonatkoznak (Platón ógörög filozófus szerint), közvetlen mérésre nem állnak rendelkezésre. A kutatók csak szelektív adatokkal rendelkeznek, amelyek segítségével egy elméleti valószínűségi modell számukra érdekes tulajdonságait próbálják megállapítani.

Miért van szükség valószínűségi modellre? A helyzet az, hogy csak a segítségével lehetséges egy adott minta elemzési eredményeivel megállapított tulajdonságokat átvinni más mintákra, valamint a teljes, úgynevezett általános sokaságra. A „populáció” kifejezést a vizsgált egységek nagy, de véges sokaságára használják. Például Oroszország összes lakosáról vagy Moszkvában az instant kávét fogyasztók összességéről. A marketing vagy szociológiai felmérések célja, hogy a több száz vagy több ezer fős mintától kapott kijelentéseket több millió fős populációhoz továbbítsák. A minőség-ellenőrzés során a termékek egy tétele általános populációként működik.

Ahhoz, hogy a következtetéseket egy mintából egy nagyobb sokaságba vigyük át, szükség van bizonyos feltételezésekre a minta jellemzőinek és a nagyobb sokaság jellemzőinek kapcsolatáról. Ezek a feltételezések megfelelő valószínűségi modellen alapulnak.

Természetesen lehetséges a mintaadatok feldolgozása egyik vagy másik valószínűségi modell használata nélkül. Például kiszámíthatja a minta számtani átlagát, kiszámíthatja bizonyos feltételek teljesítésének gyakoriságát stb. A számítások eredményei azonban csak egy adott mintára vonatkoznak, a segítségükkel kapott következtetések más halmazba átvitele helytelen. Ezt a tevékenységet néha „adatelemzésnek” is nevezik. A valószínűség-statisztikai módszerekkel összehasonlítva az adatelemzésnek korlátozott a kognitív értéke.

Tehát a valószínűségi-statisztikai döntéshozatali módszerek lényege a becslésen és a hipotézisek mintajellemzők segítségével történő tesztelésén alapuló valószínűségi modellek alkalmazása.

1. Khi-négyzet eloszlás

A normál eloszlás három olyan eloszlást határoz meg, amelyeket ma gyakran használnak statisztikai feldolgozás adat. Ezek Pearson ("chi - square"), Student és Fisher eloszlásai.

Az elosztásra fogunk összpontosítani ("chi - square"). Ezt az eloszlást először F. Helmert csillagász tanulmányozta 1876-ban. A Gauss-féle hibaelmélet kapcsán n független standard normális eloszlású valószínűségi változó négyzetösszegét vizsgálta. Később Karl Pearson ezt az eloszlási függvényt khi-négyzetnek nevezte el. És most a terjesztés az ő nevét viseli.

Köszönet szoros kapcsolat normál eloszlásnál a h2-eloszlás játszik fontos szerep a valószínűségszámításban és a matematikai statisztikában. A h2-eloszlás és sok más, a h2-eloszlás által meghatározott eloszlás (például a Student-eloszlás) különböző függvények mintaeloszlását írja le normálistól. elosztott eredményeket megfigyelések, és megbízhatósági intervallumok és statisztikai tesztek készítésére szolgálnak.

Pearson-eloszlás (chi - négyzet) - egy valószínűségi változó eloszlása, ahol X1, X2, ..., Xn normális független valószínűségi változók, és mindegyik matematikai elvárása nulla, a szórása pedig egy.

Négyzetek összege

törvény szerint elosztva ("chi - négyzet").

Ebben az esetben a kifejezések száma, pl. n-et a khi-négyzet eloszlás "szabadságfokainak számának" nevezzük. A szabadsági fokok számának növekedésével az eloszlás lassan megközelíti a normált.

Ennek az eloszlásnak a sűrűsége

Tehát a h2 eloszlása ​​egy n paramétertől függ - a szabadsági fokok számától.

A h2 eloszlásfüggvény alakja:

ha h2?0. (2.7.)

Az 1. ábra a valószínűségi sűrűség és a χ2 eloszlásfüggvény grafikonját mutatja különböző szabadsági fokokhoz.

1. ábra A q (x) valószínűségi sűrűség függése h2 eloszlásában (khí - négyzet) eltérő számú szabadsági fok esetén

A "khi-négyzet" eloszlás pillanatai:

A khi-négyzet eloszlást varianciabecslésben (konfidencia-intervallum használatával), egyezés, homogenitás, függetlenség hipotéziseinek tesztelésében, elsősorban véges számú értéket felvevő kvalitatív (kategorizált) változóknál, valamint számos egyéb statisztikai adatfeladatban alkalmazzák. elemzés.

2. "Khi-négyzet" a statisztikai adatelemzés problémáiban

Az adatelemzés statisztikai módszereit az emberi tevékenység szinte minden területén alkalmazzák. Ezeket akkor használják, amikor valamilyen belső heterogenitású csoportról (tárgyakról vagy szubjektumokról) kapcsolatos ítéletek megszerzéséhez és alátámasztásához szükséges.

A statisztikai módszerek fejlődésének modern szakasza 1900-tól számolható el, amikor az angol K. Pearson megalapította a „Biometrika” című folyóiratot. A 20. század első harmada paraméteres statisztika jele alatt ment át. A Pearson-családgörbék által leírt paraméteres eloszláscsaládok adatainak elemzésén alapuló módszereket tanulmányoztam. A legnépszerűbb a normál eloszlás volt. A hipotézisek tesztelésére a Pearson, Student és Fisher kritériumokat használtuk. Javasoltuk a maximum likelihood módszert, a varianciaanalízist, és megfogalmaztuk a kísérlet tervezésének főbb gondolatait.

A khi-négyzet eloszlás az egyik legszélesebb körben használt statisztika a statisztikai hipotézisek tesztelésére. A "khi-négyzet" eloszlás alapján megalkotják az egyik legerősebb illeszkedési tesztet, a Pearson-féle "khi-négyzet" tesztet.

Az illeszkedési teszt az ismeretlen eloszlás javasolt törvényére vonatkozó hipotézis tesztelésének kritériuma.

A p2 ("khi-négyzet") teszt a különböző eloszlások hipotézisének tesztelésére szolgál. Ez az ő érdeme.

A kritérium számítási képlete egyenlő

ahol m és m" empirikus, illetve elméleti frekvenciák

mérlegelés alatt álló elosztás;

n a szabadságfokok száma.

Az igazoláshoz össze kell hasonlítanunk az empirikus (megfigyelt) és az elméleti (normális eloszlás feltételezésével számolt) gyakoriságokat.

Ha az empirikus gyakoriságok teljesen egybeesnek a számított vagy várt gyakorisággal, akkor S (E - T) = 0 és a ch2 ismérv is nulla lesz. Ha S (E - T) nem egyenlő nullával, ez eltérést jelez a számított frekvenciák és a sorozat tapasztalati gyakoriságai között. Ilyen esetekben értékelni kell a p2 kritérium jelentőségét, amely elméletileg nullától a végtelenig változhat. Ez úgy történik, hogy a ch2f ténylegesen kapott értékét összehasonlítjuk a kritikus értékével (ch2st) (a) és a szabadságfokok számával (n).

A h2 valószínűségi változó valószínű értékeinek eloszlása ​​folytonos és aszimmetrikus. Függ a szabadsági fokok számától (n), és a megfigyelések számának növekedésével megközelíti a normális eloszlást. Ezért a p2 kritérium alkalmazása az értékelésre diszkrét eloszlások néhány hibával jár, amelyek befolyásolják az értékét, különösen kis minták esetén. A pontosabb becslések érdekében a variációs sorozatban elosztott mintának legalább 50 opciót kell tartalmaznia. A p2 kritérium helyes alkalmazása azt is megköveteli, hogy a szélső osztályok változatainak gyakorisága ne legyen kisebb 5-nél; ha 5-nél kevesebb van belőlük, akkor ezeket a szomszédos osztályok gyakoriságaival kombináljuk úgy, hogy a teljes összeg 5-nél nagyobb vagy egyenlő legyen. A gyakoriságok kombinációjának megfelelően az osztályok száma (N) is csökken. A szabadsági fokok számát a másodlagos osztályok számának megfelelően állítjuk be, figyelembe véve a variációs szabadság korlátozásainak számát.

Mivel a p2 kritérium meghatározásának pontossága nagymértékben függ az elméleti frekvenciák (T) számítási pontosságától, ezért az empirikus és a számított frekvenciák közötti különbség meghatározásához kerekítetlen elméleti frekvenciákat kell használni.

Példaként vegyünk egy tanulmányt, amelyet a statisztikai módszerek humán tudományok alkalmazásával foglalkozó weboldalon tettek közzé.

A Khi-négyzet teszt lehetővé teszi a gyakorisági eloszlások összehasonlítását, függetlenül attól, hogy normális eloszlásúak-e vagy sem.

A gyakoriság egy esemény előfordulásának számát jelenti. Egy esemény előfordulási gyakoriságával általában akkor foglalkozunk, amikor a változókat a névskálában mérjük, és egyéb jellemzőik kiválasztása a gyakoriság kivételével lehetetlen vagy problémás. Más szóval, amikor egy változónak van minőségi jellemzők. Emellett sok kutató hajlamos a teszteredményeket szintekre fordítani (magas, közepes, alacsony), és táblázatokat készít a pontszámok eloszlásáról, hogy megtudja, hány ember van ezeken a szinteken. Annak bizonyítására, hogy valamelyik szinten (valamelyik kategóriában) valóban több (kevesebb) a létszám, a Khi-négyzet együtthatót is alkalmazzák.

Nézzük a legegyszerűbb példát.

Fiatalabb serdülők körében önértékelési tesztet végeztek. A teszteredményeket három szintre fordították: magas, közepes, alacsony. A frekvenciák a következőképpen oszlanak meg:

Magas (H) 27 fő.

Közepes (C) 12 fő

Alacsony (H) 11 fő.

Nyilvánvaló, hogy a magas önértékelésű gyerekek többsége ezt statisztikailag igazolni kell. Ehhez a Khi-négyzet tesztet használjuk.

Feladatunk annak ellenőrzése, hogy a kapott empirikus adatok eltérnek-e az elméletileg egyformán valószínű adatoktól. Ehhez meg kell találni az elméleti frekvenciákat. Esetünkben az elméleti gyakoriságok kiegyenlíthető gyakoriságok, amelyeket úgy kapunk meg, hogy az összes frekvenciát összeadjuk és elosztjuk a kategóriák számával.

A mi esetünkben:

(B + C + H) / 3 \u003d (27 + 12 + 11) / 3 \u003d 16,6

A khi-négyzet próba kiszámításának képlete a következő:

h2 \u003d? (E - T) I / T

Asztalt készítünk:

Empirikus (Uh)

Elméleti (T)

(E - T)І / T

Keresse meg az utolsó oszlop összegét:

Most meg kell találnia a kritérium kritikus értékét a kritikus értékek táblázata szerint (1. táblázat a függelékben). Ehhez szükségünk van a szabadsági fokok számára (n).

n = (R - 1) * (C - 1)

ahol R a táblázat sorainak száma, C az oszlopok száma.

Esetünkben csak egy oszlop (értsd: az eredeti empirikus gyakoriságok) és három sor (kategória) van, így a képlet megváltozik - az oszlopokat kizárjuk.

n = (R-1) = 3-1 = 2

A p?0,05 hibavalószínűség és n = 2 esetén a kritikus érték h2 = 5,99.

A kapott tapasztalati érték nagyobb, mint a kritikus érték – a gyakorisági különbségek szignifikánsak (n2= 9,64; p≤0,05).

Amint láthatja, a kritérium kiszámítása nagyon egyszerű, és nem vesz sok időt. A khi-négyzet teszt gyakorlati értéke óriási. Ez a módszer a legértékesebb a kérdőívekre adott válaszok elemzésében.

Vegyünk egy összetettebb példát.

Például egy pszichológus azt szeretné tudni, hogy igaz-e, hogy a tanárok elfogultabbak a fiúkkal, mint a lányokkal szemben. Azok. nagyobb valószínűséggel dicsérik a lányokat. Ehhez a pszichológus a tanulók tanárok által írt jellemzőit elemezte három szó előfordulási gyakorisága tekintetében: „aktív”, „szorgalmas”, „fegyelmezett”, a szavak szinonimáit is megszámolta.

A szavak előfordulási gyakoriságára vonatkozó adatok a táblázatba kerültek:

A kapott adatok feldolgozásához a khi-négyzet tesztet használjuk.

Ehhez elkészítjük az empirikus gyakoriságok eloszlási táblázatát, azaz. az általunk megfigyelt frekvenciák:

Elméletileg azt várjuk, hogy a frekvenciák egyenlően oszlanak el, pl. a gyakoriság arányosan oszlik el fiúk és lányok között. Készítsünk egy táblázatot az elméleti frekvenciákról. Ehhez meg kell szorozni a sor összegét az oszlop összegével, és a kapott számot el kell osztani a teljes összeggel (s).

Az eredményül kapott számítási táblázat így fog kinézni:

Empirikus (Uh)

Elméleti (T)

(E - T)І / T

fiúk

"Aktív"

"Szorgalmas"

"Fegyelmezett"

"Aktív"

"Szorgalmas"

"Fegyelmezett"

Összeg: 4.21

h2 \u003d? (E - T) I / T

ahol R a táblázat sorainak száma.

Esetünkben khi-négyzet = 4,21; n = 2.

A kritérium kritikus értékeinek táblázata szerint azt találjuk, hogy n = 2 és 0,05 hibaszint mellett a kritikus érték h2 = 5,99.

A kapott érték kisebb, mint a kritikus érték, ami azt jelenti, hogy a nullhipotézist elfogadjuk.

Következtetés: a tanárok nem tulajdonítanak jelentőséget a gyermek nemének, amikor megírják a jellemzőit.

Következtetés

Szinte minden szakterület hallgatói tanulnak a kurzus végén felsőbb matematika"valószínűségszámítás és matematikai statisztika" részben a valóságban csak néhány alapfogalmat és eredményt ismernek meg, amelyek nyilvánvalóan nem elegendőek praktikus munka. A hallgatók speciális kurzusokon találkoznak bizonyos matematikai kutatási módszerekkel (például „Előrejelzés és megvalósíthatósági tervezés”, „Műszaki és gazdasági elemzés”, „Termékminőség-ellenőrzés”, „Marketing”, „Controlling”, „ Matematikai módszerek Előrejelzés", "Statisztika" stb. - a közgazdasági szakos hallgatók esetében), azonban a bemutatás a legtöbb esetben nagyon rövidített és előírásos jellegű, ebből adódóan az alkalmazott statisztika szakemberei nem rendelkeznek kellő ismeretekkel.

Ezért az "Alkalmazott statisztika" tanfolyam in műszaki egyetemek, a gazdasági egyetemeken pedig az "Ökonometria" kurzus, mivel az ökonometria, mint tudják, konkrét gazdasági adatok statisztikai elemzése.

A valószínűségszámítás és a matematikai statisztika alapvető ismereteket nyújt az alkalmazott statisztika és ökonometria számára.

A gyakorlati munkához szakemberek számára szükségesek.

Folytonos valószínűségi modellt vizsgáltam, és példákkal próbáltam bemutatni annak használhatóságát.

Munkám végén pedig arra a következtetésre jutottam, hogy a matematikai és statikus adatelemzés alapvető eljárásainak kompetens megvalósítása, a hipotézisek statikus tesztelése lehetetlen a khi-négyzet modell ismerete, valamint a használat képessége nélkül. az asztala.

Bibliográfia

1. Orlov A.I. Alkalmazott statisztika. M.: "Exam" kiadó, 2004.

2. Gmurman V.E. Valószínűségelmélet és matematikai statisztika. M.: Gimnázium, 1999. - 479s.

3. Ayvozyan S.A. Valószínűségszámítás és alkalmazott statisztika, v.1. M.: Egység, 2001. - 656s.

4. Khamitov G.P., Vedernikova T.I. Valószínűségek és statisztikák. Irkutszk: BSUEP, 2006 - 272p.

5. Ezhova L.N. Ökonometria. Irkutszk: BSUEP, 2002. - 314p.

6. Mosteller F. Ötven szórakoztató valószínűségi probléma megoldásokkal. M.: Nauka, 1975. - 111p.

7. Mosteller F. Valószínűség. M.: Mir, 1969. - 428s.

8. Yaglom A.M. Valószínűség és információ. M.: Nauka, 1973. - 511s.

9. Chistyakov V.P. Valószínűségi tanfolyam. M.: Nauka, 1982. - 256s.

10. Kremer N.Sh. Valószínűségelmélet és matematikai statisztika. M.: UNITI, 2000. - 543p.

11. Matematikai enciklopédia, v.1. M.: Szovjet Enciklopédia, 1976. - 655s.

12. http://psystat.at.ua/ - Statisztika a pszichológiában és pedagógiában. Cikk Khi-négyzet teszt.

Függelék

Kritikus eloszlási pontok p2

Asztal 1

Az Allbest.ru oldalon található

...

Hasonló dokumentumok

    Valószínűségi modell és axiomatika A.N. Kolmogorov. Véletlenszerű változók és vektorok, a valószínűségszámítás klasszikus határproblémája. Statisztikai adatok elsődleges feldolgozása. Numerikus jellemzők pontbecslései. Hipotézisek statisztikai vizsgálata.

    képzési kézikönyv, hozzáadva: 2010.02.03

    A kivitelezés és a tervezés szabályai vezérlés működik számára levelező osztály. Feladatok és példák a matematikai statisztika és a valószínűségszámítás feladatmegoldására. Eloszlási referencia adattáblák, szabványos normál eloszlási sűrűség.

    képzési kézikönyv, hozzáadva: 2009.11.29

    A véletlenszerű jelenségek formalizált leírásának és elemzésének főbb módszerei, az eredmények feldolgozása és elemzése a fizikai ill numerikus kísérletek Valószínűségi elmélet. A valószínűségszámítás alapfogalmai és axiómái. A matematikai statisztika alapfogalmai.

    előadások tanfolyama, hozzáadva 2011.08.04

    A mérési eredmények valószínűség-eloszlási törvényének meghatározása a matematikai statisztikában. Az empirikus eloszlás elméletinek való megfelelésének ellenőrzése. Annak a konfidencia intervallumnak a meghatározása, amelyben a mért mennyiség értéke található.

    szakdolgozat, hozzáadva 2012.11.02

    Valószínűségi változók sorozatainak és valószínűségi eloszlásának konvergenciája. A karakterisztikus függvények módszere. Statisztikai hipotézisek tesztelése és központi elvégzése határtétel független valószínűségi változók adott sorozataira.

    szakdolgozat, hozzáadva 2012.11.13

    A természetes megfigyelésekből származó adatok feldolgozásának főbb szakaszai a matematikai statisztika módszerével. A kapott eredmények értékelése, felhasználása vezetői döntések meghozatalában a természetvédelem és a természetgazdálkodás területén. Statisztikai hipotézisek tesztelése.

    gyakorlati munka, hozzáadva 2013.05.24

    Az eloszlási törvény lényege és gyakorlati alkalmazása statisztikai problémák megoldására. Valószínűségi változó varianciájának, matematikai elvárásnak és szórásának meghatározása. Az egyirányú varianciaanalízis jellemzői.

    teszt, hozzáadva: 2013.12.07

    Valószínűség és annak általános meghatározás. Valószínűségek összeadási és szorzási tételei. Diszkrét valószínűségi változók és numerikus jellemzőik. A nagy számok törvénye. A minta statisztikai megoszlása. A korrelációs és regressziós elemzés elemei.

    előadások tanfolyama, hozzáadva 2015.06.13

    A tantárgy programja, a valószínűségszámítás alapfogalmai és képletei, azok indoklása és jelentősége. A matematikai statisztika helye és szerepe a tudományágban. Példák és magyarázatok a leggyakoribb problémák megoldására a különféle témákat tudományágak adatai.

    képzési kézikönyv, hozzáadva: 2010.01.15

    A valószínűségszámítás és a matematikai statisztika a tömeges véletlenszerű jelenségek kvantitatív elemzésének módszereivel foglalkozó tudományok. Egy valószínűségi változó értékkészletét mintának, a halmaz elemeit pedig egy valószínűségi változó mintaértékeinek nevezzük.

Részvény