Primjenjive su vjerojatnostne i statističke metode. Probabilističke i statističke metode

U skladu sa tri glavne mogućnosti – donošenje odluka u uslovima potpune izvesnosti, rizika i neizvesnosti – metode i algoritmi odlučivanja se mogu podeliti u tri glavna tipa: analitičke, statističke i zasnovane na fazi formalizacije. U svakom konkretnom slučaju, metod odlučivanja se bira na osnovu zadatka, dostupnih početnih podataka, dostupnih modela problema, okruženja za donošenje odluka, procesa odlučivanja, tražene tačnosti rešenja i ličnih preferencija analitičara.

U nekim informacionim sistemima proces odabira algoritma se može automatizovati:

Odgovarajući automatizovani sistem ima mogućnost da koristi niz različitih tipova algoritama (biblioteka algoritama);

Sistem interaktivno traži od korisnika da odgovori na brojna pitanja o glavnim karakteristikama problema koji se razmatra;

Na osnovu rezultata odgovora korisnika, sistem nudi najprikladniji (prema kriterijumima navedenim u njemu) algoritam iz biblioteke.

2.3.1 Probabilističko-statističke metode odlučivanja

Probabilističko-statističke metode odlučivanja (MPD) se koriste kada efikasnost donesenih odluka zavisi od faktora koji su slučajne varijable za koje su poznati zakoni raspodjele vjerovatnoće i druge statističke karakteristike. Štaviše, svaka odluka može dovesti do jednog od mnogih mogućih ishoda, a svaki ishod ima određenu vjerovatnoću nastanka, koja se može izračunati. Uz pomoć probabilističkih karakteristika opisuju se i indikatori koji karakterišu problemsku situaciju.Sa takvim DPR-om donosilac odluke uvek rizikuje da dobije pogrešan rezultat, kojim se rukovodi, birajući optimalno rešenje na osnovu prosečnih statističkih karakteristika slučajni faktori, odnosno odluka se donosi u uslovima rizika.

U praksi se često koriste probabilističke i statističke metode kada se zaključci izvučeni iz podataka uzorka prenose na cijelu populaciju (na primjer, iz uzorka na cijelu seriju proizvoda). Međutim, u ovom slučaju, u svakoj konkretnoj situaciji, prvo treba procijeniti temeljnu mogućnost dobijanja dovoljno pouzdanih vjerovatnostnih i statističkih podataka.

Kada se pri donošenju odluka koriste ideje i rezultati teorije vjerovatnoće i matematičke statistike, osnova je matematički model, u kojem su objektivni odnosi izraženi u terminima teorije vjerovatnoće. Vjerovatnoće se prvenstveno koriste za opisivanje slučajnosti koja se mora uzeti u obzir prilikom donošenja odluka. To se odnosi i na nepoželjne prilike (rizici) i na one atraktivne („sretna prilika“).

Suština probabilističko-statističkih metoda odlučivanja je upotreba vjerovatnog modela zasnovanog na procjeni i testiranju hipoteza korištenjem karakteristika uzorka..

Naglašavamo da je logika korištenja karakteristika uzorka za donošenje odluka na osnovu teorijskih modela uključuje istovremenu upotrebu dvije paralelne serije koncepata– vezano za teoriju (vjerovatni model) i vezano za praksu (uzorak rezultata opservacije). Na primjer, teorijska vjerovatnoća odgovara frekvenciji pronađenoj iz uzorka. Matematičko očekivanje (teorijski niz) odgovara uzorku aritmetičke sredine (praktične serije). U pravilu, karakteristike uzorka su procjene teorijskih karakteristika.

Prednosti korištenja ovih metoda uključuju mogućnost uzimanja u obzir različitih scenarija razvoja događaja i njihove vjerovatnoće. Nedostatak ovih metoda je što je vjerovatnoće scenarija koje se koriste u proračunima obično vrlo teško dobiti u praksi.

Primjena specifične probabilističko-statističke metode odlučivanja sastoji se od tri faze:

Prelazak sa ekonomske, menadžerske, tehnološke stvarnosti na apstraktnu matematičku i statističku shemu, tj. izgradnja probabilističkog modela sistema upravljanja, tehnološkog procesa, postupka donošenja odluka, posebno na osnovu rezultata statističke kontrole, itd.

Izvođenje proračuna i dobijanje zaključaka čisto matematičkim sredstvima u okviru vjerovatnog modela;

Interpretacija matematičkih i statističkih zaključaka u odnosu na realno stanje i donošenje odgovarajuće odluke (npr. o usklađenosti ili neusklađenosti kvaliteta proizvoda sa utvrđenim zahtjevima, potrebi prilagođavanja tehnološkog procesa i sl.), posebno, zaključci (o udjelu neispravnih jedinica proizvoda u seriji, o specifičnom obliku zakona raspodjele kontrolisanih parametara tehnološkog procesa, itd.).

Vjerovatni model realnog fenomena treba smatrati izgrađenim ako su veličine koje se razmatraju i odnosi između njih izraženi u terminima teorije vjerovatnoće. Adekvatnost probabilističkog modela potkrepljena je, posebno, statističkim metodama za testiranje hipoteza.

Matematička statistika se obično dijeli u tri dijela prema vrsti problema koji se rješavaju: opis podataka, procjena i testiranje hipoteza. Prema vrsti statističkih podataka koji se obrađuju, matematička statistika je podijeljena u četiri oblasti:

Jednodimenzionalna statistika (statistika slučajnih varijabli), u kojoj je rezultat posmatranja opisan realnim brojem;

Multidimenzionalno Statistička analiza, pri čemu je rezultat posmatranja nad objektom opisan sa nekoliko brojeva (vektora);

Statistika slučajnih procesa i vremenskih serija, gde je rezultat posmatranja funkcija;

Statistika objekata nenumeričke prirode, u kojoj je rezultat posmatranja nenumeričke prirode, na primjer, to je skup (geometrijska figura), poredak ili dobiven kao rezultat mjerenja pomoću kvalitativni atribut.

Primjer kada je preporučljivo koristiti vjerovatno-statističke modele.

Prilikom kontrole kvaliteta bilo kojeg proizvoda, iz njega se uzima uzorak kako bi se odlučilo da li proizvedena serija proizvoda ispunjava utvrđene zahtjeve. Na osnovu rezultata kontrole uzorka donosi se zaključak o cijeloj seriji. U ovom slučaju je vrlo važno izbjeći subjektivnost u formiranju uzorka, odnosno potrebno je da svaka jedinica proizvoda u kontrolisanoj seriji ima istu vjerovatnoću da bude odabrana u uzorku. Izbor na osnovu lota u takvoj situaciji nije dovoljno objektivan. Stoga se u proizvodnim uvjetima odabir proizvodnih jedinica u uzorku obično ne vrši putem lota, već pomoću posebnih tablica slučajnih brojeva ili pomoću kompjuterskih generatora slučajnih brojeva.

U statističkoj regulaciji tehnoloških procesa, na osnovu metoda matematičke statistike, izrađuju se pravila i planovi za statističku kontrolu procesa, u cilju blagovremenog otkrivanja poremećaja tehnoloških procesa i preduzimanja mjera za njihovo prilagođavanje i sprečavanje puštanja proizvoda koji ne rade. ne ispunjavaju utvrđene uslove. Ove mjere imaju za cilj smanjenje troškova proizvodnje i gubitaka od nabavke nekvalitetnih proizvoda. Uz statističku kontrolu prihvata, na osnovu metoda matematičke statistike, izrađuju se planovi kontrole kvaliteta analizom uzoraka iz serija proizvoda. Poteškoća je u tome da se pravilno grade vjerovatno-statistički modeli odlučivanja, na osnovu kojih je moguće odgovoriti na postavljena pitanja. U matematičkoj statistici su u tu svrhu razvijeni probabilistički modeli i metode za testiranje hipoteza3.

Osim toga, u nizu upravljačkih, industrijskih, ekonomskih, nacionalno-ekonomskih situacija javljaju se problemi drugačijeg tipa – problemi procjene karakteristika i parametara distribucije vjerovatnoće.

Ili, u statističkoj analizi tačnosti i stabilnosti tehnoloških procesa, potrebno je vrednovati takve pokazatelje kvaliteta kao što su prosečna vrednost kontrolisanog parametra i stepen njegove rasprostranjenosti u procesu koji se razmatra. Prema teoriji vjerovatnoće, kao prosječna vrijednost slučajna varijabla preporučljivo je koristiti njegovo matematičko očekivanje, a kao statističku karakteristiku raspršenosti - varijansu, standardnu ​​devijaciju ili koeficijent varijacije. Ovo postavlja pitanje: kako procijeniti ove statističke karakteristike iz podataka uzorka i s kojom tačnošću se to može učiniti? U literaturi ima mnogo sličnih primjera. Svi oni pokazuju kako se teorija vjerovatnoće i matematička statistika mogu koristiti u upravljanju proizvodnjom pri donošenju odluka u oblasti statističkog upravljanja kvalitetom proizvoda.

U određenim oblastima primjene koriste se kako vjerovatno-statističke metode široke primjene, tako i specifične. Na primjer, u dijelu upravljanja proizvodnjom koji je posvećen statističkim metodama kontrole kvaliteta proizvoda, koristi se primijenjena matematička statistika (uključujući dizajn eksperimenata). Uz pomoć njegovih metoda vrši se statistička analiza tačnosti i stabilnosti tehnoloških procesa i statistička procjena kvaliteta. Specifične metode uključuju metode statističke kontrole prihvatljivosti kvaliteta proizvoda, statističke regulacije tehnoloških procesa, procjene i kontrole pouzdanosti itd.

U upravljanju proizvodnjom, posebno pri optimizaciji kvaliteta proizvoda i osiguravanju usklađenosti sa standardima, posebno je važna primjena statističkih metoda u početnoj fazi životnog ciklusa proizvoda, tj. u fazi istraživačke pripreme razvoja eksperimentalnog dizajna (izrada obećavajućih zahtjeva za proizvode, idejni projekt, projektni zadatak za izradu eksperimentalnog dizajna). To je zbog ograničenih informacija dostupnih u početnoj fazi životnog ciklusa proizvoda i potrebe za predviđanjem tehničkih mogućnosti i ekonomske situacije za budućnost.

Najčešće probabilističko-statističke metode su regresiona analiza, faktorska analiza, analiza varijanse, statističke metode za procjenu rizika, metoda scenarija itd. Oblast statističkih metoda, posvećena analizi statističkih podataka nenumeričke prirode, dobija sve veći značaj. rezultati mjerenja kvalitativnih i heterogenih karakteristika. Jedna od glavnih primjena statistike objekata nenumeričke prirode je teorija i praksa stručnih procjena vezanih za teoriju statističkih odluka i problema glasanja.

Uloga osobe u rješavanju problema metodama teorije statističkih odluka je da formuliše problem, odnosno da stvarni problem dovede do odgovarajućeg modela, da na osnovu statističkih podataka odredi vjerovatnoće događaja, kao i da odobriti dobijeno optimalno rješenje.

Dio 1. Temelji primijenjene statistike

1.2.3. Suština vjerovatno-statističkih metoda odlučivanja

Kako se pristupi, ideje i rezultati teorije vjerovatnoće i matematičke statistike koriste u donošenju odluka?

Osnova je probabilistički model realne pojave ili procesa, tj. matematički model u kojem se objektivni odnosi izražavaju u terminima teorije vjerovatnoće. Vjerovatnoće se prvenstveno koriste za opisivanje neizvjesnosti koje je potrebno uzeti u obzir prilikom donošenja odluka. To se odnosi i na nepoželjne prilike (rizici) i na one atraktivne („sretna prilika“). Ponekad se slučajnost namjerno unosi u situaciju, na primjer, prilikom izvlačenja ždrijeba, slučajnog odabira jedinica za kontrolu, provođenja lutrije ili anketiranja potrošača.

Teorija vjerovatnoće omogućava da se izračunaju druge vjerovatnoće koje su od interesa za istraživača. Na primjer, prema vjerovatnoći da grb ispadne, možete izračunati vjerovatnoću da će najmanje 3 grba ispasti u 10 bacanja novčića. Takav proračun se temelji na vjerojatnosnom modelu, prema kojem se bacanja novčića opisuju shemom neovisnih pokušaja, osim toga, grb i rešetka su jednako vjerojatni, pa je vjerojatnost svakog od ovih događaja ½. Složeniji je model koji razmatra provjeru kvaliteta jedinice izlaza umjesto bacanja novčića. Odgovarajući probabilistički model zasniva se na pretpostavci da je kontrola kvaliteta različitih proizvodnih jedinica opisana šemom nezavisnih testova. Za razliku od modela bacanja novčića, potrebno je uvesti novi parametar - vjerovatnoću R da je proizvod neispravan. Model će biti u potpunosti opisan ako se pretpostavi da sve proizvodne jedinice imaju istu vjerovatnoću da će biti neispravne. Ako je posljednja pretpostavka pogrešna, tada se povećava broj parametara modela. Na primjer, možemo pretpostaviti da svaka jedinica proizvodnje ima svoju vlastitu vjerovatnoću da će biti neispravna.

Hajde da razgovaramo o modelu kontrole kvaliteta sa zajedničkom verovatnoćom kvara za sve jedinice proizvoda R. Da bi se “došlo do broja” prilikom analize modela, potrebno je izvršiti zamjenu R na neku specifičnu vrijednost. Da bi se to postiglo, potrebno je izaći iz okvira probabilističkog modela i okrenuti se podacima dobijenim tokom kontrole kvaliteta. Matematička statistika rješava inverzni problem u odnosu na teoriju vjerovatnoće. Njegova svrha je da se na osnovu rezultata opservacija (mjerenja, analize, testovi, eksperimenti) izvuku zaključci o vjerovatnoćama koje su u osnovi vjerovatnog modela. Na primjer, na osnovu učestalosti pojavljivanja neispravnih proizvoda tokom kontrole, mogu se izvući zaključci o vjerovatnoći neispravnosti (vidjeti Bernoullijevu teoremu iznad). Na osnovu Čebiševe nejednakosti izvedeni su zaključci o korespondenciji učestalosti pojavljivanja neispravnih proizvoda hipotezi da vjerovatnoća defekta ima određenu vrijednost.

Stoga se primjena matematičke statistike zasniva na vjerovatnom modelu pojave ili procesa. Koriste se dvije paralelne serije koncepata - oni koji se odnose na teoriju (vjerovatni model) i oni koji se odnose na praksu (uzorak rezultata opservacije). Na primjer, teorijska vjerovatnoća odgovara frekvenciji pronađenoj iz uzorka. Matematičko očekivanje (teorijski niz) odgovara uzorku aritmetičke sredine (praktične serije). Po pravilu, karakteristike uzorka su procjene teorijskih. Istovremeno, količine koje se odnose na teorijske serije „nalaze se u glavama istraživača“, odnose se na svijet ideja (prema starogrčkom filozofu Platonu) i nisu dostupne za direktno mjerenje. Istraživači imaju samo selektivne podatke, uz pomoć kojih pokušavaju da utvrde svojstva teorijskog vjerovatnog modela koja ih zanimaju.

Zašto nam je potreban probabilistički model? Činjenica je da je samo uz njegovu pomoć moguće prenijeti svojstva utvrđena rezultatima analize određenog uzorka na druge uzorke, kao i na cjelokupnu tzv. opštu populaciju. Termin "populacija" se koristi za označavanje velike, ali ograničene populacije jedinica koje se proučavaju. Na primjer, o ukupnosti svih stanovnika Rusije ili ukupnosti svih potrošača instant kafe u Moskvi. Svrha marketinških ili socioloških istraživanja je da se izjave primljene sa uzorka od stotina ili hiljada ljudi prenesu na opću populaciju od nekoliko miliona ljudi. U kontroli kvaliteta, serija proizvoda djeluje kao opća populacija.

Da bi se zaključci prenijeli iz uzorka na veću populaciju, potrebne su neke pretpostavke o odnosu karakteristika uzorka sa karakteristikama ove veće populacije. Ove pretpostavke su zasnovane na odgovarajućem vjerovatnostnom modelu.

Naravno, moguće je obraditi podatke uzorka bez korištenja jednog ili drugog vjerovatnostnog modela. Na primjer, možete izračunati uzorak aritmetičke sredine, izračunati učestalost ispunjenja određenih uslova itd. Međutim, rezultati proračuna primjenjivat će se samo na određeni uzorak; prenošenje zaključaka dobivenih uz njihovu pomoć na bilo koji drugi skup je pogrešno. Ova aktivnost se ponekad naziva i "analiza podataka". U poređenju sa probabilističko-statističkim metodama, analiza podataka ima ograničenu kognitivnu vrednost.

Dakle, upotreba probabilističkih modela zasnovanih na procjeni i testiranju hipoteza uz pomoć karakteristika uzorka je suština vjerovatno-statističkih metoda odlučivanja.

Ističemo da logika korištenja karakteristika uzorka za donošenje odluka na temelju teorijskih modela podrazumijeva istovremenu upotrebu dvije paralelne serije koncepata, od kojih jedan odgovara probabilističkim modelima, a drugi uzorku podataka. Nažalost, u brojnim književnim izvorima, obično zastarjelim ili napisanim u duhu recepta, ne pravi se razlika između selektivnih i teorijskih karakteristika, što čitaoce dovodi do zbunjenosti i grešaka u praktičnoj upotrebi statističkih metoda.

Prethodno

Pojave života, kao i svi fenomeni materijalnog svijeta općenito, imaju dvije neraskidivo povezane strane: kvalitativnu, koju opažaju direktno osjetila, i kvantitativnu, izraženu brojevima uz pomoć brojanja i mjere.

U proučavanju različitih prirodnih fenomena istovremeno se koriste i kvalitativni i kvantitativni pokazatelji. Nesumnjivo, samo u jedinstvu kvalitativne i kvantitativne strane najpotpunije se otkriva suština proučavanih pojava. Međutim, u stvarnosti se mora koristiti ili jedan ili drugi indikator.

Bez sumnje, kvantitativne metode, budući da su objektivnije i preciznije, imaju prednost u odnosu na kvalitativne karakteristike objekata.

Sami rezultati mjerenja, iako imaju poznatu vrijednost, još uvijek nisu dovoljni da se iz njih izvuku potrebni zaključci. Digitalni podaci prikupljeni u procesu masovnog testiranja samo su sirovi činjenični materijal koji treba odgovarajuću matematičku obradu. Bez obrade – sređivanja i sistematizacije digitalnih podataka nije moguće izdvojiti informacije koje se nalaze u njima, ocijeniti pouzdanost pojedinačnih zbirnih pokazatelja i provjeriti pouzdanost uočenih razlika među njima. Ovaj rad zahtijeva od stručnjaka da posjeduju određena znanja, sposobnost da pravilno generalizuju i analiziraju podatke prikupljene u eksperimentu. Sistem ovih znanja je sadržaj statistike - nauke koja se uglavnom bavi analizom rezultata istraživanja u teorijskim i primenjenim oblastima nauke.

Treba imati na umu da su matematička statistika i teorija vjerovatnoće čisto teorijske, apstraktne nauke; oni proučavaju statističke agregate bez obzira na specifičnosti njihovih sastavnih elemenata. Metode matematičke statistike i teorija vjerovatnoće koja je u njenoj osnovi primjenjive su na najrazličitije oblasti znanja, uključujući i humanističke nauke.

Proučavanje fenomena se ne provodi na pojedinačnim zapažanjima, koja se mogu pokazati kao nasumična, netipična, nepotpuno izražavajući suštinu ovog fenomena, već na skupu homogenih zapažanja, što daje više pune informacije o objektu koji se proučava. Određeni skup relativno homogenih subjekata, kombinovanih prema jednom ili drugom atributu za zajedničko proučavanje, naziva se statističkim

agregat. Skup kombinuje određeni broj homogenih opažanja ili registracija.

Elementi koji čine skup nazivaju se njegovim članovima ili varijantama. . Opcije su pojedinačna opažanja ili numeričke vrijednosti neke karakteristike. Dakle, ako označimo obilježje kao X (veliko), tada će njegove vrijednosti ili varijante biti označene sa x (malo), tj. x 1 , x 2 , itd.

Ukupan broj opcija koje čine ovaj skup naziva se njegov volumen i označava se slovom n (malo).

Kada se čitav skup homogenih objekata u cjelini podvrgne istraživanju, naziva se općim, općim skupom.Primjer takvog kontinuiranog opisa skupa mogu biti nacionalni popisi stanovništva, ukupna statistička evidencija životinja u zemlja. Naravno, kompletan pregled opće populacije daje najpotpunije informacije o njenom stanju i svojstvima. Stoga je prirodno da istraživači nastoje da spoje što više zapažanja u zbir.

Međutim, u stvarnosti, rijetko je potrebno pribjeći anketi svih pripadnika opće populacije. Prvo, zato što ovaj posao zahtijeva mnogo vremena i truda, a drugo, nije uvijek izvodljiv iz niza razloga i različitih okolnosti. Dakle, umjesto kontinuiranog istraživanja opće populacije, obično se neki njen dio, nazvan uzorkovana populacija, ili uzorak, podvrgava proučavanju. To je model po kojem se ocjenjuje cjelokupna opća populacija kao cjelina. Na primjer, da bi se saznao prosječan priraštaj regrutnog stanovništva određenog regiona ili okruga, uopće nije potrebno mjeriti sve regrute koji žive na datom području, već je dovoljno izmjeriti dio njih.

1. Uzorak mora biti prilično reprezentativan, ili tipičan, tj. tako da uključuje uglavnom one opcije koje najpotpunije odražavaju opću populaciju. Stoga, kako bi se započelo s obradom podataka uzorka, oni se pažljivo pregledavaju i uklanjaju se jasno atipične opcije. Na primjer, kada se analizira trošak proizvoda koje proizvede preduzeće, treba isključiti trošak u onim periodima kada preduzeće nije bilo u potpunosti opskrbljeno komponentama ili sirovinama.

2. Uzorak mora biti objektivan. Prilikom formiranja uzorka ne treba se ponašati proizvoljno, uključiti u njegov sastav samo one opcije koje izgledaju tipično, a sve ostale odbaciti. Benigni uzorak se pravi bez predrasuda, metodom lutrije ili lutrije, kada nijedna opcija u opštoj populaciji nema prednosti u odnosu na druge – da padne ili ne padne u populaciju uzorka. Drugim riječima, uzorak treba napraviti po principu slučajnog odabira, bez uticaja na njegov sastav.

3. Uzorak mora biti kvalitativno homogen. Ne možete uključiti u isti uzorak podatke dobijene pod različitim uslovima, na primjer, trošak proizvoda dobijenih s različitim brojem zaposlenih.

6.2. Grupisanje rezultata posmatranja

Obično se rezultati eksperimenata i zapažanja unose u obliku brojeva u registarske kartice ili dnevnik, a ponekad jednostavno na listove papira - dobije se izjava ili registar. Takvi početni dokumenti, po pravilu, sadrže informacije ne o jednom, već o nekoliko znakova, prema kojima su vršena zapažanja. Ovi dokumenti služe kao glavni izvor formiranja uzorka. To se obično radi ovako: na posebnom listu papira od primarnog dokumenta, tj. kartoteka, dnevnik ili izvod, ispisuju se numeričke vrijednosti atributa na kojem se formira populacija. Varijante u takvom skupu se obično prikazuju u obliku nasumične mase brojeva. Stoga je prvi korak ka obradi takvog materijala njegovo racionaliziranje, sistematizacija – grupiranje varijante u statističke tabele ili redove.

Jedan od najčešćih oblika grupisanja uzoraka podataka su statističke tabele. Imaju ilustrativnu vrijednost, pokazuju neke opšte rezultate, poziciju pojedinih elemenata u ukupnom nizu opservacija.

Drugi oblik primarnog grupisanja uzoraka podataka je metoda rangiranja, tj. lokacija opcije određenim redoslijedom - povećanjem ili smanjenjem vrijednosti atributa. Kao rezultat, dobija se takozvana rangirana serija koja pokazuje u kojoj meri i na koji način dato obeležje varira. Na primjer, postoji uzorak sljedeće kompozicije:

5,2,1,5,7,9,3,5,4,10,4,5,7,3,5, 9,4,12,7,7

Vidi se da se kod nekih jedinica predznak mijenja od 1 do 12. Navedeno uzlaznim redoslijedom:

1,2,3,3,4,4,4,5,5,5,5,7,7,7,7,9,9,10,12.,

Kao rezultat, dobijen je niz vrijednosti varijabilnog svojstva u rasponu.

Jasno je da je metoda rangiranja kako je ovdje prikazana primjenjiva samo na male uzorke. At veliki brojevi zapažanja, rangiranje je teško, jer serija je toliko duga da gubi smisao.

Uz veliki broj zapažanja, uobičajeno je da se uzorak rangira u obliku dvostrukog reda, tj. označavajući učestalost ili učestalost pojedinačnih varijanti rangiranih serija. Takav dvostruki niz rangiranih vrijednosti neke karakteristike naziva se varijacijski niz ili distribucijski niz. Najjednostavniji primjer varijacione serije mogu biti podaci koji su gore rangirani, ako su raspoređeni na sljedeći način:

Vrijednosti karakteristika

(opcije) 1 2 3 4 5 7 9 10 12

ponovljivost

(opcija) frekvencije 1 1 2 3 5 4 2 1 1

Serija varijacija pokazuje učestalost sa kojom se pojedinačne varijante javljaju u datoj populaciji, kako su raspoređene, što je od velike važnosti, omogućavajući prosuđivanje obrazaca varijacije i raspona varijacije kvantitativnih karakteristika. Konstrukcija varijacionih serija olakšava izračunavanje ukupnih indikatora – aritmetičke sredine i varijanse ili disperzije oko njihove prosječne vrijednosti – indikatora koji karakteriziraju bilo koju statističku populaciju.

Varijacijski nizovi su dva tipa: povremeni i kontinuirani. Diskontinuirani varijacioni niz se dobija distribucijom diskretnih količina, koje uključuju znakove brojanja. Ako se predznak kontinuirano mijenja, tj. može poprimiti bilo koje vrijednosti u rasponu od minimalne do maksimalne varijante populacije, tada se potonja distribuira u kontinuiranom nizu varijacija.

Da bi se konstruisao varijacijski niz diskretno promjenjivog obilježja, dovoljno je postaviti cijeli skup zapažanja u obliku rangirane serije, ukazujući na učestalost pojedinačnih varijanti. Kao primjer dajemo podatke koji pokazuju distribuciju veličine 267 dijelova (tabela 5.4)

Tabela 6.1. Raspodjela dijelova po veličini.

Da biste izgradili niz varijacija koje se kontinuirano mijenjaju, trebate podijeliti cijelu varijaciju od minimalne do maksimalne varijante u zasebne grupe ili intervale (od-do), nazvane klase, a zatim rasporediti sve varijante populacije između ovih klasa . Kao rezultat, dobiće se dvostruka varijantna serija u kojoj se frekvencije više ne odnose na pojedinačne specifične opcije, već na cijeli interval, tj. Ispostavilo se da frekvencije nisu varijanta, već klase.

Raščlamba opšte varijacije na klase vrši se na skali intervala klasa, koja treba da bude ista za sve klase varijacionog niza. Vrijednost intervala klase označava se sa i (od riječi intervalum - interval, udaljenost); to je određeno sledeća formula

, (6.1)

gdje je: i – interval klase, koji se uzima kao cijeli broj;

- maksimalne i minimalne opcije uzorka;

lg.n je logaritam broja klasa na koje je uzorak podijeljen.

Broj klasa se postavlja proizvoljno, ali uzimajući u obzir činjenicu da broj klasa donekle ovisi o veličini uzorka: što je veća veličina uzorka, to bi trebalo biti više klasa, i obrnuto - s manjim veličinama uzorka, manji potrebno je pohađati broj časova. Iskustvo je pokazalo da čak i u malim uzorcima, kada morate grupirati opcije u obliku varijacione serije, ne biste trebali postaviti manje od 5-6 klasa. Ako postoji 100-150 opcija, broj časova se može povećati na 12-15. Ako se populacija sastoji od 200-300 opcija, onda se dijeli na 15-18 klasa, itd. Naravno, ove preporuke su veoma uslovne i ne mogu se prihvatiti kao ustaljeno pravilo.

Prilikom podjele na klase, u svakom konkretnom slučaju, potrebno je uzeti u obzir niz različitih okolnosti kako bi se osiguralo da obrada statističkog materijala daje što preciznije rezultate.

Nakon što se postavi interval klasa i uzorak se podijeli na klase, varijanta se dijeli na klase i određuje se broj varijacija (učestalosti) svake klase. Kao rezultat, dobiva se varijacijski niz u kojem se frekvencije ne odnose na pojedinačne opcije, već na određene klase. Zbir svih frekvencija varijacione serije treba da bude jednak veličini uzorka, tj

(6.2)

gdje:
- znak zbrajanja;

p je frekvencija.

n je veličina uzorka.

Ako te jednakosti nema, tada je napravljena greška prilikom objavljivanja varijante po klasama, koja se mora otkloniti.

Obično se za knjiženje varijante po klasi sastavlja pomoćna tabela u kojoj se nalaze četiri kolone: ​​1) klase po ovom atributu (od - do); 2) - prosječna vrijednost klasa, 3) postavljanje opcije po klasama, 4) učestalost časova (vidi tabelu 6.2.)

Objavljivanje opcije po razredima zahtijeva puno pažnje. Ista opcija ne smije biti označena dvaput ili iste opcije spadaju u različite klase. Da bi se izbjegle greške u distribuciji opcija po klasama, preporučuje se da se ne traže iste opcije u agregatu, već da se rasporede po klasama, što nije ista stvar. Zanemarivanje ovog pravila, koje se dešava u radu neiskusnih istraživača, oduzima dosta vremena prilikom objavljivanja varijante, a što je najvažnije, dovodi do grešaka.

Tabela 6.2. Mogućnost objavljivanja po klasama

Granice klasa

Klasa znači (x)

Frekvencije klasa (p), %

apsolutno

relativno

Nakon što završimo s postavljanjem opcije i prebrojimo njihov broj za svaku klasu, dobijamo kontinuirani niz varijacija. Mora se pretvoriti u diskontinuirani varijacioni niz. Da bismo to učinili, kao što je već napomenuto, uzimamo poluzbire ekstremnih vrijednosti klasa. Tako se, na primjer, srednja vrijednost prve klase, jednaka 8,8, dobiva na sljedeći način:

(8,6+9,0):2=8,8.

Druga vrijednost (9,3) ove kolone izračunava se na sličan način:

(9,01+9,59):2=9,3 itd.

Rezultat je diskontinuirana serija varijacija koja pokazuje distribuciju prema osobini koja se proučava (Tablica 6.3.)

Tabela 6.3. Varijacijska serija

Grupiranje podataka uzorka u obliku varijacione serije ima dvostruku svrhu: prvo, kao pomoćna operacija, neophodna je pri izračunavanju ukupnih pokazatelja, a drugo, distribucijski nizovi pokazuju obrazac varijacije karakteristika, što je vrlo važno. . Da bi se ovaj obrazac jasnije izrazio, uobičajeno je da se serija varijacija grafički prikaže u obliku histograma (slika 6.1.)


Slika 6.1 Distribucija preduzeća prema broju zaposlenih

trakasti grafikon prikazuje distribuciju varijante sa kontinuiranom varijacijom karakteristike. Pravokutnici odgovaraju klasama, a njihova visina je broj opcija sadržanih u svakoj klasi. Ako spustimo okomice na osu apscise od središta vrhova pravokutnika histograma, a zatim povežemo ove točke zajedno, dobićemo graf kontinuirane varijacije, nazvan poligon ili gustina distribucije.

Probabilističko-statističke metode za modeliranje ekonomskih sistema


Uvod


Po pravilu, zadatak identifikacije zakona distribucije posmatrane slučajne varijable (strukturno-parametrijska identifikacija) se obično shvata kao problem izbora parametarskog modela zakona raspodele verovatnoće koji najbolje odgovara rezultatima eksperimentalnih posmatranja. Slučajne greške mjernih instrumenata nisu tako često podložne normalnom zakonu, tačnije, nisu tako često dobro opisane modelom normalan zakon. Merni uređaji i sistemi zasnovani su na različitim fizičkim principima, različitim metodama merenja i različitim konverzijama mernih signala. Greške mjerenja kao veličine rezultat su utjecaja mnogih faktora, slučajnih i nenasumičnih, koji djeluju stalno ili epizodično. Stoga je jasno da samo kada su ispunjeni određeni preduslovi (teorijski i tehnički), greške mjerenja su dovoljno dobro opisane modelom normalnog zakona.

Uopšteno govoreći, treba shvatiti da pravi zakon raspodele (ako postoji, naravno), koji opisuje greške određenog mernog sistema, ostaje (ostaje) nepoznat, uprkos svim našim pokušajima da ga identifikujemo. Na osnovu podataka mjerenja i teorijskih razmatranja, možemo odabrati samo vjerojatnostni model koji u nekom smislu najbolje aproksimira ovaj pravi zakon. Ako je konstruisani model adekvatan, odnosno primenjeni kriterijumi ne daju osnovu za njegovo odbacivanje, onda je na osnovu ovog modela moguće izračunati sve verovatnoće karakteristike slučajne komponente greške mernog instrumenta koje su od interesa. nama, koje će se razlikovati od pravih vrijednosti samo zbog neisključene sistematske (neopažene ili neregistrirane) komponente greške mjerenja. Njegova malenkost karakteriše ispravnost mjerenja. Skup mogućih zakona raspodjele vjerovatnoće koji se mogu koristiti za opisivanje posmatranih slučajnih varijabli nije ograničen. Nema smisla postavljati zadatak identifikacije kao cilj pronalaženja pravog zakona raspodjele posmatrane veličine. Možemo samo riješiti problem odabira najboljeg modela iz određenog skupa. Na primjer, iz tog skupa parametarskih zakona i distribucijski skupovi koji se koriste u aplikacijama i reference na koje se mogu naći u literaturi.

Klasični pristup strukturno-parametarskoj identifikaciji zakona raspodjele. Pod klasičnim pristupom podrazumijevamo algoritam za izbor zakona raspodjele, koji je u potpunosti zasnovan na aparatu matematičke statistike.


1. Elementarni pojmovi o slučajni događaji, količine i funkcije


Već smo vidjeli da za mnoge eksperimente nema razlika u izračunavanju vjerovatnoća događaja, dok su elementarni ishodi u ovim eksperimentima veoma različiti. Ali upravo bi nas vjerovatnoće događaja trebale zanimati, a ne struktura prostora elementarnih ishoda. Stoga je vrijeme da se u svim takvim „sličnim“ eksperimentima umjesto najrazličitijih elementarnih ishoda koriste, na primjer, brojevi. Drugim riječima, svaki elementarni ishod mora biti povezan s nekim pravi broj, i radi samo s brojevima.

Neka je dat prostor vjerovatnoće.

Definicija 26.Funkcija pozvao slučajna varijabla, ako za bilo koji Borelov skup mnogo je događaj, tj. pripada - algebra .

Mnogo , koji se sastoji od tih elementarnih ishoda , za koji pripada , naziva se puna inverzna slika skupa .

Napomena 9 . Općenito, neka funkcija djeluje od mnogih u mnoštvo , i dati su -algebre i podskupovi i respektivno. Funkcija pozvao mjerljivo, ako za bilo koji set njegov puni prototip pripada .

Napomena 10. Čitalac koji ne želi da se zamara apstrakcijama vezanim za -algebre događaja i sa mjerljivošću, može sa sigurnošću pretpostaviti da je bilo koji skup elementarnih ishoda događaj, pa je, prema tome, slučajna varijabla proizvoljnofunkcija od in . Ovo ne stvara probleme u praksi, tako da možete preskočiti sve dalje u ovom paragrafu.

Sada, nakon što smo se riješili radoznalih čitalaca, pokušajmo razumjeti zašto je slučajnoj varijabli potrebna mjerljivost.

Ako je data slučajna varijabla , možda ćemo morati izračunati vjerovatnoće oblika , , , (i općenito razne vjerovatnoće pada u Borelove skupove na liniji). To je moguće samo ako su skupovi pod znakom vjerovatnoće događaji, jer vjerovatnoćapostoji funkcija definirana samo na -algebra događaja. Zahtjev mjerljivosti je ekvivalentan činjenici da za bilo koji Borelov skup vjerovatnoća je određena.

Može se zahtijevati nešto drugo u definiciji 26. Na primjer, da bi događaj bio pogodak u bilo kojem intervalu: , ili u bilo kojem poluintervalu: .

Potvrdimo, na primjer, da su definicije 26 i 27 ekvivalentne:

Definicija 27. Funkcija naziva se slučajna varijabla ako je za bilo koju realnu mnogo pripada -algebri .

Dokaz ekvivalencija definicija 26, 27.

Ako a - slučajna varijabla u smislu Definicije 26, onda će to biti slučajna varijabla u smislu Definicije 27, budući da bilo koji interval je Borelov set.

Dokažimo da je i obrnuto tačno. Neka za bilo koji interval izvedeno . Moramo dokazati da isto vrijedi za sve Borelove skupove.

Sakupljajte u izobilju svi podskupovi realne linije čije su predslike događaji. Mnogo već sadrži sve intervale . Pokažimo sada da je skup je -algebra. Po definiciji, ako i samo ako je skup pripada .

1. Hajde da se uverimo u to . Ali i stoga .

2. Hajde da se uverimo u to za bilo koga . Neka . Onda , jer - -algebra.

3. Hajde da se uverimo u to za bilo koji . Neka za sve . Ali - -algebra, dakle

To smo dokazali - -algebra i sadrži sve intervale na pravoj. Ali - najmanji od -algebre koje sadrže sve intervale na pravoj. shodno tome, sadrži: .

Navedimo primjere mjerljivih i nemjerljivih funkcija.

Primjer 25. Bacamo kocku. Neka , i dvije funkcije iz in postavi ovako: , . Još nije postavljeno -algebra , ne može se govoriti o mjerljivosti. Funkcija mjerljiva s obzirom na neke -algebre , možda neće biti isto za drugog .

Ako a postoji skup svih podskupova , onda i su slučajne varijable, pošto bilo koji skup elementarnih ishoda pripada , uključujući ili . Možete napisati korespondenciju između vrijednosti slučajnih varijabli i i vjerovatnoće da se ove vrijednosti uzmu u obliku "tabele raspodjele vjerovatnoće"ili, ukratko, "tablice distribucije":

Evo.


2. Neka - algebra događaja sastoji se od četiri seta:



one. događaj je, osim određenih i nemogućih događaja, gubitak parnog ili neparnog broja bodova. Uvjerimo se u to sa takvim relativno siromašnim -algebra , niti nisu slučajne varijable jer nisu mjerljive. Uzmimo, recimo . Vidimo to i


2. Numeričke karakteristike slučajnih varijabli


Očekivana vrijednost.Matematičko očekivanje diskretne slučajne varijable X, koja uzima konačan broj vrijednosti xi sa vjerovatnoćama pi, je zbir:


(6a)


Matematičko očekivanje kontinuirane slučajne varijable X je integral proizvoda njenih vrijednosti x i gustine distribucije vjerovatnoće f(x):


(6b)


Pretpostavlja se da je nepravilan integral (6b) apsolutno konvergentan (u suprotnom se kaže da očekivana vrijednost M(X) ne postoji). Matematičko očekivanje karakteriše prosečnu vrednost slučajne varijable X. Njena dimenzija se poklapa sa dimenzijom slučajne varijable. Svojstva matematičko očekivanje:



Disperzija.Varijanca slučajne varijable X je broj:



Disperzija je karakteristika disperzije vrijednosti slučajne varijable X u odnosu na njenu prosječnu vrijednost M (X). Dimenzija varijanse jednaka je kvadratu dimenzije slučajne varijable. Na osnovu definicija varijanse (8) i matematičkog očekivanja (5) za diskretnu slučajnu varijablu i (6) za kontinuiranu slučajnu varijablu, dobijamo slične izraze za varijansu:



Ovdje je m = M(X).

Svojstva disperzije:


(10)


Standardna devijacija:


(11)


Budući da je dimenzija standardne devijacije ista kao i kod slučajne varijable, ona se češće od varijanse koristi kao mjera disperzije.

momenti distribucije.Koncepti matematičkog očekivanja i varijanse su posebni slučajevi više opšti koncept za numeričke karakteristike slučajnih varijabli - momenti raspodjele. Momenti distribucije slučajne varijable su predstavljeni kao matematička očekivanja nekih jednostavnih funkcija slučajne varijable. Dakle, moment reda k u odnosu na tačku x0 je matematičko očekivanje M (X - x0) k. Momenti u odnosu na ishodište x = 0 nazivaju se početni momenti i označavaju se:


(12)


Početni trenutak prvog reda je distribucijski centar razmatrane slučajne varijable:


(13)


Trenuci oko distributivnog centra x = m nazivaju se centralni momenti i označavaju se:


(14)


Iz (7) slijedi da je centralni moment prvog reda uvijek jednak nuli:


(15)


Centralni momenti ne ovise o porijeklu vrijednosti slučajne varijable, jer se pomakom za konstantnu vrijednost C, njen centar distribucije pomiče za istu vrijednost C, a odstupanje od centra se ne mijenja:


X - m \u003d (X - C) - (m - C).


Sada je očigledno da je varijansa centralni moment drugog reda:


(16)


Asimetrija.centralni trenutak treći red:


(17)


služi za procjenu asimetrije distribucije. Ako je raspodjela simetrična u odnosu na tačku x = m, tada će centralni moment trećeg reda biti jednak nuli (kao i svi centralni momenti neparnih redova). Stoga, ako je centralni moment trećeg reda različit od nule, tada raspodjela ne može biti simetrična. Količina asimetrije se procjenjuje korištenjem bezdimenzionalnog koeficijenta asimetrije:


(18)


Znak koeficijenta asimetrije (18) ukazuje na desnu ili lijevu asimetriju (slika 2).


Rice. 1. Vrste distribucijske asimetrije


Višak.centralni trenutak četvrtog reda:


(19)


služi za procjenu takozvanog kurtosisa, koji određuje stepen strmine (zašiljenosti) krive distribucije blizu centra distribucije u odnosu na krivu normalne distribucije. Pošto za normalnu distribuciju , tada se sljedeća vrijednost uzima kao eksces:


(20)


Na sl. 3 prikazuje primjere krivulja distribucije s različitim vrijednostima ekscesa. Za normalnu distribuciju, E = 0. Krive koje su više vršne od normalne imaju pozitivnu ekscesiju, a one ravnije imaju negativnu ekscesiju.


Rice. 2. Krive distribucije sa različitim stepenima strmine (kurtosis)


Momenti višeg reda u inženjerskim aplikacijama matematičke statistike se obično ne koriste.

Modadiskretna slučajna varijabla je njena najvjerovatnija vrijednost. Mod kontinuirane slučajne varijable je njena vrijednost pri kojoj je gustina vjerovatnoće maksimalna (slika 2). Ako kriva distribucije ima jedan maksimum, tada se raspodjela naziva unimodalna. Ako kriva distribucije ima više od jednog maksimuma, tada se raspodjela naziva polimodalnom. Ponekad postoje distribucije čije krive nemaju maksimum, već minimum. Takve distribucije se nazivaju antimodalne. U opštem slučaju, mod i matematičko očekivanje slučajne varijable se ne poklapaju. U posebnom slučaju, za modalni, tj. ima mod, simetričnu distribuciju, i pod uslovom da postoji matematičko očekivanje, potonje se poklapa sa modom i centrom simetrije distribucije.

Medijanslučajna varijabla X je njena vrijednost Me, za koju vrijedi jednakost: one. jednako je vjerovatno da će slučajna varijabla X biti manja ili veća od Me. Geometrijski, medijana je apscisa tačke u kojoj je površina ispod krivulje raspodjele podijeljena na pola. U slučaju simetrične modalne distribucije, medijan, mod i srednja vrijednost su isti.


. Statistička procjena zakona raspodjele slučajnih varijabli


Opća populacija je ukupnost svih objekata koji se proučavaju ili mogući rezultati svih opservacija u kojima se vrše isti uslovi preko jednog objekta.

set za uzorkovanje ili uzorak je skup objekata ili rezultata posmatranja objekta, nasumično odabranih iz opće populacije.

Veličina uzorkaje broj objekata ili zapažanja u uzorku.

Specifične vrijednosti uzorka nazivaju se opažene vrijednosti slučajne varijable X. Uočene vrijednosti se bilježe u protokolu. Protokol je tabela. Sastavljeni protokol je primarni oblik evidentiranja obrade primljenog materijala. Da bi se dobili pouzdani, pouzdani zaključci, uzorak mora biti dovoljno reprezentativan u smislu zapremine. Veliki uzorak je neuređen skup brojeva. Za istraživanje, uzorak se dovodi u vizualno uređeni oblik. Da bi to učinio, protokol pronalazi najveću i najmanju vrijednost slučajne varijable. Uzorak, sortiran uzlaznim redom, prikazan je u tabeli 1.

Tabela 1. Protokol

8,66-5,49-4,11-3,48-2,9-2,32-1,82-1,09-0,440,64-8,31-4,71-3,92-3,41-2,85-2,31-1,82-1,01-0,430,71-8,23-4,68-3,85-3,33-2,83-2,29-1,8-0,99-0,430,73-7,67-4,6-3,85-3,25-2,77-2,27-1,77-0,95-0,310,99-6,64-4,43-3,81-3,08-2,72-2,25-1,73-0,89-0,31,03-6,6-4,38-3,8-3,07-2,67-2,19-1,38-0,70,041,05-6,22-4,38-3,77-3,01-2,6-2,15-1,32-0,560,081,13-5,87-4,25-3,73-3,01-2,49-2,09-1,3-0,510,151,76-5,74-4,18-3,59-2,99-2,37-2,01-1,28-0,490,262,95-5,68-4,14-3,49-2,98-2,33-1,91-1,24-0,480,534,42

Raspon uzorkovanjaje razlika između najvećeg i najmanju vrijednost slučajna varijabla X:

Opseg uzorka je podijeljen na k intervala - cifara. Broj cifara se postavlja u zavisnosti od veličine opsega uzorkovanja od 8 do 25, u ovom seminarski rad uzmimo k = 10.

Tada će dužina intervala biti jednaka:

U protokolu brojimo broj uočenih vrijednosti koje spadaju u svaki interval, označavamo ih m1, m2, ..., m10. .

Pozovimo mi stopa pogodakaslučajna varijabla u i intervalu. Ako se bilo koja uočena vrijednost slučajne varijable poklapa sa krajem intervala, tada se ta vrijednost slučajne varijable, po dogovoru, dodjeljuje jednom od intervala.

Nakon što smo odredili frekvencije mi, definiramo frekvencijeslučajna varijabla, tj. nalazimo omjer frekvencija mi prema ukupnom broju uočenih vrijednosti n.

Učestalost, stanje kompletnosti -

Pronađite sredinu svakog intervala: .

Napravimo tabelu 2

Tabela vrijednosti granica intervala i odgovarajuće frekvencije , gdje je i = 1, 2, 3, …, k, naziva se statistički niz. Grafički prikaz statističke serije naziva se histogram. Konstruira se na sljedeći način: intervali se crtaju duž apscise, a na svakom takvom intervalu, kao na bazi, konstruiše se pravokutnik čija je površina jednaka odgovarajućoj frekvenciji.

, - visina pravougaonika, .


tabela 2

Broj intervala Lijeva granica intervala Desna granica intervalaIntervalSredina intervalaUčestalost intervalaUčestalost intervalaVisina pravokutnika .030.02293-6.044-4.736(-6.044; -4.736)-5.3940.0640;-5.3940.0640; -4.082200.20.15295-3.428-2.12 (- 3.428; -2.12) -2.774260.260.19886-2.12-0.812 (-2.12; -0.812) -1.466180.180.13767-0.8120.496 (-0.812; 0.496) -0.158140.140.107080.4961.804 (0.496; 1.804)1.1590.090.068891.8043.112(1.804; 3.112)2.45810.010.0076103.1124.42(3.112; 4.42 )10.07 um 10.071.

Slika 3


Funkcija statističke distribucije je frekvencija slučajne varijable koja ne prelazi datu vrijednost X:

Za diskretnu slučajnu varijablu X, statistička funkcija distribucije se nalazi po formuli:

Funkciju statističke distribucije pišemo u proširenom obliku:

gdje je sredina intervala i, i su odgovarajuće frekvencije, gdje je i=1, 2,…, k.

Grafikon funkcije statističke distribucije je stepenasta linija, čije su tačke prekida sredine intervala, a konačni skokovi su jednaki odgovarajućim frekvencijama.


Slika 3


Proračun numeričkih karakteristika statističke serije

Statističko matematičko očekivanje,

statistička varijansa,

Statistička standardna devijacija.

Statistička očekivanjaili statistički srednjenaziva se aritmetička sredina posmatranih vrednosti slučajne varijable X.

Statistička disperzijanaziva se aritmetička srednja vrijednost ili

Uz veliku veličinu uzorka, proračuni po formulama dovode do glomaznih proračuna. Da bi se pojednostavili proračuni, koristi se statistička serija sa granicama i frekvencije , gdje je i = 1, 2, 3, …, k, pronađite sredine intervala , a zatim i sve elemente selekcije , koji je upao u interval , zamjenjuje se jednom vrijednošću , onda će postojati takve vrijednosti u svakom intervalu.

gdje - prosječna vrijednost odgovarajućeg intervala ;- frekvencija intervala

Tabela 4. Numeričke karakteristike

Frekvencijski pixipi (XI-M) ^ 2 (XI-M) ^ 2 * PI1-8.0060.04-0.320231.486911.25952-6.6980.03-0.200918.518560.55563-5.990.04 -0.21568.971940.35894-4.0820.20-0.81642.847050.56945 -2.7740.26-0.72120.143880.03746-1.4660.18-0.26390.862450.15527 Statistička sredina -2,3947 Statistička varijansa 5.3822Statistička standardna devijacija2.3200

Određuje poziciju centra za grupisanje posmatranih vrednosti slučajne varijable.

, karakteriziraju disperziju promatranih vrijednosti slučajne varijable okolo

U svakoj statističkoj distribuciji neizbežno postoje elementi slučajnosti. Međutim, uz vrlo veliki broj zapažanja, ove nezgode su izglađene, a slučajni fenomeni otkrivaju im svojstvenu pravilnost.

Prilikom obrade statističkog materijala potrebno je odlučiti kako odabrati teorijsku krivu za datu statističku seriju. Ova teorijska kriva distribucije treba da izrazi bitne karakteristike statističke distribucije - ovaj zadatak se zove zadatak izglađivanja ili nivelisanja statističke serije.

Ponekad opšti oblik distribucija slučajne varijable X proizilazi iz same prirode ove slučajne varijable.

Neka je slučajna varijabla X rezultat mjerenja neke fizička količina uređaj.

X \u003d tačna vrijednost fizičke veličine + greška instrumenta.

Slučajna greška uređaja tokom merenja ima totalnu prirodu i raspoređuje se po normalnom zakonu. Dakle, slučajna varijabla X ima istu distribuciju, tj. normalna distribucija sa gustinom verovatnoće:


gdje, , .


Opcije i određuju se tako da su numeričke karakteristike teorijske distribucije jednake odgovarajućim numeričkim karakteristikama statističke distribucije. Pod normalnom distribucijom, pretpostavlja se da ,,, tada će funkcija normalne distribucije imati oblik:

Tabela 5. Kriva niveliranja

Broj intervala Interval srednji Xi tabelarna funkcija normalna kriva 1-8.0060-2.41870.02140.00922-6.6980-1.85490.07140.03083-5.3900-1.29110.17340-0.7274-4.0820.13205- 2.7740.16.16350.39360.1697m-2.394700.39890.17206-1.466600.40030.36820.15877-0.15800.96410.25070.108081.15001.52790.12420 .05802.4 09170.04480.0193103.76602.65550.01170.0051

Iz tačaka konstruišemo teorijsku normalnu krivu na istom grafikonu sa histogramom statističke serije (Greška! Referentni izvor nije pronađen).


Slika 6


Izravnavanje funkcije statističke distribucije

Statistička funkcija raspodjele uskladiti s funkcijom distribucije normalnog zakona:



gdje ,,je Laplaceova funkcija.


Tabela 7 Funkcija distribucije

Broj intervala Interval srednji Xi Laplaceova funkcija funkcija distribucije 1-8.0060-2.4187-0.49220.00782-6.6980-1.8549-0.49820.03183-0.40170.09434-4.0820-0, 7273-0.26650.23355-2.7740-0.1635-0.06490.4351M-2.3947000.50006-1.46600. 40030.15550.65557-0.15800.96410.33250.832581.15001, 52790,43670,936792,45802,09170,48180,98186030,9818606,98186039

Gradimo dijagram teorijske funkcije distribucije po tačkama / zajedno sa grafikom funkcije statističke distribucije.


Slika 6


Neka se slučajna varijabla X proučava s matematičkim očekivanjem i disperzija , oba parametra su nepoznata.

Neka je h1, h2, h3, …, hn uzorak dobijen kao rezultat n nezavisnih posmatranja slučajne varijable X. Da bismo naglasili slučajnu prirodu vrijednosti h1, h2, h3, …, hn, prepisujemo ih u obliku:

H1, H2, H3, …, Hn, gdje je Hi vrijednost slučajne varijable H u i-tom eksperimentu.

Na osnovu ovih eksperimentalnih podataka potrebno je procijeniti matematičko očekivanje i varijansu slučajne varijable. Takve procjene se nazivaju tačkastim procjenama, a kao procjenu m i D možemo uzeti statističko očekivanje i statistička varijansa , gdje



Prije eksperimenta, uzorak X1, X2, X3, ..., Xn je skup nezavisnih slučajnih varijabli koje imaju matematičko očekivanje i varijansu, što znači da je distribucija vjerovatnoće ista kao i sama slučajna varijabla X. Dakle:


Gdje je i = 1, 2, 3, …, n.


Na osnovu toga nalazimo matematičko očekivanje i varijansu slučajne varijable (koristeći svojstva matematičkog očekivanja).

Dakle, matematičko očekivanje statističke sredine jednaka je tačnoj vrijednosti matematičkog očekivanja m izmjerene vrijednosti i varijansi statističke sredine n puta manji od disperzije pojedinačnih rezultata mjerenja.


at


To znači da je sa velikom veličinom uzorka N statistički prosjek je gotovo neslučajna vrijednost, samo malo odstupa od tačne vrijednosti slučajne varijable m. Ovaj zakon se zove zakon veliki brojevi Chebyshev.

Tačkaste procjene nepoznatih vrijednosti matematičkog očekivanja i varijanse imaju veliki značaj u početnoj fazi obrade statičkih podataka. Njihov nedostatak je što se ne zna sa kojom tačnošću daju procenjeni parametar.

Neka su za dati uzorak X1, X2, X3, …, Xn tačne statističke procjene i , tada će numeričke karakteristike slučajne varijable X biti približno jednake . Za uzorak male veličine, pitanje procjene streaminga je bitno, jer između m i , D i odstupanja nisu dovoljno velika. Osim toga, prilikom rješavanja praktičnih problema potrebno je ne samo pronaći približne vrijednosti m i D, već i procijeniti njihovu točnost i pouzdanost. Neka , tj. je tačka procjene za m. Očigledno je da što preciznije određuje m, to je manji modul razlike . Neka , gdje ?>0, onda manje ?, točnija je procjena m. Na ovaj način, ?>0 karakterizira tačnost procjene parametara. Međutim, statističke metode nam ne dozvoljavaju da kategorički tvrdimo da procjena prave vrijednosti m zadovoljava , možemo govoriti samo o vjerovatnoći ?, sa kojom je ova nejednakost zadovoljena:

Na ovaj način, ?- ovo je nivo samopouzdanjaili pouzdanost procjene, značenje ? biraju se unaprijed u zavisnosti od problema koji treba riješiti. Pouzdanost ? uobičajeno je izabrati 0,9; 0,95; 0,99; 0.999. Događaji sa takvom vjerovatnoćom su praktično izvjesni. Za dati nivo pouzdanosti možete pronaći broj ?>0 od .

Tada dobijamo interval , koji pokriva sa vjerovatnoćom ? prava vrijednost očekivanja m, dužina ovog intervala je 2 ?. Ovaj interval se zove interval povjerenja. A ovaj način procjene nepoznatog parametra m - interval.



Neka je dat uzorak H1, H2, H3, …, Hn, i neka ovaj uzorak pronađe , ,.

Potrebno je pronaći interval pouzdanosti za matematičko očekivanje m sa pouzdanom vjerovatnoćom ?. Vrijednost je slučajna varijabla sa matematičkim očekivanjima, .

Slučajna vrijednost ima totalnu prirodu, sa velikom veličinom uzorka, distribuira se po zakonu bliskom normalnom. Tada će vjerovatnoća da će slučajna varijabla pasti u interval biti jednaka:


Gdje


Gdje je Laplaceova funkcija.

Iz formule (3) i tabela Laplaceove funkcije nalazimo broj ?>0 i napišite interval pouzdanosti za tačnu vrijednost slučajna varijabla X sa pouzdanošću ?.

U ovom kursu, vrijednost ? zamijeniti , i tada će formula (3) poprimiti oblik:

Nađimo interval povjerenja , koji sadrži matematičko očekivanje. At ? = 0,99, n = 100, ,.

prema Laplaceovim tabelama nalazimo:

Odavde? = 0,5986.

Interval povjerenja u kojem leži tačna vrijednost matematičkog očekivanja sa vjerovatnoćom od 99%.


Zaključak

nasumična distribucija ekonomska

Rješavanje problema strukturno-parametarske identifikacije uz ograničene veličine uzorka, koje po pravilu imaju metrolozi, pogoršava problem. U ovom slučaju je još važnija ispravnost primjene statističkih metoda analize. korištenje procjena sa najboljim statističkim svojstvima i kriterija sa najvećom snagom.

Prilikom rješavanja problema identifikacije poželjno je osloniti se na klasičan pristup. Prilikom identifikacije, preporučuje se razmatranje šireg skupa zakona distribucije, uključujući modele u obliku mješavine zakona. U ovom slučaju, za bilo koje empirijska distribucija uvijek ćemo moći konstruirati adekvatan, statistički značajno potkrijepljeniji matematički model.

Treba se fokusirati na upotrebu i razvoj softverski sistemi, pružajući rješenje za probleme strukturno-parametarske identifikacije zakona distribucije za bilo koji oblik snimljenih opservacija (mjerenja), uključujući savremenim metodama statis analitičke analize, fokus na široku, ali ispravnu upotrebu metoda kompjuterskog modeliranja u istraživanju. Već smo vidjeli da za mnoge eksperimente nema razlika u izračunavanju vjerovatnoća događaja, dok su elementarni ishodi u ovim eksperimentima veoma različiti. Ali upravo bi nas vjerovatnoće događaja trebale zanimati, a ne struktura prostora elementarnih ishoda. Stoga je vrijeme da se u svim takvim „sličnim“ eksperimentima umjesto najrazličitijih elementarnih ishoda koriste, na primjer, brojevi. Drugim riječima, svakom elementarnom ishodu treba dodijeliti neki realan broj i raditi samo s brojevima.

Pošaljite svoj dobar rad u bazu znanja je jednostavno. Koristite obrazac ispod

Studenti, postdiplomci, mladi naučnici koji koriste bazu znanja u svom studiranju i radu biće vam veoma zahvalni.

Objavljeno na http://www.allbest.ru/

Objavljeno na http://www.allbest.ru/

Uvod

1. Hi-kvadrat raspodjela

Zaključak

Aplikacija

Uvod

Kako se pristupi, ideje i rezultati teorije vjerovatnoće koriste u našim životima? matematička teorija kvadrata

Osnova je probabilistički model realne pojave ili procesa, tj. matematički model u kojem se objektivni odnosi izražavaju u terminima teorije vjerovatnoće. Vjerovatnoće se prvenstveno koriste za opisivanje neizvjesnosti koje se moraju uzeti u obzir prilikom donošenja odluka. To se odnosi i na nepoželjne prilike (rizike) i na one atraktivne (" Lucky case"). Ponekad se slučajnost namjerno unosi u situaciju, na primjer, prilikom izvlačenja žrijeba, slučajnog odabira jedinica za kontrolu, provođenja lutrije ili anketiranja potrošača.

Teorija vjerovatnoće omogućava da se izračunaju druge vjerovatnoće koje su od interesa za istraživača.

Vjerovatni model pojave ili procesa je osnova matematičke statistike. Koriste se dvije paralelne serije koncepata - oni koji se odnose na teoriju (vjerovatni model) i oni koji se odnose na praksu (uzorak rezultata opservacije). Na primjer, teorijska vjerovatnoća odgovara frekvenciji pronađenoj iz uzorka. Matematičko očekivanje (teorijski niz) odgovara uzorku aritmetičke sredine (praktične serije). Po pravilu, karakteristike uzorka su procjene teorijskih. Istovremeno, količine koje se odnose na teorijsku seriju "su u glavama istraživača", odnose se na svijet ideja (prema starogrčkom filozofu Platonu), nisu dostupne za direktno mjerenje. Istraživači imaju samo selektivne podatke, uz pomoć kojih pokušavaju da utvrde svojstva teorijskog vjerovatnog modela koja ih zanimaju.

Zašto nam je potreban probabilistički model? Činjenica je da je samo uz njegovu pomoć moguće prenijeti svojstva utvrđena rezultatima analize određenog uzorka na druge uzorke, kao i na cjelokupnu tzv. opštu populaciju. Termin "populacija" se koristi za označavanje velike, ali ograničene populacije jedinica koje se proučavaju. Na primjer, o ukupnosti svih stanovnika Rusije ili ukupnosti svih potrošača instant kafe u Moskvi. Svrha marketinških ili socioloških istraživanja je da se izjave primljene sa uzorka od stotina ili hiljada ljudi prenesu na opću populaciju od nekoliko miliona ljudi. U kontroli kvaliteta, serija proizvoda djeluje kao opća populacija.

Da bi se zaključci prenijeli iz uzorka na veću populaciju, potrebne su neke pretpostavke o odnosu karakteristika uzorka sa karakteristikama ove veće populacije. Ove pretpostavke su zasnovane na odgovarajućem vjerovatnostnom modelu.

Naravno, moguće je obraditi podatke uzorka bez korištenja jednog ili drugog vjerovatnostnog modela. Na primjer, možete izračunati uzorak aritmetičke sredine, izračunati učestalost ispunjenja određenih uslova itd. Međutim, rezultati proračuna primjenjivat će se samo na određeni uzorak; prenošenje zaključaka dobivenih uz njihovu pomoć na bilo koji drugi skup je pogrešno. Ova aktivnost se ponekad naziva i "analiza podataka". U poređenju sa probabilističko-statističkim metodama, analiza podataka ima ograničenu kognitivnu vrednost.

Dakle, upotreba probabilističkih modela zasnovanih na procjeni i testiranju hipoteza uz pomoć karakteristika uzorka je suština vjerovatno-statističkih metoda odlučivanja.

1. Hi-kvadrat raspodjela

Normalna distribucija definira tri distribucije koje se sada često koriste statistička obrada podaci. Ovo su distribucije Pirsona ("chi - kvadrat"), Studenta i Fishera.

Fokusiraćemo se na distribuciju ("chi - kvadrat"). Ovu distribuciju prvi je proučavao astronom F. Helmert 1876. godine. U vezi sa Gausovom teorijom grešaka, proučavao je sume kvadrata n nezavisnih standardno normalno distribuiranih slučajnih varijabli. Kasnije je Karl Pearson ovu funkciju distribucije nazvao "hi-kvadrat". I sada distribucija nosi njegovo ime.

Hvala za zatvoriti vezu sa normalnom distribucijom, igra se h2-distribucija važnu ulogu u teoriji vjerovatnoće i matematičkoj statistici. Distribucija h2, i mnoge druge distribucije koje su definirane distribucijom h2 (na primjer, Studentova distribucija), opisuju uzorke distribucije različitih funkcija od normalne distribuirani rezultati zapažanja i koriste se za konstruisanje intervala pouzdanosti i statističkih testova.

Pearsonova distribucija (chi - kvadrat) - raspodjela slučajne varijable gdje su X1, X2, ..., Xn normalne nezavisne slučajne varijable, a matematičko očekivanje svake od njih je nula, a standardna devijacija jedan.

Zbir kvadrata

distribuiraju u skladu sa zakonom ("chi - kvadrat").

U ovom slučaju, broj pojmova, tj. n, naziva se "broj stepena slobode" hi-kvadrat distribucije. Kako se broj stupnjeva slobode povećava, distribucija se polako približava normalnoj.

Gustina ove distribucije

Dakle, distribucija h2 zavisi od jednog parametra n - broja stepeni slobode.

Funkcija distribucije h2 ima oblik:

ako je h2?0. (2.7.)

Slika 1 prikazuje grafik gustine vjerovatnoće i funkcije raspodjele χ2 za različite stupnjeve slobode.

Slika 1. Zavisnost gustine vjerovatnoće q (x) u distribuciji h2 (hi - kvadrat) za različit broj stupnjeva slobode

Trenuci distribucije "hi-kvadrat":

Hi-kvadrat distribucija se koristi u procjeni varijanse (koristeći interval povjerenja), u testiranju hipoteza o slaganju, homogenosti, nezavisnosti, prvenstveno za kvalitativne (kategorizirane) varijable koje poprimaju konačan broj vrijednosti, te u mnogim drugim zadacima statističke Analiza podataka.

2. "Hi-kvadrat" u problemima statističke analize podataka

Statističke metode analize podataka koriste se u gotovo svim područjima ljudske djelatnosti. Koriste se kad god je potrebno dobiti i potkrijepiti bilo kakve prosudbe o grupi (objektima ili subjektima) s nekom unutrašnjom heterogenošću.

Savremeni stupanj razvoja statističkih metoda može se računati od 1900. godine, kada je Englez K. Pearson osnovao časopis "Biometrika". Prva trećina 20. veka prošla pod znakom parametarske statistike. Proučavane su metode zasnovane na analizi podataka iz parametarskih familija distribucija opisanih krivuljama Pearsonove porodice. Najpopularnija je bila normalna distribucija. Za testiranje hipoteza korišteni su kriterijumi Pearson, Student i Fisher. Predložena je metoda maksimalne vjerovatnoće, analiza varijanse i formulirane glavne ideje za planiranje eksperimenta.

Hi-kvadrat distribucija je jedna od najčešće korištenih u statistici za testiranje statističkih hipoteza. Na osnovu "hi-kvadrat" distribucije, konstruisan je jedan od najmoćnijih testova dobrote uklapanja, Pirsonov "hi-kvadrat" test.

Test ispravnosti je kriterij za testiranje hipoteze o predloženom zakonu nepoznate raspodjele.

P2 ("hi-kvadrat") test se koristi za testiranje hipoteze različitih distribucija. To je njegova zasluga.

Proračunska formula kriterija je jednaka

gdje su m i m" empirijske i teorijske frekvencije, respektivno

distribucija koja se razmatra;

n je broj stepeni slobode.

Za verifikaciju, potrebno je da uporedimo empirijske (opažene) i teorijske (izračunate pod pretpostavkom normalne distribucije) frekvencije.

Ako se empirijske frekvencije potpuno poklapaju sa frekvencijama izračunatim ili očekivanim, S (E - T) = 0 i kriterij ch2 će također biti jednak nuli. Ako S (E - T) nije jednako nuli, to će ukazati na neslaganje između izračunatih frekvencija i empirijskih frekvencija serije. U takvim slučajevima potrebno je procijeniti značajnost kriterija p2, koji teoretski može varirati od nule do beskonačnosti. Ovo se radi upoređivanjem stvarno dobijene vrijednosti ch2f sa njegovom kritičnom vrijednošću (ch2st) (a) i brojem stupnjeva slobode (n).

Distribucija vjerojatnih vrijednosti slučajne varijable h2 je kontinuirana i asimetrična. Zavisi od broja stupnjeva slobode (n) i približava se normalnoj raspodjeli kako se broj opažanja povećava. Dakle, primjena kriterija p2 na ocjenu diskretne distribucije je povezan s nekim greškama koje utiču na njegovu vrijednost, posebno za male uzorke. Da bi se dobile preciznije procjene, uzorak distribuiran u nizu varijacija treba imati najmanje 50 opcija. Ispravna primjena kriterija p2 također zahtijeva da frekvencije varijanti u ekstremnim klasama ne budu manje od 5; ako ih je manje od 5, onda se kombinuju sa frekvencijama susjednih klasa tako da je njihov ukupni iznos veći ili jednak 5. U skladu sa kombinacijom frekvencija, smanjuje se i broj klasa (N). Broj stupnjeva slobode se postavlja prema sekundarnom broju klasa, uzimajući u obzir broj ograničenja slobode varijacije.

Pošto tačnost određivanja kriterijuma p2 u velikoj meri zavisi od tačnosti izračunavanja teorijskih frekvencija (T), za dobijanje razlike između empirijske i izračunate frekvencije treba koristiti nezaokružene teorijske frekvencije.

Kao primjer uzmimo studiju objavljenu na web stranici posvećenoj primjeni statističkih metoda u humanističkim naukama.

Hi-kvadrat test omogućava poređenje frekvencijskih distribucija, bez obzira da li su one normalno raspoređene ili ne.

Učestalost se odnosi na broj pojavljivanja događaja. Obično se učestalost pojavljivanja događaja bavi kada su varijable mjerene u skali imena i njihove druge karakteristike, osim učestalosti, nije moguće ili problematično odabrati. Drugim riječima, kada varijabla ima karakteristike kvaliteta. Takođe, mnogi istraživači imaju tendenciju da prevedu rezultate testova u nivoe (visoki, srednji, niski) i prave tabele distribucije rezultata kako bi saznali broj ljudi na ovim nivoima. Da bi se dokazalo da je na jednom od nivoa (u jednoj od kategorija) broj ljudi zaista veći (manji), koristi se i hi-kvadrat koeficijent.

Pogledajmo najjednostavniji primjer.

Proveden je test samopoštovanja među mlađim adolescentima. Rezultati testova su prevedeni u tri nivoa: visok, srednji, nizak. Frekvencije su raspoređene na sljedeći način:

Visoka (H) 27 pers.

Srednje (C) 12 osoba

Niska (H) 11 pers.

Očigledno je da je većina djece sa visokim samopoštovanjem, međutim, to treba statistički dokazati. Da bismo to učinili, koristimo Hi-kvadrat test.

Naš zadatak je provjeriti da li se dobijeni empirijski podaci razlikuju od teorijski jednako vjerovatnih. Da biste to učinili, potrebno je pronaći teorijske frekvencije. U našem slučaju, teorijske frekvencije su jednako vjerojatne frekvencije koje se nalaze sabiranjem svih frekvencija i dijeljenjem sa brojem kategorija.

u našem slučaju:

(B + C + H) / 3 = (27 + 12 + 11) / 3 = 16,6

Formula za izračunavanje hi-kvadrat testa je:

h2 \u003d? (E - T) I / T

Pravimo sto:

Empirijski (uh)

Teorijski (T)

(E - T)Í / T

Pronađite zbir zadnje kolone:

Sada morate pronaći kritičnu vrijednost kriterija prema tabeli kritičnih vrijednosti (tabela 1 u dodatku). Da bismo to učinili, potreban nam je broj stupnjeva slobode (n).

n = (R - 1) * (C - 1)

gdje je R broj redova u tabeli, C je broj kolona.

U našem slučaju postoji samo jedna kolona (što znači originalne empirijske frekvencije) i tri reda (kategorije), pa se formula mijenja - izuzimamo kolone.

n = (R - 1) = 3-1 = 2

Za vjerovatnoću greške p?0,05 i n = 2, kritična vrijednost je h2 = 5,99.

Dobijena empirijska vrijednost je veća od kritične vrijednosti – razlike u učestalosti su značajne (n2= 9,64; p≤0,05).

Kao što vidite, izračunavanje kriterija je vrlo jednostavno i ne oduzima puno vremena. Praktična vrijednost hi-kvadrat testa je ogromna. Ova metoda je najvrednija u analizi odgovora na upitnike.

Uzmimo složeniji primjer.

Na primjer, psiholog želi da zna da li je istina da su nastavnici pristrasniji prema dječacima nego prema djevojčicama. One. verovatnije je da hvali devojke. Da bi se to postiglo, psiholog je analizirao karakteristike učenika koje su napisali nastavnici, s obzirom na učestalost pojavljivanja tri riječi: „aktivan“, „vrijedan“, „disciplinovan“, prebrojani su i sinonimi riječi.

Podaci o učestalosti pojavljivanja riječi uneseni su u tabelu:

Za obradu dobijenih podataka koristimo hi-kvadrat test.

Da bismo to uradili, konstruišemo tabelu raspodele empirijskih frekvencija, tj. frekvencije koje opažamo:

Teoretski, očekujemo da frekvencije budu ravnomjerno raspoređene, tj. učestalost će biti raspoređena proporcionalno između dječaka i djevojčica. Napravimo tabelu teoretskih frekvencija. Da biste to učinili, pomnožite zbir reda sa zbirom kolone i podijelite rezultirajući broj sa ukupnim zbrojem (s).

Dobivena tabela za izračune će izgledati ovako:

Empirijski (uh)

Teorijski (T)

(E - T)Í / T

momci

"aktivan"

"Marljiv"

"disciplinovan"

"aktivan"

"Marljiv"

"disciplinovan"

Iznos: 4.21

h2 \u003d? (E - T) I / T

gdje je R broj redova u tabeli.

U našem slučaju, hi-kvadrat = 4,21; n = 2.

Prema tabeli kritičnih vrijednosti kriterija nalazimo: sa n = 2 i nivoom greške od 0,05, kritična vrijednost h2 = 5,99.

Rezultirajuća vrijednost je manja od kritične vrijednosti, što znači da je nulta hipoteza prihvaćena.

Zaključak: nastavnici ne pridaju značaj polu djeteta kada pišu njegove karakteristike.

Zaključak

Na kraju kursa studiraju studenti gotovo svih specijalnosti višu matematiku odeljak „teorija verovatnoće i matematička statistika“, u stvarnosti se upoznaju samo sa nekim osnovnim pojmovima i rezultatima, koji očigledno nisu dovoljni za praktičan rad. Studenti se upoznaju sa nekim matematičkim metodama istraživanja u specijalnim predmetima (na primjer, kao što su "Prognoziranje i planiranje izvodljivosti", "Tehnička i ekonomska analiza", "Kontrola kvaliteta proizvoda", "Marketing", "Kontroliranje", " Matematičke metode Predviđanje“, „Statistika“ itd. – u slučaju studenata ekonomskih specijalnosti), međutim, prezentacija je u većini slučajeva vrlo skraćena i propisne prirode. Kao rezultat toga, specijalisti za primijenjenu statistiku nemaju dovoljno znanja.

Stoga je predmet "Primijenjena statistika" u tehnički univerziteti, a na ekonomskim fakultetima - predmet "Ekonometrija", budući da je ekonometrija, kao što znate, statistička analiza konkretnih ekonomskih podataka.

Teorija vjerovatnoće i matematička statistika pružaju osnovna znanja za primijenjenu statistiku i ekonometriju.

Potrebni su specijalistima za praktičan rad.

Razmatrao sam kontinuirani probabilistički model i pokušao na primjerima pokazati njegovu upotrebljivost.

I na kraju svog rada došao sam do zaključka da je kompetentna implementacija osnovnih postupaka matematičko-statičke analize podataka, statičkog testiranja hipoteza nemoguća bez poznavanja „hi-kvadrat” modela, kao i sposobnosti da koristim njen sto.

Bibliografija

1. Orlov A.I. Primijenjena statistika. M.: Izdavačka kuća "Ispit", 2004.

2. Gmurman V.E. Teorija vjerojatnosti i matematička statistika. M.: postdiplomske škole, 1999. - 479s.

3. Ayvozyan S.A. Teorija vjerojatnosti i primijenjena statistika, v.1. M.: Jedinstvo, 2001. - 656s.

4. Khamitov G.P., Vedernikova T.I. Vjerovatnoće i statistika. Irkutsk: BSUEP, 2006 - 272 str.

5. Ezhova L.N. Ekonometrija. Irkutsk: BSUEP, 2002. - 314 str.

6. Mosteller F. Pedeset zabavnih probabilističkih problema s rješenjima. M.: Nauka, 1975. - 111 str.

7. Mosteller F. Vjerovatnoća. M.: Mir, 1969. - 428s.

8. Yaglom A.M. Vjerovatnoća i informacija. M.: Nauka, 1973. - 511s.

9. Čistjakov V.P. Kurs vjerovatnoće. M.: Nauka, 1982. - 256s.

10. Kremer N.Sh. Teorija vjerojatnosti i matematička statistika. M.: UNITI, 2000. - 543 str.

11. Matematička enciklopedija, v.1. M.: Sovjetska enciklopedija, 1976. - 655s.

12. http://psystat.at.ua/ - Statistika u psihologiji i pedagogiji. Članak Hi-kvadrat test.

Aplikacija

Kritične tačke distribucije p2

Tabela 1

Hostirano na Allbest.ru

...

Slični dokumenti

    Vjerovatni model i aksiomatika A.N. Kolmogorov. Slučajne varijable i vektori, klasični granični problem teorije vjerovatnoće. Primarna obrada statističkih podataka. Tačkaste procjene numeričkih karakteristika. Statističko testiranje hipoteza.

    priručnik za obuku, dodan 03.02.2010

    Pravila za izvođenje i dizajn kontrolni radovi za dopisni odjel. Zadaci i primjeri rješavanja zadataka iz matematičke statistike i teorije vjerojatnosti. Tablice referentnih podataka o distribuciji, standardna normalna gustina distribucije.

    priručnik za obuku, dodan 29.11.2009

    Glavne metode formalizovanog opisa i analize slučajnih pojava, obrade i analize rezultata fizičkog i numeričke eksperimente teorija vjerovatnoće. Osnovni pojmovi i aksiomi teorije vjerovatnoće. Osnovni pojmovi matematičke statistike.

    kurs predavanja, dodato 08.04.2011

    Određivanje zakona raspodjele vjerovatnoće rezultata mjerenja u matematičkoj statistici. Provjera korespondencije empirijske distribucije sa teoretskom. Određivanje intervala pouzdanosti u kojem se nalazi vrijednost mjerene veličine.

    seminarski rad, dodan 11.02.2012

    Konvergencija nizova slučajnih varijabli i distribucije vjerovatnoće. Metoda karakterističnih funkcija. Testiranje statističkih hipoteza i izvođenje centralnog granična teorema za date nizove nezavisnih slučajnih varijabli.

    seminarski rad, dodan 13.11.2012

    Glavne faze obrade podataka iz prirodnih posmatranja metodom matematičke statistike. Evaluacija dobijenih rezultata, njihova upotreba u donošenju upravljačkih odluka u oblasti zaštite prirode i upravljanja prirodom. Testiranje statističkih hipoteza.

    praktični rad, dodato 24.05.2013

    Suština zakona distribucije i njegova praktična primjena za rješavanje statističkih problema. Određivanje varijanse slučajne varijable, matematičko očekivanje i standardna devijacija. Osobine jednosmjerne analize varijanse.

    test, dodano 12.07.2013

    Vjerovatnoća i njena opšta definicija. Teoreme sabiranja i množenja vjerovatnoća. Diskretne slučajne varijable i njihove numeričke karakteristike. Zakon velikih brojeva. Statistička distribucija uzorka. Elementi korelacione i regresione analize.

    kurs predavanja, dodato 13.06.2015

    Program predmeta, osnovni pojmovi i formule teorije vjerovatnoće, njihova opravdanost i značaj. Mjesto i uloga matematičke statistike u disciplini. Primjeri i objašnjenja za rješavanje najčešćih problema u razne teme podaci akademskih disciplina.

    priručnik za obuku, dodan 15.01.2010

    Teorija vjerovatnoće i matematička statistika su nauke o metodama kvantitativne analize masovnih slučajnih pojava. Skup vrijednosti slučajne varijable naziva se uzorak, a elementi skupa se nazivaju vrijednosti uzorka slučajne varijable.

Dijeli