Varijacijska serija. Poligon i histogram.
Raspon distribucije- predstavlja uređenu raspodjelu jedinica proučavane populacije u grupe prema određenom varijabilnom atributu.
Ovisno o osobinama na kojima se formira niz distribucije, postoje atributivne i varijacione rang distribucije:
§ Redovi distribucije konstruisani uzlaznim ili silaznim redosledom vrednosti nekog kvantitativnog atributa nazivaju se varijacijski.
Varijaciona serija distribucije sastoji se od dva stupca:
Prva kolona sadrži kvantitativne vrijednosti varijabilne karakteristike koje se nazivaju opcije i označeni su. Diskretna varijanta - izražena kao cijeli broj. Opcija intervala je u rasponu od i do. U zavisnosti od vrste varijanti, moguće je konstruisati diskretni ili intervalni varijacioni niz.
Druga kolona sadrži broj određene opcije, izraženo u terminima frekvencija ili frekvencija:
Frekvencije- ovo su apsolutni brojevi koji pokazuju koliko se puta u zbiru pojavljuje datu vrijednost znakovi koji predstavljaju . Zbir svih frekvencija treba da bude jednak broju jedinica cjelokupne populacije.
Frekvencije() su frekvencije izražene kao procenat ukupnog broja. Zbir svih frekvencija izražen u procentima mora biti jednak 100% u razlomcima od jedan.
Grafički prikaz distributivnih serija
Distribucijske serije su vizualizirane pomoću grafičkih slika.
Serija distribucije je prikazana kao:
§ Poligon
§ Histogrami
§ Kumulira
Poligon
Prilikom konstruiranja poligona, na horizontalnoj osi (apscisi) se iscrtavaju vrijednosti varijabilnog atributa, a na vertikalnoj osi (ordinati) - frekvencije ili frekvencije.
1. Poligon na sl. 6.1 je izgrađen prema mikro-popisu stanovništva Rusije 1994. godine.
trakasti grafikon
Da biste konstruirali histogram duž apscise, označite vrijednosti granica intervala i na njihovoj osnovi konstruirajte pravokutnike čija je visina proporcionalna frekvencijama (ili frekvencijama).
Na sl. 6.2. prikazan je histogram distribucije stanovništva Rusije 1997. godine po starosnim grupama.
Fig.1. Distribucija stanovništva Rusije po starosnim grupama
Empirijska funkcija distribucije, svojstva.
Neka je poznata statistička distribucija učestalosti kvantitativne osobine X. Označimo brojem opažanja kod kojih je uočena vrijednost osobine manja od x, a sa n ukupan broj opažanja. Očigledno, relativna učestalost događaja X Empirijska funkcija distribucije (funkcija distribucije uzorka) je funkcija koja za svaku vrijednost x određuje relativnu frekvenciju događaja X Za razliku od empirijske funkcije distribucije uzorka, funkcija raspodjele populacije naziva se teorijska funkcija distribucije. Razlika između ovih funkcija je u tome što teorijska funkcija određuje vjerovatnoću događaja X Kako n raste, relativna frekvencija događaja X Osnovna svojstva Neka elementarni ishod bude fiksan. Tada je funkcija distribucije diskretne distribucije data sljedećom funkcijom vjerovatnoće: gdje , a - broj elemenata uzorka jednak . Konkretno, ako su svi elementi uzorka različiti, onda . Matematičko očekivanje ove distribucije je: . Dakle, srednja vrednost uzorka je teorijska sredina distribucije uzorka. Slično, varijansa uzorka je teorijska varijansa distribucije uzorka. Slučajna varijabla ima binomnu distribuciju: Funkcija distribucije uzorka je nepristrasna procjena funkcije distribucije: . Varijanca funkcije distribucije uzorka ima oblik: . Prema jakom zakonu velikih brojeva, funkcija raspodjele uzorka gotovo sigurno konvergira teorijskoj funkciji distribucije: gotovo sigurno u . Funkcija raspodjele uzorka je asimptotski normalna procjena teorijske funkcije raspodjele. Ako onda Po distribuciji na . Kao što je poznato, zakon raspodjele slučajne varijable može se specificirati na različite načine. Diskretna slučajna varijabla se može specificirati korištenjem distribucijske serije ili integralne funkcije, a kontinuirana slučajna varijabla može se specificirati korištenjem integralne ili diferencijalne funkcije. Razmotrimo selektivne analoge ove dvije funkcije. Neka postoji uzorak skupa vrijednosti neke slučajne varijable volumena i svakoj varijanti iz ovog skupa je dodeljena njena frekvencija. Neka dalje je neki realan broj, i je broj vrijednosti uzorka slučajne varijable Definicija 10.15. Empirijska funkcija distribucije(funkcija distribucije uzorkovanja) naziva se funkcija (10.19) Za razliku od empirijske funkcije distribucije uzorka, funkcija distribucije F(x) opšte populacije naziva se teorijska funkcija raspodjele. Razlika između njih je u teorijskoj funkciji F(x)
određuje vjerovatnoću događaja ,
one. na slobodi vjerovatnoća Funkcija Svojstva Primjer 10.4. Konstruirajte empirijsku funkciju za datu distribuciju uzorka: Opcije Frekvencije Rješenje: Pronađite veličinu uzorka n=
12+18+30=60. Najmanja opcija = Značenje x<
10, naime Željena empirijska funkcija distribucije: = Raspored R 1. Koji su glavni problemi koje rješava matematička statistika? 2. Opća i uzorkovana populacija? 3. Definirajte veličinu uzorka. 4. Koji se uzorci nazivaju reprezentativnim? 5. Greške u reprezentativnosti. 6. Glavne metode uzorkovanja. 7. Koncepti frekvencije, relativne frekvencije. 8. Koncept statističke serije. 9. Zapišite Sturgesovu formulu. 10. Formulirajte koncepte raspona uzorka, medijana i moda. 11. Frekvencije poligona, histogram. 12. Koncept bodovne procjene populacije uzorka. 13. Pristrasna i nepristrasna procjena bodova. 14. Formulirajte koncept srednje vrijednosti uzorka. 15. Formulirajte koncept varijanse uzorka. 16. Formulirajte koncept standardne devijacije uzorka. 17. Formulirajte koncept koeficijenta varijacije uzorka. 18. Formulirajte koncept uzorka geometrijske sredine. Naučite šta je empirijska formula. U hemiji, ESP je najjednostavniji način da se opiše jedinjenje – u suštini, to je lista elemenata koji čine jedinjenje s obzirom na njihov procenat. Treba napomenuti da ova jednostavna formula ne opisuje red atoma u jedinjenju, jednostavno ukazuje od kojih se elemenata sastoji. Na primjer: Naučite pojam "procentualni sastav"."Procentni sastav" se odnosi na postotak svakog pojedinačnog atoma u cijelom spoju koji se razmatra. Da biste pronašli empirijsku formulu jedinjenja, potrebno je znati procentualni sastav jedinjenja. Ako nađete empirijsku formulu kao domaći zadatak, vjerojatnije je da ćete dati procente. Imajte na umu da ćete morati da se nosite sa gram atomima. Gram atom je određena količina supstance čija je masa jednaka njenoj atomskoj masi. Da biste pronašli gram atom, trebate koristiti sljedeću jednačinu: Postotak elementa u spoju podijeljen je s atomskom masom elementa.
Znati kako pronaći atomski omjer. Kada radite sa jedinjenjem, na kraju ćete dobiti više od jednog atoma grama. Nakon što pronađete sve gram atoma vašeg spoja, pogledajte ih. Da biste pronašli atomski omjer, morat ćete odabrati najmanju vrijednost gram-atoma koju ste izračunali. Tada će biti potrebno podijeliti sve gram-atome na najmanji gram-atom. Na primjer: Naučite kako pretvoriti vrijednosti atomskog omjera u cijele brojeve. Kada pišete empirijsku formulu, morate koristiti cijele brojeve. To znači da ne možete koristiti brojeve poput 1.33. Nakon što pronađete omjer atoma, trebate pretvoriti razlomke (poput 1,33) u cijele brojeve (kao 3). Da biste to učinili, morate pronaći cijeli broj, množenjem svakog broja atomskog omjera kojim dobijate cijele brojeve. Na primjer: Predavanje 13 Neka je poznata statistička distribucija učestalosti kvantitativne osobine X. Označimo brojem opažanja kod kojih je uočena vrijednost osobine manja od x, a sa n ukupan broj opažanja. Očigledno, relativna učestalost događaja X< x равна и является функцией x. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической. Empirijska funkcija distribucije(funkcija distribucije uzorkovanja) je funkcija koja za svaku vrijednost x određuje relativnu frekvenciju događaja X< x. Таким образом, по определению ,где - число вариант, меньших x, n – объем выборки. Za razliku od empirijske funkcije distribucije uzorka, naziva se funkcija raspodjele populacije teorijska funkcija raspodjele. Razlika između ovih funkcija je u tome što teorijska funkcija definira vjerovatnoća događaji X< x, тогда как эмпирическая – relativna frekvencija isti događaj. Kako n raste, relativna frekvencija događaja X< x, т.е. стремится по вероятности к вероятности этого события. Иными словами Svojstva empirijske funkcije distribucije: 1) Vrijednosti empirijske funkcije pripadaju intervalu 2) - neopadajuća funkcija 3) Ako - najmanja opcija, onda = 0 na , ako - najveća opcija, onda =1 na . Empirijska funkcija distribucije uzorka služi za procjenu teorijske funkcije distribucije populacije. Primjer. Izgradimo empirijsku funkciju prema distribuciji uzorka: Nađimo veličinu uzorka: 12+18+30=60. Najmanja opcija je 2, dakle =0 za x £ 2. Vrijednost x<6, т.е. , наблюдалось 12 раз, следовательно, =12/60=0,2 при 2< x £6. Аналогично, значения X < 10, т.е. и наблюдались 12+18=30 раз, поэтому =30/60 =0,5 при 6< x £10. Так как x=10 – наибольшая варианта, то =1 при x>10. Dakle, željena empirijska funkcija ima oblik: Najvažnija svojstva statističkih procjena Neka se zahtijeva proučavanje nekog kvantitativnog atributa opće populacije. Pretpostavimo da je iz teorijskih razmatranja to bilo moguće utvrditi koji distribucija ima atribut i potrebno je procijeniti parametre po kojima je određena. Na primjer, ako je ispitivana osobina normalno raspoređena u općoj populaciji, tada je potrebno procijeniti matematičko očekivanje i standardnu devijaciju; ako atribut ima Poissonovu distribuciju, tada je potrebno procijeniti parametar l. Obično su dostupni samo uzorci podataka, kao što su vrijednosti osobina iz n nezavisnih opservacija. Uzimajući u obzir nezavisne slučajne varijable, možemo to reći pronaći statističku procjenu nepoznatog parametra teorijske distribucije znači pronaći funkciju promatranih slučajnih varijabli, što daje približnu vrijednost procijenjenog parametra.
Na primjer, da bi se procijenilo matematičko očekivanje normalne distribucije, ulogu funkcije igra aritmetička sredina Da bi statističke procjene dale ispravne aproksimacije procijenjenih parametara, one moraju zadovoljiti određene zahtjeve, među kojima su najvažniji zahtjevi nepristrasnost
i solventnost
procjene. Neka je statistička procjena nepoznatog parametra teorijske distribucije. Neka se procjena nađe na osnovu uzorka veličine n. Ponovimo eksperiment, tj. izdvajamo iz opšte populacije drugi uzorak iste veličine i na osnovu njegovih podataka dobijamo drugačiju procenu od . Ponavljajući eksperiment mnogo puta, dobijamo različite brojeve. Rezultat se može posmatrati kao slučajna varijabla, a brojevi kao njene moguće vrijednosti. Ako procjena daje aproksimaciju u izobilju, tj. svaki broj je veći od prave vrijednosti, tada je, kao posljedica toga, matematičko očekivanje (srednja vrijednost) slučajne varijable veće od:. Slično, ako procjenjuje sa nedostatkom, zatim . Dakle, korištenje statističke procjene, čije matematičko očekivanje nije jednako procijenjenom parametru, dovelo bi do sistematskih (jednoznačnih) grešaka. Ako je, naprotiv, , onda to garantuje protiv sistematskih grešaka. nepristrasan
naziva se statistička procjena, čije je matematičko očekivanje jednako procijenjenom parametru za bilo koju veličinu uzorka. Displaced naziva se procjena koja ne zadovoljava ovaj uslov. Nepristranost procjene još ne garantuje dobru aproksimaciju za procijenjeni parametar, jer moguće vrijednosti mogu biti veoma raštrkano
oko svoje srednje vrednosti, tj. varijansa može biti značajna. U ovom slučaju, procjena pronađena iz podataka jednog uzorka, na primjer, može se pokazati značajno udaljenom od prosječne vrijednosti, a time i od samog procijenjenog parametra. efikasan
naziva se statistička procjena koja, za datu veličinu uzorka n, ima najmanju moguću varijaciju
. Kada se razmatraju uzorci velikog volumena, potrebne su statističke procjene solventnost
. Bogati
naziva se statistička procjena, koja, kao n®¥, teži vjerovatnoći procijenjenom parametru. Na primjer, ako varijansa nepristrasnog procjenitelja teži nuli kao n®¥, onda se i takav estimator ispostavi da je konzistentan.
, manji .Onda broj je učestalost vrijednosti uočenih u uzorku X, manji ,
one. učestalost pojavljivanja događaja
. Kada se promeni x u opštem slučaju, vrednost će se takođe promeniti . To znači da je relativna frekvencija je funkcija argumenta . A budući da se ova funkcija nalazi prema uzorku podataka dobivenih kao rezultat eksperimenata, naziva se uzorak ili empirijski.
, definirajući za svaku vrijednost x relativna učestalost događaja
.
, a empirijski je relativna učestalost istog događaja. Iz Bernoullijeve teoreme slijedi
(10.20)
i relativnu frekvenciju događaja
, tj.
malo različiti jedno od drugog. Ovo već implicira svrsishodnost korištenja empirijske funkcije distribucije uzorka za približan prikaz teorijske (integralne) funkcije raspodjele opće populacije.
i
imaju ista svojstva. Ovo dolazi iz definicije funkcije.
:
, Shodno tome,
at
. Značenje
, naime
posmatrano 12 puta, dakle:
at
.
i
posmatrano 12+18=30 puta, dakle,
=
at
. At
.
prikazano na sl. 10.2
je. 10.2test pitanja
Opcije
Frekvencije