Reprezentați grafic funcția de distribuție empirică pentru eșantion. Funcția de distribuție empirică, proprietăți

Seria de variații. Poligon și histogramă.

Domeniul de distribuție- reprezintă o distribuție ordonată a unităților populației studiate în grupuri în funcție de un anumit atribut variabil.

În funcție de trăsătura care stă la baza formării unei serii de distribuție, există atributiv și variațional grade de distributie:

§ Se numesc serii de distribuție construite în ordine crescătoare sau descrescătoare a valorilor unui atribut cantitativ variațională.

Seria de variații a distribuției constă din două coloane:

Prima coloană conține valorile cantitative ale caracteristicii variabilei, care sunt numite Opțiuniși sunt marcate. Varianta discretă - exprimată ca număr întreg. Opțiunea de interval este în intervalul de la și până. În funcție de tipul de variante, este posibilă construirea unei serii variaționale discrete sau pe intervale.
A doua coloană conține numărul de opțiuni specifice, exprimat în termeni de frecvențe sau frecvențe:

Frecvențele- acestea sunt numere absolute care arată de câte ori în total apare valoare dată semne care reprezintă . Suma tuturor frecvențelor ar trebui să fie egală cu numărul de unități ale întregii populații.

Frecvențele() sunt frecvențele exprimate ca procent din total. Suma tuturor frecvențelor exprimată ca procent trebuie să fie egală cu 100% în fracțiuni de unu.

Reprezentarea grafică a seriilor de distribuție

Serii de distribuție sunt vizualizate folosind imagini grafice.

Seriile de distribuție sunt afișate ca:

§ Poligon

§ Histograme

§ Se cumulează

Poligon

La construirea unui poligon, pe axa orizontală (abscisă) sunt trasate valorile atributului variabil, iar pe axa verticală (ordonată) - frecvențe sau frecvențe.

1. Poligon din fig. 6.1 a fost construit conform micro-recensământului populației Rusiei în 1994.


diagramă cu bare



Pentru a construi o histogramă de-a lungul abscisei, indicați valorile limitelor intervalelor și, pe baza acestora, construiți dreptunghiuri a căror înălțime este proporțională cu frecvențele (sau frecvențele).

Pe fig. 6.2. este prezentată histograma distribuției populației Rusiei în 1997 pe grupe de vârstă.

Fig.1. Distribuția populației Rusiei pe grupe de vârstă

Funcția de distribuție empirică, proprietăți.

Să fie cunoscută distribuția statistică a frecvențelor trăsăturii cantitative X. Să notăm cu numărul de observații la care s-a observat valoarea trăsăturii mai mică decât x și cu n numărul total de observații. Evident, frecvența relativă a evenimentului X

O funcție de distribuție empirică (funcție de distribuție a eșantionului) este o funcție care determină pentru fiecare valoare x frecvența relativă a evenimentului X

Spre deosebire de funcția de distribuție empirică a eșantionului, funcția de distribuție a populației se numește funcție de distribuție teoretică. Diferența dintre aceste funcții este că funcția teoretică determină probabilitatea evenimentului X

Pe măsură ce n crește, frecvența relativă a evenimentului X

Proprietăți de bază

Să fie fix rezultatul elementar. Atunci funcția de distribuție a distribuției discrete este dată de următoarea funcție de probabilitate:

unde un - numărul de elemente de probă egal cu . În special, dacă toate elementele eșantionului sunt distincte, atunci .

Așteptările matematice ale acestei distribuții sunt:

.

Deci media eșantionului este media teoretică a distribuției eșantionului.

În mod similar, varianța eșantionului este varianța teoretică a distribuției eșantionului.

Variabila aleatoare are o distribuție binomială:

Funcția de distribuție a eșantionului este o estimare imparțială a funcției de distribuție:

.

Varianta funcției de distribuție a eșantionului are forma:

.

Conform legii puternice a numerelor mari, funcția de distribuție a eșantionului converge aproape sigur către funcția de distribuție teoretică:

aproape sigur la .

Funcția de distribuție a eșantionului este o estimare normală asimptotic a funcției de distribuție teoretică. Daca atunci

Prin distribuire la .

După cum se știe, legea distribuției unei variabile aleatoare poate fi specificată în diferite moduri. O variabilă aleatoare discretă poate fi specificată folosind o serie de distribuție sau o funcție integrală, iar o variabilă aleatoare continuă poate fi specificată folosind fie o funcție integrală, fie o funcție diferențială. Să luăm în considerare analogii selectivi ai acestor două funcții.

Să existe un set de mostre de valori ale unei variabile aleatorii de volum iar fiecărei variante din acest set îi este atribuită frecvența sa. Lasă mai departe este un număr real și este numărul de valori ale eșantionului variabilei aleatoare
, mai mici .Apoi numărul este frecvența valorilor observate în eșantion X, mai mici , acestea. frecvența de apariție a evenimentului
. Când se schimbă Xîn cazul general, valoarea se va modifica și ea . Aceasta înseamnă că frecvența relativă este o funcție a argumentului . Și deoarece această funcție se găsește în funcție de datele eșantionului obținute în urma experimentelor, se numește eșantion sau empiric.

Definiția 10.15. Funcția de distribuție empirică(funcția de distribuție a eșantionării) se numește funcție
, definind pentru fiecare valoare X frecvența relativă a evenimentului
.

(10.19)

Spre deosebire de funcția de distribuție empirică a eșantionului, funcția de distribuție F(X) a populaţiei generale se numeşte funcţia de distribuţie teoretică. Diferența dintre ele este că funcția teoretică F(X) determină probabilitatea unui eveniment
, iar cel empiric este frecvența relativă a aceluiași eveniment. Din teorema Bernoulli rezultă

,
(10.20)

acestea. în mare probabilitate
și frecvența relativă a evenimentelor
, adică
putin diferit unul de altul. Aceasta implică deja oportunitatea utilizării funcției de distribuție empirică a eșantionului pentru o reprezentare aproximativă a funcției de distribuție teoretică (integrală) a populației generale.

Funcţie
și
au aceleasi proprietati. Aceasta provine din definiția funcției.

Proprietăți
:


Exemplul 10.4. Construiți o funcție empirică pentru distribuția eșantionului dată:

Opțiuni

Frecvențele

Soluţie: Găsiți dimensiunea eșantionului n= 12+18+30=60. Cea mai mică opțiune
, Prin urmare,
la
. Sens
, și anume
observat de 12 ori, prin urmare:

=
la
.

Sens X< 10 și anume
și
au fost observate de 12+18=30 de ori, prin urmare,
=
la
. La

.

Funcția de distribuție empirică dorită:

=

Programa
prezentată în fig. 10.2

R
este. 10.2

întrebări de testare

1. Care sunt principalele probleme rezolvate de statistica matematică? 2. Populația generală și eșantion? 3. Definiți dimensiunea eșantionului. 4. Ce mostre se numesc reprezentative? 5. Erori de reprezentativitate. 6. Principalele metode de prelevare a probelor. 7. Concepte de frecvență, frecvență relativă. 8. Conceptul de serie statistică. 9. Notează formula Sturges. 10. Formulați conceptele de interval de eșantionare, mediană și mod. 11. Frecvențe poligonului, histogramă. 12. Conceptul de estimare punctuală a unei populații eșantion. 13. Estimare punctuală părtinitoare și nepărtinitoare. 14. Formulați conceptul de medie eșantionului. 15. Formulați conceptul de varianță eșantionului. 16. Formulați conceptul de abatere standard a eșantionului. 17. Formulați conceptul de coeficient de variație al eșantionului. 18. Formulați conceptul de medie geometrică eșantion.

Aflați ce este o formulă empirică.În chimie, un ESP este cel mai simplu mod de a descrie un compus - în esență, este o listă a elementelor care alcătuiesc compusul dat fiind procentul lor. Trebuie remarcat faptul că această formulă simplă nu descrie Ordin atomi dintr-un compus, indică pur și simplu din ce elemente constă. De exemplu:

  • Un compus constând din 40,92% carbon; 4,58% hidrogen și 54,5% oxigen, vor avea formula empirică C 3 H 4 O 3 (un exemplu de găsire a ESP al acestui compus va fi discutat în a doua parte).
  • Învață termenul „compoziție procentuală”."Compoziție procentuală" se referă la procentul fiecărui atom individual din întregul compus luat în considerare. Pentru a găsi formula empirică a unui compus, este necesar să se cunoască compoziția procentuală a compusului. Dacă găsiți o formulă empirică ca temă pentru acasă, atunci procentele sunt mai probabil să fie date.

    • Pentru a afla compoziția procentuală a unui compus chimic în laborator, acesta este supus unor experimente fizice și apoi analize cantitative. Dacă nu sunteți în laborator, nu trebuie să faceți aceste experimente.
  • Rețineți că va trebui să aveți de-a face cu atomi gram. Un atom gram este o anumită cantitate dintr-o substanță a cărei masă este egală cu masa atomică. Pentru a găsi un atom gram, trebuie să utilizați următoarea ecuație: Procentul unui element dintr-un compus este împărțit la masa atomică a elementului.

    • Să presupunem, de exemplu, că avem un compus care conține 40,92% carbon. Masa atomică a carbonului este 12, deci ecuația noastră ar fi 40,92 / 12 = 3,41.
  • Aflați cum să găsiți raportul atomic. Când lucrați cu un compus, veți ajunge cu mai mult de un atom gram. După ce ai găsit toți atomii gram ai compusului tău, uită-te la ei. Pentru a găsi raportul atomic, va trebui să selectați cea mai mică valoare gram-atom pe care ați calculat-o. Apoi va fi necesar să împărțiți toți atomii gram în cel mai mic atom gram. De exemplu:

    • Să presupunem că lucrați cu un compus care conține trei atomi gram: 1,5; 2 și 2.5. Cel mai mic dintre aceste numere este 1,5. Prin urmare, pentru a găsi raportul dintre atomi, trebuie să împărțiți toate numerele la 1,5 și să puneți un semn de raport între ele. : .
    • 1,5 / 1,5 = 1, 2 / 1,5 = 1,33. 2,5 / 1,5 = 1,66. Prin urmare, raportul dintre atomi este 1: 1,33: 1,66 .
  • Aflați cum să convertiți valorile raportului atomic în numere întregi. Când scrieți o formulă empirică, trebuie să utilizați numere întregi. Aceasta înseamnă că nu puteți folosi numere precum 1.33. După ce găsiți raportul dintre atomi, trebuie să convertiți numerele fracționale (cum ar fi 1,33) în numere întregi (cum ar fi 3). Pentru a face acest lucru, trebuie să găsiți un număr întreg, înmulțind fiecare număr al raportului atomic cu care obțineți numere întregi. De exemplu:

    • Încercați 2. Înmulțiți numerele raportului atomic (1, 1,33 și 1,66) cu 2. Obțineți 2, 2,66 și 3,32. Nu sunt numere întregi, deci 2 nu este potrivit.
    • Încercați 3. Dacă înmulțiți 1, 1,33 și 1,66 cu 3, obțineți 3, 4 și, respectiv, 5. Prin urmare, raportul atomic al numerelor întregi are forma 3: 4: 5 .
  • Cursul 13

    Să fie cunoscută distribuția statistică a frecvențelor trăsăturii cantitative X. Să notăm cu numărul de observații la care s-a observat valoarea trăsăturii mai mică decât x și cu n numărul total de observații. Evident, frecvența relativă a evenimentului X< x равна и является функцией x. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.

    Funcția de distribuție empirică(funcția de distribuție a eșantionării) este o funcție care determină pentru fiecare valoare x frecvența relativă a evenimentului X< x. Таким образом, по определению ,где - число вариант, меньших x, n – объем выборки.

    Spre deosebire de funcția de distribuție empirică a eșantionului, se numește funcția de distribuție a populației funcţia de distribuţie teoretică. Diferența dintre aceste funcții este că funcția teoretică definește probabilitate X evenimente< x, тогда как эмпирическая – frecventa relativa acelasi eveniment.

    Pe măsură ce n crește, frecvența relativă a evenimentului X< x, т.е. стремится по вероятности к вероятности этого события. Иными словами

    Proprietățile funcției de distribuție empirică:

    1) Valorile funcției empirice aparțin intervalului

    2) - funcţie nedescrescătoare

    3) Dacă - cea mai mică opțiune, atunci = 0 la , dacă - cea mai mare opțiune, atunci =1 la .

    Funcția de distribuție empirică a eșantionului servește la estimarea funcției de distribuție teoretică a populației.

    Exemplu. Să construim o funcție empirică în funcție de distribuția eșantionului:

    Opțiuni
    Frecvențele

    Să găsim dimensiunea eșantionului: 12+18+30=60. Cea mai mică opțiune este 2, deci =0 pentru x £ 2. Valoarea lui x<6, т.е. , наблюдалось 12 раз, следовательно, =12/60=0,2 при 2< x £6. Аналогично, значения X < 10, т.е. и наблюдались 12+18=30 раз, поэтому =30/60 =0,5 при 6< x £10. Так как x=10 – наибольшая варианта, то =1 при x>10. Astfel, funcția empirică dorită are forma:

    Cele mai importante proprietăți ale estimărilor statistice

    Să fie necesar să se studieze un anumit atribut cantitativ al populației generale. Să presupunem că, din considerente teoretice, s-a putut stabili că care distribuţia are un atribut şi este necesar să se evalueze parametrii după care este determinată. De exemplu, dacă trăsătura studiată este distribuită în mod normal în populația generală, atunci este necesar să se estimeze așteptarea matematică și abaterea standard; dacă atributul are o distribuție Poisson, atunci este necesar să se estimeze parametrul l.

    De obicei, sunt disponibile doar date eșantion, cum ar fi valorile trăsăturilor din n observații independente. Considerând ca variabile aleatoare independente, putem spune că a găsi o estimare statistică a unui parametru necunoscut al unei distribuții teoretice înseamnă a găsi o funcție a variabilelor aleatoare observate, care dă o valoare aproximativă a parametrului estimat. De exemplu, pentru a estima așteptările matematice ale unei distribuții normale, rolul unei funcții este jucat de media aritmetică



    Pentru ca estimările statistice să ofere aproximări corecte ale parametrilor estimați, acestea trebuie să îndeplinească anumite cerințe, dintre care cele mai importante sunt cerințele imparțialitatea și solvabilitate estimări.

    Fie o estimare statistică a parametrului necunoscut al distribuției teoretice. Fie ca estimarea să fie găsită pe baza unui eșantion de mărimea n. Să repetăm ​​experimentul, adică. extragem din populația generală un alt eșantion de aceeași mărime și, pe baza datelor sale, obținem o estimare diferită de . Repetând experimentul de multe ori, obținem numere diferite. Scorul poate fi considerat ca o variabilă aleatorie, iar numerele ca valori posibile.

    Dacă estimarea oferă o aproximare in abundenta, adică fiecare număr este mai mare decât valoarea adevărată, apoi, în consecință, așteptarea matematică (valoarea medie) a variabilei aleatoare este mai mare decât:. La fel, dacă evaluează cu un dezavantaj, apoi .

    Astfel, utilizarea unei estimări statistice, a cărei așteptare matematică nu este egală cu parametrul estimat, ar duce la erori sistematice (un singur semn). Dacă, dimpotrivă, , atunci aceasta garantează împotriva erorilor sistematice.

    imparțial numită estimare statistică, a cărei așteptare matematică este egală cu parametrul estimat pentru orice dimensiune a eșantionului.

    Deplasat se numeste estimare care nu satisface aceasta conditie.

    Nepărtinirea estimării nu garantează încă o bună aproximare a parametrului estimat, deoarece valorile posibile pot fi foarte dispersate în jurul valorii sale medii, adică varianţa poate fi semnificativă. În acest caz, estimarea găsită din datele unui eșantion, de exemplu, se poate dovedi a fi semnificativ îndepărtată de valoarea medie și, prin urmare, de parametrul estimat în sine.

    eficient se numește estimare statistică care, pentru o dimensiune dată de eșantion n, are cea mai mică variație posibilă .

    Atunci când se iau în considerare mostre de volum mare, sunt necesare estimări statistice solvabilitate .

    Bogat se numește estimare statistică, care, ca n®¥, tinde probabil către parametrul estimat. De exemplu, dacă varianța unei estimări nepărtinitoare tinde spre zero ca n®¥, atunci o astfel de estimare se dovedește, de asemenea, a fi consecventă.

    Acțiune