Tracciare la funzione di distribuzione empirica per il campione. Funzione di distribuzione empirica, proprietà

Serie di variazioni. Poligono e istogramma.

Gamma di distribuzione- rappresenta una distribuzione ordinata delle unità della popolazione studiata in gruppi secondo un certo attributo variabile.

A seconda del tratto alla base della formazione di una serie di distribuzione, ci sono attributivo e variazionale ranghi di distribuzione:

§ Vengono chiamate le serie di distribuzione costruite in ordine crescente o decrescente di valori di un attributo quantitativo variazionale.

La serie di variazioni della distribuzione è composta da due colonne:

La prima colonna contiene i valori quantitativi della variabile caratteristica, che vengono chiamati opzioni e sono contrassegnati. Variante discreta - espressa come numero intero. L'opzione dell'intervallo è nell'intervallo da e verso. A seconda del tipo di varianti, è possibile costruire una serie variazionale discreta o intervallata.
La seconda colonna contiene numero di opzione specifica, espresso in termini di frequenze o frequenze:

Frequenze- sono numeri assoluti che indicano quante volte nell'aggregato si verifica dato valore segni che rappresentano. La somma di tutte le frequenze dovrebbe essere uguale al numero di unità dell'intera popolazione.

Frequenze() sono le frequenze espresse in percentuale del totale. La somma di tutte le frequenze espressa in percentuale deve essere pari al 100% in frazioni di uno.

Rappresentazione grafica delle serie distributive

Le serie distributive sono visualizzate tramite immagini grafiche.

Le serie di distribuzione sono visualizzate come:

§ Poligono

§ Istogrammi

§ Cumula

Poligono

Quando si costruisce un poligono, sull'asse orizzontale (ascissa) vengono tracciati i valori dell'attributo variabile e sull'asse verticale (ordinata) - frequenze o frequenze.

1. Poligono in fig. 6.1 è stato costruito secondo il microcensimento della popolazione russa nel 1994.


istogramma



Per costruire un istogramma lungo l'ascissa, indica i valori dei confini degli intervalli e, in base ad essi, costruisci dei rettangoli la cui altezza è proporzionale alle frequenze (o frequenze).

Sulla fig. 6.2. viene mostrato l'istogramma di distribuzione della popolazione della Russia nel 1997 per fasce d'età.

Fig. 1. Distribuzione della popolazione della Russia per fasce d'età

Funzione di distribuzione empirica, proprietà.

Si noti la distribuzione statistica delle frequenze del tratto quantitativo X. Indichiamo con il numero di osservazioni a cui è stato osservato il valore del tratto minore di x e con n il numero totale di osservazioni. Ovviamente, la frequenza relativa dell'evento X

Una funzione di distribuzione empirica (funzione di distribuzione campionaria) è una funzione che determina per ogni valore x la frequenza relativa dell'evento X

A differenza della funzione di distribuzione empirica del campione, la funzione di distribuzione della popolazione è chiamata funzione di distribuzione teorica. La differenza tra queste funzioni è che la funzione teorica determina la probabilità dell'evento X

Al crescere di n, la frequenza relativa dell'evento X

Proprietà di base

Sia fissato il risultato elementare. Allora è la funzione di distribuzione della distribuzione discreta data dalla seguente funzione di probabilità:

dove un - il numero di elementi del campione pari a . In particolare, se tutti gli elementi del campione sono distinti, allora .

L'aspettativa matematica di questa distribuzione è:

.

Quindi la media campionaria è la media teorica della distribuzione campionaria.

Allo stesso modo, la varianza campionaria è la varianza teorica della distribuzione campionaria.

La variabile casuale ha una distribuzione binomiale:

La funzione di distribuzione campionaria è una stima imparziale della funzione di distribuzione:

.

La varianza della funzione di distribuzione campionaria ha la forma:

.

Secondo la legge forte dei grandi numeri, la funzione di distribuzione campionaria converge quasi sicuramente alla funzione di distribuzione teorica:

quasi sicuramente a .

La funzione di distribuzione campionaria è una stima asintoticamente normale della funzione di distribuzione teorica. Se poi

Per distribuzione a .

Come è noto, la legge di distribuzione di una variabile aleatoria può essere specificata in vari modi. Una variabile casuale discreta può essere specificata utilizzando una serie di distribuzione o una funzione integrale e una variabile casuale continua può essere specificata utilizzando una funzione integrale o differenziale. Consideriamo analoghi selettivi di queste due funzioni.

Lascia che ci sia un insieme campione di valori di una variabile casuale di volume e ad ogni variante di questo set viene assegnata la sua frequenza. Lascia andare oltre è un numero reale, e è il numero di valori campionari della variabile casuale
, più piccola .Poi il numero è la frequenza dei valori osservati nel campione X, più piccola , quelli. la frequenza di accadimento dell'evento
. Quando cambia X nel caso generale, cambierà anche il valore . Ciò significa che la frequenza relativa è una funzione dell'argomento . E poiché questa funzione si trova in base ai dati campionari ottenuti a seguito di esperimenti, è chiamata campione o empirico.

Definizione 10.15. Funzione di distribuzione empirica(funzione di distribuzione del campionamento) è chiamata funzione
, definendo per ogni valore X frequenza relativa dell'evento
.

(10.19)

A differenza della funzione di distribuzione empirica del campione, la funzione di distribuzione F(X) della popolazione generale funzione di distribuzione teorica. La differenza tra loro è che la funzione teorica F(X) determina la probabilità di un evento
, e quella empirica è la frequenza relativa dello stesso evento. Dal teorema di Bernoulli segue

,
(10.20)

quelli. in generale probabilità
e relativa frequenza degli eventi
, cioè.
poco diversi l'uno dall'altro. Ciò implica già l'opportunità di utilizzare la funzione di distribuzione empirica del campione per una rappresentazione approssimativa della funzione di distribuzione teorica (integrale) della popolazione generale.

Funzione
e
hanno le stesse proprietà. Questo deriva dalla definizione della funzione.

Proprietà
:


Esempio 10.4. Costruire una funzione empirica per la data distribuzione campionaria:

Opzioni

Frequenze

Decisione: Trova la dimensione del campione n= 12+18+30=60. Opzione minima
, quindi,
A
. Significato
, vale a dire
osservato 12 volte, quindi:

=
A
.

Significato X< 10, e precisamente
e
sono stati osservati 12+18=30 volte, quindi
=
A
. In

.

La funzione di distribuzione empirica desiderata:

=

Programma
mostrato in fig. 10.2

R
è. 10.2

domande di prova

1. Quali sono i principali problemi risolti dalla statistica matematica? 2. Popolazione generale e campione? 3. Definire la dimensione del campione. 4. Quali campioni sono chiamati rappresentativi? 5. Errori di rappresentatività. 6. Principali metodi di campionamento. 7. Concetti di frequenza, frequenza relativa. 8. Il concetto di serie statistica. 9. Annota la formula di Sturges. 10. Formulare i concetti di intervallo campionario, mediana e moda. 11. Frequenze poligonali, istogramma. 12. Il concetto di stima puntuale di una popolazione campione. 13. Stima puntuale e imparziale. 14. Formulare il concetto di media campionaria. 15. Formulare il concetto di varianza campionaria. 16. Formulare il concetto di deviazione standard campionaria. 17. Formulare il concetto di coefficiente di variazione campionario. 18. Formulare il concetto di media geometrica campionaria.

Scopri cos'è una formula empirica. In chimica, un ESP è il modo più semplice per descrivere un composto: essenzialmente, è un elenco degli elementi che compongono il composto data la loro percentuale. Va notato che questa semplice formula non descrive ordine atomi in un composto, indica semplicemente di quali elementi è costituito. Per esempio:

  • Un composto costituito dal 40,92% di carbonio; 4,58% di idrogeno e 54,5% di ossigeno, avranno la formula empirica C 3 H 4 O 3 (un esempio di come trovare l'ESP di questo composto sarà discusso nella seconda parte).
  • Impara il termine "composizione percentuale"."Composizione percentuale" si riferisce alla percentuale di ogni singolo atomo nell'intero composto in esame. Per trovare la formula empirica di un composto, è necessario conoscere la composizione percentuale del composto. Se trovi una formula empirica come compito a casa, è più probabile che vengano fornite delle percentuali.

    • Per trovare la composizione percentuale di un composto chimico in laboratorio, questo viene sottoposto ad alcuni esperimenti fisici e quindi ad analisi quantitative. Se non sei in laboratorio, non hai bisogno di fare questi esperimenti.
  • Tieni presente che dovrai avere a che fare con atomi di grammo. Un grammo atomo è una certa quantità di una sostanza la cui massa è uguale alla sua massa atomica. Per trovare un atomo di grammo, devi usare la seguente equazione: La percentuale di un elemento in un composto è divisa per la massa atomica dell'elemento.

    • Diciamo, ad esempio, di avere un composto contenente il 40,92% di carbonio. La massa atomica del carbonio è 12, quindi la nostra equazione sarebbe 40,92 / 12 = 3,41.
  • Sapere come trovare il rapporto atomico. Quando lavori con un composto, ti ritroverai con più di un grammo atomo. Dopo aver trovato tutti gli atomi di grammo del tuo composto, guardali. Per trovare il rapporto atomico, dovrai selezionare il valore grammo-atomo più piccolo che hai calcolato. Quindi sarà necessario dividere tutti i grammo-atomi nel più piccolo grammo-atomo. Per esempio:

    • Supponiamo di lavorare con un composto contenente tre atomi di grammo: 1,5; 2 e 2.5. Il più piccolo di questi numeri è 1,5. Pertanto, per trovare il rapporto tra gli atomi, devi dividere tutti i numeri per 1,5 e mettere un segno di rapporto tra di loro : .
    • 1,5 / 1,5 = 1,2 / 1,5 = 1,33. 2,5 / 1,5 = 1,66. Pertanto, il rapporto tra gli atomi è 1: 1,33: 1,66 .
  • Scopri come convertire i valori del rapporto atomico in numeri interi. Quando si scrive una formula empirica, è necessario utilizzare numeri interi. Ciò significa che non puoi usare numeri come 1,33. Dopo aver trovato il rapporto tra gli atomi, devi convertire i numeri frazionari (come 1,33) in numeri interi (come 3). Per fare ciò, devi trovare un numero intero, moltiplicando ogni numero del rapporto atomico per il quale ottieni numeri interi. Per esempio:

    • Prova 2. Moltiplica i numeri del rapporto atomico (1, 1,33 e 1,66) per 2. Ottieni 2, 2,66 e 3,32. Non sono numeri interi, quindi 2 non è appropriato.
    • Prova 3. Se moltiplichi 1, 1,33 e 1,66 per 3, ottieni rispettivamente 3, 4 e 5. Pertanto, il rapporto atomico degli interi ha la forma 3: 4: 5 .
  • Lezione 13

    Si noti la distribuzione statistica delle frequenze del tratto quantitativo X. Indichiamo con il numero di osservazioni a cui è stato osservato il valore del tratto minore di x e con n il numero totale di osservazioni. Ovviamente, la frequenza relativa dell'evento X< x равна и является функцией x. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.

    Funzione di distribuzione empirica(funzione di distribuzione del campionamento) è una funzione che determina per ogni valore x la frequenza relativa dell'evento X< x. Таким образом, по определению ,где - число вариант, меньших x, n – объем выборки.

    A differenza della funzione di distribuzione empirica del campione, viene chiamata la funzione di distribuzione della popolazione funzione di distribuzione teorica. La differenza tra queste funzioni è che la funzione teorica definisce probabilità eventi X< x, тогда как эмпирическая – frequenza relativa lo stesso evento.

    Al crescere di n, la frequenza relativa dell'evento X< x, т.е. стремится по вероятности к вероятности этого события. Иными словами

    Proprietà della funzione di distribuzione empirica:

    1) All'intervallo appartengono i valori della funzione empirica

    2) - funzione non decrescente

    3) Se - l'opzione più piccola, allora = 0 a , se - l'opzione più grande, allora =1 a .

    La funzione di distribuzione empirica del campione serve a stimare la funzione di distribuzione teorica della popolazione.

    Esempio. Costruiamo una funzione empirica in base alla distribuzione del campione:

    Opzioni
    Frequenze

    Troviamo la dimensione del campione: 12+18+30=60. L'opzione più piccola è 2, quindi =0 per x £ 2. Il valore di x<6, т.е. , наблюдалось 12 раз, следовательно, =12/60=0,2 при 2< x £6. Аналогично, значения X < 10, т.е. и наблюдались 12+18=30 раз, поэтому =30/60 =0,5 при 6< x £10. Так как x=10 – наибольшая варианта, то =1 при x>10. Pertanto, la funzione empirica desiderata ha la forma:

    Le proprietà più importanti delle stime statistiche

    Sia richiesto di studiare qualche attributo quantitativo della popolazione generale. Assumiamo che, da considerazioni teoriche, sia stato possibile stabilirlo quale la distribuzione ha un attributo ed è necessario valutare i parametri con cui viene determinata. Ad esempio, se il tratto oggetto di studio è normalmente distribuito nella popolazione generale, è necessario stimare l'aspettativa matematica e la deviazione standard; se l'attributo ha una distribuzione di Poisson, allora è necessario stimare il parametro l.

    Di solito sono disponibili solo dati campionari, come i valori dei tratti da n osservazioni indipendenti. Considerando come variabili casuali indipendenti, possiamo dirlo trovare una stima statistica di un parametro sconosciuto di una distribuzione teorica significa trovare una funzione delle variabili casuali osservate che dia un valore approssimativo del parametro stimato. Ad esempio, per stimare l'aspettativa matematica di una distribuzione normale, il ruolo di una funzione è svolto dalla media aritmetica



    Affinché le stime statistiche forniscano approssimazioni corrette dei parametri stimati, devono soddisfare determinati requisiti, tra i quali i più importanti sono i requisiti imparzialità e solvibilità stime.

    Sia una stima statistica del parametro incognito della distribuzione teorica. Si faccia il preventivo sulla base di un campione di taglia n. Ripetiamo l'esperimento, cioè estraiamo dalla popolazione generale un altro campione della stessa dimensione e, in base ai suoi dati, otteniamo una stima diversa di . Ripetendo l'esperimento molte volte, otteniamo numeri diversi. Il punteggio può essere pensato come una variabile casuale e i numeri come i suoi possibili valori.

    Se la stima fornisce un'approssimazione in abbondanza, cioè. ogni numero è maggiore del valore vero, quindi, di conseguenza, l'aspettativa matematica (valore medio) della variabile casuale è maggiore di:. Allo stesso modo, se valuta con uno svantaggio, poi .

    Pertanto, l'uso di una stima statistica, la cui aspettativa matematica non è uguale al parametro stimato, porterebbe a errori sistematici (un segno). Se, al contrario, , allora questo garantisce contro errori sistematici.

    imparziale chiamata stima statistica, la cui aspettativa matematica è uguale al parametro stimato per qualsiasi dimensione campionaria.

    Spostatoè chiamata stima che non soddisfa questa condizione.

    L'imparzialità della stima non garantisce ancora una buona approssimazione del parametro stimato, poiché i valori possibili possono essere molto disperso intorno al suo valore medio, cioè la variazione può essere significativa. In questo caso, la stima ricavata dai dati di un campione, ad esempio, può risultare significativamente lontana dal valore medio, e quindi dal parametro stimato stesso.

    efficiente è chiamata stima statistica che, per una data dimensione campionaria n, ha minima varianza possibile .

    Quando si considerano campioni di grande volume, sono necessarie stime statistiche solvibilità .

    Ricco è chiamata stima statistica, che, come n®¥, tende in probabilità al parametro stimato. Ad esempio, se la varianza di uno stimatore imparziale tende a zero come n®¥, anche tale stimatore risulta coerente.

    Condividere