Una caratteristica della dispersione dei valori è casuale. Caratteristiche di scattering Dispersione e sue proprietà Disuguaglianza di Chebyshev

Le caratteristiche di posizione descrivono il centro di distribuzione. Allo stesso tempo, i valori di una variante possono essere raggruppati attorno ad essa sia in una banda larga che in una stretta. Pertanto, per descrivere la distribuzione, è necessario caratterizzare l'intervallo di modifica dei valori dell'attributo. Le caratteristiche di dispersione vengono utilizzate per descrivere la gamma di variazione delle caratteristiche. I più utilizzati sono il range di variazione, dispersione, deviazione standard e coefficiente di variazione.

Variazione dell'intervalloè definita come la differenza tra il valore massimo e minimo del tratto nella popolazione studiata:

R=X max- X min.

L'ovvio vantaggio di questo indicatore è la facilità di calcolo. Tuttavia, poiché l'intervallo di variazione dipende dai valori solo dei valori estremi dell'attributo, l'ambito della sua applicazione è limitato a distribuzioni abbastanza omogenee. In altri casi, il contenuto informativo di questo indicatore è molto ridotto, poiché esistono molte distribuzioni che differiscono notevolmente nella forma, ma hanno lo stesso intervallo. Negli studi pratici, l'intervallo di variazione viene talvolta utilizzato per campioni di piccole dimensioni (non più di 10). Quindi, ad esempio, in base all'intervallo di variazione, è facile stimare quanto i risultati migliori e peggiori differiscano in un gruppo di atleti.

In questo esempio:

R\u003d 16.36 - 13.04 \u003d 3.32 (m).

La seconda caratteristica di scattering è dispersione. La varianza è il quadrato medio della deviazione di un valore variabile casuale dal suo valore medio. La dispersione è una caratteristica della dispersione, la dispersione dei valori di una quantità attorno al suo valore medio. La stessa parola "dispersione" significa "dispersione".

Quando si effettuano studi a campione, è necessario stabilire una stima della varianza. La varianza calcolata dai dati del campione è chiamata varianza del campione ed è indicata S 2 .

A prima vista, la stima più naturale per la varianza è la varianza statistica calcolata dalla definizione utilizzando la formula:

In questa formula, la somma delle deviazioni al quadrato dei valori degli attributi x io dalla media aritmetica . Questa somma viene divisa per la dimensione del campione per ottenere le deviazioni medie al quadrato. P.

Tuttavia, questa stima non è imparziale. Si può dimostrare che la somma delle deviazioni al quadrato dei valori degli attributi per la media aritmetica campionaria è inferiore alla somma delle deviazioni al quadrato da qualsiasi altro valore, inclusa la media vera ( aspettativa matematica). Pertanto, il risultato ottenuto dalla formula precedente conterrà un errore sistematico e il valore stimato della varianza sarà sottovalutato. Per eliminare la distorsione è sufficiente introdurre un fattore di correzione. Il risultato è la seguente relazione per la varianza stimata:

Per grandi valori n, ovviamente, entrambe le stime, parziali e imparziali, differiranno molto poco e l'introduzione di un fattore di correzione diventa priva di significato. Di norma, la formula per stimare la varianza dovrebbe essere affinata quando n<30.

Nel caso di dati raggruppati, l'ultima formula per semplificare i calcoli può essere ridotta alla seguente forma:

dove K- numero di intervalli di raggruppamento;

n io- frequenza di intervallo con numero io;

x io- il valore medio dell'intervallo con il numero io.

Ad esempio, calcoliamo la varianza per i dati raggruppati dell'esempio che stiamo analizzando (vedi Tabella 4.):

S 2 =/ 28=0,5473 (m2).

La varianza di una variabile casuale ha la dimensione del quadrato della dimensione di una variabile casuale, il che la rende difficile da interpretare e la rende poco visiva. Per una descrizione più visiva dello scattering, è più conveniente utilizzare una caratteristica la cui dimensione coincide con la dimensione della caratteristica in studio. A questo scopo, il concetto deviazione standard(o deviazione standard).

deviazione standardè chiamata radice quadrata positiva della varianza:

Nel nostro esempio, la deviazione standard è

La deviazione standard ha le stesse unità di misura dei risultati della misurazione del tratto in studio e, quindi, caratterizza il grado di deviazione del tratto dalla media aritmetica. In altre parole, mostra come la parte principale della variante si trova rispetto alla media aritmetica.

Deviazione standard e varianza sono le misure di variazione più utilizzate. Ciò è dovuto al fatto che sono inclusi in una parte significativa dei teoremi della teoria della probabilità, che funge da fondamento della statistica matematica. Inoltre, la varianza può essere scomposta nei suoi elementi costitutivi, consentendo di valutare l'influenza di vari fattori sulla variazione del tratto in studio.

Oltre agli indicatori assoluti di variazione, che sono varianza e deviazione standard, nella statistica vengono introdotti quelli relativi. Il coefficiente di variazione più comunemente usato. Il coefficiente di variazioneè uguale al rapporto tra la deviazione standard e la media aritmetica, espresso in percentuale:

Dalla definizione risulta chiaro che, nel suo significato, il coefficiente di variazione è una misura relativa della dispersione di una caratteristica.

Per l'esempio in questione:

Il coefficiente di variazione è ampiamente utilizzato nella ricerca statistica. Essendo un valore relativo, permette di confrontare le fluttuazioni di entrambi i tratti con diverse unità di misura, così come lo stesso tratto in più popolazioni diverse con diversi valori della media aritmetica.

Il coefficiente di variazione viene utilizzato per caratterizzare l'omogeneità dei dati sperimentali ottenuti. Nella pratica della cultura fisica e dello sport, la diffusione dei risultati della misurazione in funzione del valore del coefficiente di variazione è considerata piccola (V<10%), средним (11-20%) и большим (V> 20%).

Le restrizioni sull'uso del coefficiente di variazione sono legate alla sua natura relativa: la definizione contiene una normalizzazione della media aritmetica. A questo proposito, per piccoli valori assoluti della media aritmetica, il coefficiente di variazione può perdere il suo contenuto informativo. Più il valore della media aritmetica si avvicina a zero, meno informativo diventa questo indicatore. Nel caso limite, la media aritmetica va a zero (ad esempio la temperatura) e il coefficiente di variazione va all'infinito, indipendentemente dalla diffusione della caratteristica. Per analogia con il caso di errore, possiamo formulare la seguente regola. Se il valore della media aritmetica nel campione è maggiore di uno, allora è giustificato l'uso del coefficiente di variazione, altrimenti, per descrivere la dispersione dei dati sperimentali dovrebbero essere utilizzati la dispersione e la deviazione standard.

In conclusione di questa parte, consideriamo la valutazione della variazione dei valori delle caratteristiche stimate. Come già notato, i valori delle caratteristiche di distribuzione calcolati dai dati sperimentali non coincidono con i loro veri valori per la popolazione generale. Non è possibile stabilire con precisione quest'ultimo, poiché, di regola, è impossibile esaminare l'intera popolazione. Se utilizziamo i risultati di diversi campioni della stessa popolazione generale per stimare i parametri di distribuzione, risulta che queste stime per campioni diversi differiscono l'una dall'altra. I valori stimati fluttuano attorno ai loro valori reali.

Le deviazioni delle stime dei parametri generali dai valori reali di questi parametri sono chiamate errori statistici. La ragione del loro verificarsi è la dimensione limitata del campione: non tutti gli oggetti della popolazione generale sono inclusi in esso. Per stimare l'entità degli errori statistici, viene utilizzata la deviazione standard delle caratteristiche del campione.

Ad esempio, considera la caratteristica di posizione più importante: la media aritmetica. Si può dimostrare che la deviazione standard della media aritmetica è data da:

dove σ - deviazione standard per la popolazione generale.

Poiché il vero valore della deviazione standard non è noto, viene chiamata una quantità errore standard della media aritmetica e uguale:

Il valore caratterizza l'errore che, in media, è consentito sostituendo la media generale con la sua stima campionaria. Secondo la formula, un aumento della dimensione del campione durante lo studio porta ad una diminuzione dell'errore standard in proporzione alla radice quadrata della dimensione del campione.

Per l'esempio in esame, il valore dell'errore standard della media aritmetica è . Nel nostro caso, è risultato essere 5,4 volte inferiore al valore della deviazione standard.

La caratteristica principale della dispersione di una serie variazionale è chiamata dispersione

Viene chiamata la caratteristica principale della dispersione della serie di variazioni dispersione. Varianza di campionamentoD in si calcola con la seguente formula:

dove x io – io -esimo valore dal campione verificatosi mi volte; n - misura di prova; è la media campionaria; K è il numero di valori diversi nel campione. In questo esempio: x 1 =72, m 1 =50; x 2 = 85, m 2 = 44; x 3 =69, m 3 =61; n=155; k=3; . Quindi:

Si noti che maggiore è il valore di dispersione, maggiore è la differenza tra i valori della quantità misurata l'uno dall'altro. Se nel campione tutti i valori del valore misurato sono uguali tra loro, la varianza di tale campione è uguale a zero.

La dispersione ha proprietà speciali.

Proprietà 1.Il valore della varianza di qualsiasi campione non è negativo, cioè .

Proprietà 2.Se il valore misurato è costante X=c, la varianza per tale valore è zero: D[c ]= 0.

Proprietà 3.Se tutti i valori della quantità misurata X nel campione aumentare in c volte, la varianza di questo campione aumenterà di c 2 volte: D[cx ]= c 2 D [ x ], dove c = cost.

A volte, al posto della varianza, viene utilizzata una deviazione standard campionaria, che è uguale alla radice quadrata aritmetica della varianza campionaria: .

Per l'esempio considerato, la deviazione standard campionaria è uguale a .

La dispersione consente di valutare non solo il grado di differenza negli indicatori misurati all'interno di un gruppo, ma può anche essere utilizzata per determinare la deviazione dei dati tra diversi gruppi. Per questo vengono utilizzati diversi tipi di dispersione.

Se un gruppo viene preso come campione, viene chiamata la varianza di questo gruppo varianza di gruppo. Per esprimere numericamente le differenze tra le varianze di più gruppi, c'è il concetto varianza intergruppo. La varianza intergruppo è la varianza delle medie del gruppo rispetto alla media complessiva:

dove k è il numero di gruppi nel campione totale, è la media campionaria per i -esimo gruppo, n i - misura di prova io esimo gruppo, - media campionaria per tutti i gruppi.

Considera un esempio.

Il punteggio medio per il lavoro di controllo in matematica nella classe 10 "A" era 3,64 e nella classe 10 "B" 3,52. In 10 "A" ci sono 22 studenti, e in 10 "B" - 21. Troviamo la dispersione intergruppo.

In questo problema, il campione è diviso in due gruppi (due classi). La media campionaria per tutti i gruppi è:

.

In questo caso, la varianza intergruppo è:

Poiché la varianza intergruppo è prossima allo zero, possiamo concludere che i punteggi di un gruppo (classe 10 "A") differiscono leggermente dai punteggi del secondo gruppo (classe 10 "B"). In altre parole, dal punto di vista della varianza intergruppo, i gruppi considerati differiscono leggermente in termini di un dato attributo.

Se il campione totale (ad esempio una classe di studenti) è diviso in più gruppi, oltre alla varianza intergruppo, si può anche calcolarevarianza intragruppo. Questa varianza è la media di tutte le varianze di gruppo.

Varianza intragruppoD Ungheria calcolato con la formula:

dove k è il numero di gruppi nel campione totale, D i – varianza i esimo gruppo di volumi n io .

C'è una relazione tra l'insieme (D in ), intragruppo ( D ngr ) e intergruppo ( D intergr) dispersioni:

D in \u003d D ingr + D ingr.

    EFFICACE SUPERFICIE DI DISPERSIONE (AREA)- caratteristica della riflettività del bersaglio, espressa dal rapporto tra la potenza di el. magn. energia riflessa dal bersaglio nella direzione del ricevitore, alla densità del flusso di energia superficiale incidente sul bersaglio. Dipende da… … Enciclopedia delle forze missilistiche strategiche

    Meccanica quantistica ... Wikipedia

    - (EPR) caratteristica della riflettività del bersaglio irradiato da onde elettromagnetiche. Il valore EPR è definito come il rapporto tra il flusso (potenza) di energia elettromagnetica riflessa dal bersaglio nella direzione del mezzo radioelettronico (RES), e ... ... Dizionario Marino

    banda vagante- Caratteristiche statistiche dei dati sperimentali, che riflettono la loro deviazione dai valori medi. Argomenti metallurgia in generale EN band desperal … Manuale tecnico del traduttore

    - (funzione di trasferimento della modulazione), funzione, con l'ausilio di un taglio, della “nitidezza” dell'immagine ottica di imaging. sistemi e elementi di tali sistemi. Ch. a. x. è la trasformata di Fourier del cosiddetto. funzione di diffusione della linea che descrive la natura della "diffusione" ... ... Enciclopedia fisica

    Funzione di trasferimento della modulazione, una funzione che valuta le proprietà di "nitidezza" dei sistemi ottici di imaging e dei singoli elementi di tali sistemi (vedi, ad esempio, Nitidezza di un'immagine fotografica). Ch. a. x. c'è un Fourier ... ...

    banda vagante- caratteristica statistica dei dati sperimentali, che riflette la loro deviazione dal valore medio. Vedi anche: Listello Listello di scorrimento Reset strip Listello di temprabilità … Dizionario enciclopedico di metallurgia

    FASCIA A DISPERSIONE- caratteristica statistica dei dati sperimentali, che riflette la loro deviazione dai valori medi ... Dizionario metallurgico

    Caratteristica della dispersione dei valori di una variabile casuale. M. t. h è correlato alla deviazione quadrata (vedi. Deviazione quadrata) σ dalla formula Questo metodo di misurazione della dispersione è spiegato dal fatto che nel caso della normale ... ... Grande enciclopedia sovietica

    STATISTICHE DI VARIAZIONE- STATISTICA VARIAZIONALE, termine che unisce un gruppo di tecniche di analisi statistica utilizzate principalmente nelle scienze naturali. Nella seconda metà del XIX sec. Quetelet (Quetelet, “Anthro pometrie ou mesure des differentes facultes de 1… … Grande enciclopedia medica

    Valore atteso- (Media della popolazione) L'aspettativa matematica è la distribuzione di probabilità di una variabile casuale Aspettativa matematica, definizione, aspettativa matematica di variabili casuali discrete e continue, aspettativa selettiva e condizionale, calcolo, ... ... Enciclopedia dell'investitore

Per caratteristiche statistiche di base serie di misurazioni (serie di variazione) sono caratteristiche di posizione (caratteristiche medie, o andamento centrale del campione); caratteristiche di dispersione (variazioni o fluttuazioni) e X caratteristiche di forma distribuzione.

Per caratteristiche di posizione relazionare significato aritmetico (significare), moda e mediano.

Per caratteristiche di dispersione (variazioni o fluttuazioni) relazionare: gamma di variazione, dispersione, radice media quadrata (standard) deviazione, errore medio aritmetico (errore medio), il coefficiente di variazione e così via.

Alle caratteristiche della forma relazionare coefficiente di asimmetria, misura dell'asimmetria e della curtosi.

Caratteristiche di posizione

Significato aritmeticoè una delle caratteristiche principali del campione.

Come altre caratteristiche numeriche del campione, può essere calcolata sia da dati primari grezzi che dai risultati del raggruppamento di questi dati.

L'accuratezza del calcolo sui dati grezzi è maggiore, ma il processo di calcolo risulta dispendioso in termini di tempo con un campione di grandi dimensioni.

Per i dati non raggruppati, la media aritmetica è determinata dalla formula:

dove n- misura di prova, X 1 , X 2 , ... X n - risultati della misurazione.

Per i dati raggruppati:

dove n- misura di prova, Kè il numero di intervalli di raggruppamento, n io– frequenza degli intervalli, x io sono i valori mediani degli intervalli.

Moda

Definizione 1. Moda è il valore più frequente nei dati di esempio. Denotato Mo ed è determinato dalla formula:

dove è il limite inferiore dell'intervallo modale, è la larghezza dell'intervallo di raggruppamento, è la frequenza dell'intervallo modale, è la frequenza dell'intervallo che precede il modale, è la frequenza dell'intervallo che segue il modale.

Definizione 2. Moda Mo variabile casuale discreta viene chiamato il suo valore più probabile.

Geometricamente, la moda può essere interpretata come l'ascissa del punto massimo della curva di distribuzione. Ci sono bimodale e multimodale distribuzione. Ci sono distribuzioni che hanno un minimo ma non un massimo. Tali distribuzioni sono chiamate antimodale .

Definizione. Modale intervallo chiamato intervallo di raggruppamento con la frequenza più alta.

Mediano

Definizione. Mediano - il risultato della misurazione, che è a metà della serie classificata, in altre parole la mediana è il valore della caratteristica X, quando una metà dei valori dei dati sperimentali è inferiore e la seconda metà è maggiore, è indicata Me.

Quando la dimensione del campione n- un numero pari, cioè c'è un numero pari di risultati di misura, quindi per determinare la mediana si calcola il valore medio dei due indicatori campionari posti a metà della serie classificata.

Per i dati raggruppati in intervalli, la mediana è determinata dalla formula:

,

dove è il limite inferiore dell'intervallo mediano; larghezza dell'intervallo di raggruppamento, 0,5 n- metà della dimensione del campione, - frequenza dell'intervallo mediano, - frequenza cumulativa dell'intervallo che precede la mediana.

Definizione. intervallo mediano chiamato l'intervallo in cui la frequenza accumulata per la prima volta sarà più della metà della dimensione del campione ( n/ 2) o la frequenza accumulata sarà maggiore di 0,5.

I valori numerici di media, moda e mediana differiscono quando esiste una forma non simmetrica della distribuzione empirica.

Caratteristiche della dispersione della misura

Per l'analisi matematico-statistica dei risultati del campione non basta conoscere solo le caratteristiche della posizione. Lo stesso valore medio può caratterizzare campioni completamente diversi.

Pertanto, oltre a loro, considerano anche le statistiche caratteristiche di dispersione (variazioni, o volatilità ) risultati.

Variazione dell'intervallo

Definizione. in grande stile la variazione è la differenza tra i risultati del campione più grande e quello più piccolo, indicato R e determinato

R=X max- X min.

Il contenuto informativo di questo indicatore non è elevato, anche se con campioni di piccole dimensioni è facile stimare la differenza tra i risultati migliori e peggiori degli atleti.

Dispersione

Definizione. dispersione è chiamato il quadrato medio della deviazione dei valori degli attributi dalla media aritmetica.

Per i dati non raggruppati, la varianza è determinata dalla formula

s2 = , (1)

dove Х i- il valore della caratteristica, - la media aritmetica.

Per i dati raggruppati in intervalli, la varianza è determinata dalla formula

,

dove x io- significare io intervallo di raggruppamento, n io– frequenze di intervallo.

Per semplificare i calcoli ed evitare errori di calcolo durante l'arrotondamento dei risultati (soprattutto quando si aumenta la dimensione del campione), vengono utilizzate anche altre formule per determinare la varianza. Se la media aritmetica è già stata calcolata, per i dati non raggruppati viene utilizzata la seguente formula:

per i dati raggruppati:

.

Queste formule si ottengono dalle precedenti espandendo il quadrato della differenza sotto il segno della somma.

Le principali caratteristiche di dispersione utilizzate per valutare la variazione dei valori rispetto alla media campionaria sono la varianza, la deviazione standard e il coefficiente di variazione.

1. Dispersione(dal lat. dispersione - dispersione ) è la media aritmetica delle deviazioni al quadrato di x i valori dalla loro media aritmetica.

Dispersione (D)- la misura della dispersione (deviazione dalla media), si determina come segue - si sottrae la media aritmetica ad ogni opzione, si eleva al quadrato la differenza e si moltiplica per la frequenza ad essa corrispondente. Quindi, determina la somma di tutti i prodotti e dividila per il volume della popolazione:

Per i dati raggruppati, la varianza è determinata da:

La dimensione della varianza non coincide con le unità di misura della caratteristica variabile.

Quando si risolvono problemi pratici, oltre a utilizzare formule per calcolare la varianza campionaria, viene utilizzato un valore chiamato varianza corretta. Il fatto è che il valore della varianza campionaria dà valori sottostimati rispetto alla varianza effettiva, quindi, con piccoli campioni (n< 30) необходимо применять исправленную дисперсию и среднеквадратическое отклонение :

o

2. Campione e deviazione standard corretta (σ, s)è la radice quadrata della varianza. La dimensione della deviazione standard, in contrasto con la dimensione della varianza, coincide con le unità dei dati sperimentali, quindi viene utilizzata principalmente per caratterizzare la dispersione del tratto in studio.

Presentiamo il calcolo della dispersione (Tabella 5) ad esempio 1.

Tabella 5

Calcolo intermedio della varianza

No. p / p Valori mediani, x i Frequenze di classe, n i
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
somma

La varianza per i dati di esempio raggruppati è:

La deviazione standard, rispettivamente, è uguale a:

La deviazione standard corretta è:

Si noti che le formule per calcolare il campione e le varianze corrette differiscono solo nei denominatori. Per n sufficientemente grande, il campione e le varianze corrette differiscono poco, quindi in pratica si usa la varianza corretta se n< 30 .

3. Coefficiente di variazione (v)- è una misura relativa della dispersione di una caratteristica, è usata come indicatore dell'omogeneità delle osservazioni campionarie (Tabella 6).

Il coefficiente di variazione è il rapporto tra la deviazione standard e la media aritmetica, espresso in percentuale. Inoltre, il coefficiente di variazione viene spesso utilizzato per confrontare (confrontare) il grado di variazione di varie caratteristiche espresse in diverse unità di misura.

Per determinare la natura dello scattering, il coefficiente di variazione adimensionale v è calcolato dalla formula:

,

dove σ è la deviazione standard;

Media aritmetica dei dati campionari.

Condividere