Come trovare la media aritmetica dei numeri. Calcolo del valore medio di una serie di numeri

Per trovare il valore medio in Excel (che sia un valore numerico, testuale, percentuale o altro), ci sono molte funzioni. E ognuno di loro ha le sue caratteristiche e vantaggi. Dopotutto, in questa attività possono essere impostate determinate condizioni.

Ad esempio, i valori medi di una serie di numeri in Excel vengono calcolati utilizzando funzioni statistiche. Puoi anche inserire manualmente la tua formula. Consideriamo varie opzioni.

Come trovare la media aritmetica dei numeri?

Per trovare la media aritmetica, aggiungi tutti i numeri nell'insieme e dividi la somma per il numero. Ad esempio, i voti di uno studente in informatica: 3, 4, 3, 5, 5. Cosa vale per un trimestre: 4. Abbiamo trovato la media aritmetica usando la formula: \u003d (3 + 4 + 3 + 5 + 5) / 5.

Come farlo velocemente con Funzioni di Excel? Prendi, ad esempio, la serie numeri casuali in linea:

Oppure: attiva la cella e inserisci semplicemente manualmente la formula: =MEDIA(A1:A8).

Ora vediamo cos'altro può fare la funzione MEDIA.


Trova la media aritmetica dei primi due e degli ultimi tre numeri. Formula: =MEDIA(A1:B1;F1:H1). Risultato:



Media per condizione

La condizione per trovare la media aritmetica può essere un criterio numerico o testuale. Useremo la funzione: =MEDIA.SE().

Trova la media numeri aritmetici che sono maggiori o uguali a 10.

Funzione: =SEMEDIASE(LA1:LA8,">=10")


Il risultato dell'utilizzo della funzione AVERAGEIF alla condizione ">=10":

Il terzo argomento - "Intervallo medio" - viene omesso. In primo luogo, non è richiesto. In secondo luogo, l'intervallo analizzato dal programma contiene SOLO valori numerici. Nelle celle specificate nel primo argomento, la ricerca verrà eseguita in base alla condizione specificata nel secondo argomento.

Attenzione! Il criterio di ricerca può essere specificato in una cella. E nella formula per farvi riferimento.

Troviamo il valore medio dei numeri con il criterio del testo. Ad esempio, le vendite medie del prodotto "tavoli".

La funzione sarà simile a questa: =AVERAGEIF($A$2:$A$12;A7;$B$2:$B$12). Intervallo: una colonna con i nomi dei prodotti. Il criterio di ricerca è un collegamento ad una cella con la parola "tabelle" (puoi inserire la parola "tabelle" al posto del collegamento A7). Intervallo medio - quelle celle da cui verranno presi i dati per calcolare il valore medio.

Come risultato del calcolo della funzione, otteniamo il seguente valore:

Attenzione! Per un criterio di testo (condizione), è necessario specificare l'intervallo di media.

Come calcolare il prezzo medio ponderato in Excel?

Come facciamo a sapere il prezzo medio ponderato?

Formula: =SOMMAPRODOTTO(C2:C12,B2:B12)/SOMMA(C2:C12).


Utilizzando la formula SUMPRODUCT, scopriamo il ricavo totale dopo la vendita dell'intera quantità di merce. E la funzione SOMMA - riassume la quantità di merci. Dividendo il ricavo totale della vendita di beni per il numero totale di unità di beni, abbiamo trovato il prezzo medio ponderato. Questo indicatore tiene conto del "peso" di ciascun prezzo. La sua quota nella massa totale dei valori.

Deviazione standard: formula in Excel

Distinguere tra la deviazione standard per la popolazione generale e per il campione. Nel primo caso, questa è la radice della varianza generale. Nella seconda, dalla varianza campionaria.

Per calcolare questo indicatore statistico formula per la dispersione La radice è presa da esso. Ma in Excel c'è una funzione già pronta per trovare la deviazione standard.


La deviazione standard è collegata alla scala dei dati di origine. Ciò non basta per una rappresentazione figurativa della variazione del range analizzato. Per ottenere il livello relativo di dispersione nei dati, viene calcolato il coefficiente di variazione:

deviazione standard / media aritmetica

La formula in Excel si presenta così:

STDEV (intervallo di valori) / MEDIA (intervallo di valori).

Il coefficiente di variazione è calcolato in percentuale. Pertanto, impostiamo il formato percentuale nella cella.

Supponiamo che tu debba trovare il numero medio di giorni in cui le attività devono essere completate da diversi dipendenti. Inoltre, vuoi calcolare la temperatura media per un determinato giorno su un periodo di 10 anni. Il calcolo del valore medio per un gruppo di numeri può essere eseguito in diversi modi.

La funzione MEDIA calcola la media, che è il centro di un insieme di numeri in una distribuzione statistica. Esistono tre modi più comuni per determinare la media:

    Significare Questa è la media aritmetica, che viene calcolata sommando un gruppo di numeri e dividendoli per il numero di questi numeri. Ad esempio, la media per i numeri 2, 3, 3, 5, 7 e 10 è 5, che è il risultato della divisione della loro somma, che è 30, per il loro numero, che è 6.

    Mediano Il numero medio di un gruppo di numeri. La metà dei numeri contiene valori maggiori della mediana e la metà dei numeri contiene valori inferiori alla mediana. Ad esempio, la mediana dei numeri 2, 3, 3, 5, 7 e 10 è 4.

    Moda Il numero più frequente in un gruppo di numeri. Ad esempio, la modalità per i numeri 2, 3, 3, 5, 7 e 10 sarebbe 3.

Con una distribuzione simmetrica di un insieme di numeri, tutti e tre i valori della tendenza centrale coincideranno. Nella distribuzione deviata di un gruppo di numeri, possono essere diversi.

Calcola il valore medio nelle righe o colonne adiacenti

Segui i passaggi seguenti.

Calcolo del valore medio oltre una riga o colonna continua

Per eseguire questa attività, utilizzare la funzione MEDIA. Copia la tabella qui sotto su un foglio bianco.

Calcolo della media ponderata

Per eseguire questa operazione, utilizzare le funzioni SOMMA PRODOTTO e somma. L'esempio WWIS calcola i prezzi medi pagati per unità per tre acquisti, ognuno dei quali è per un articolo diverso su un'unità diversa.

Copia la tabella qui sotto su un foglio bianco.

Ricorda!

Per trova la media aritmetica, devi sommare tutti i numeri e dividere la loro somma per il loro numero.


Trova la media aritmetica di 2, 3 e 4.

Indichiamo la media aritmetica con la lettera "m". Per la definizione di cui sopra, troviamo la somma di tutti i numeri.


Dividi l'importo risultante per il numero di numeri presi. Abbiamo tre numeri.

Di conseguenza, otteniamo formula della media aritmetica:


A cosa serve l'aritmetica?

Oltre al fatto che viene costantemente offerto di essere trovato in classe, trovare la media aritmetica è molto utile nella vita.

Ad esempio, decidi di vendere palloni da calcio. Ma dal momento che sei nuovo in questo business, è completamente incomprensibile a quale prezzo vendi le palle.

Quindi decidi di scoprire a quale prezzo i tuoi concorrenti stanno già vendendo palloni da calcio nella tua zona. Scopri i prezzi nei negozi e crea una tabella.

I prezzi delle palline nei negozi si sono rivelati piuttosto diversi. Quale prezzo dovremmo scegliere per vendere il pallone da calcio?

Se scegliamo quello più basso (290 rubli), venderemo la merce in perdita. Se scegli quello più alto (360 rubli), gli acquirenti non acquisteranno palloni da calcio da noi.

Abbiamo bisogno di un prezzo medio. Qui viene in soccorso media.

Calcola la media aritmetica dei prezzi dei palloni da calcio:

prezzo medio =

290 + 360 + 310
3
=
960
3
= 320 strofinare.

Pertanto, abbiamo ottenuto il prezzo medio (320 rubli), al quale possiamo vendere un pallone da calcio non troppo economico e non troppo costoso.

Velocità media di movimento

Strettamente correlato alla media aritmetica è il concetto velocità media.

Osservando il movimento del traffico in città, puoi vedere che le auto accelerano e viaggiano ad alta velocità, quindi rallentano e viaggiano a bassa velocità.

Ci sono molte di queste sezioni lungo il percorso dei veicoli. Pertanto, per comodità di calcolo, viene utilizzato il concetto di velocità media.

Ricorda!

La velocità media di movimento è la distanza totale percorsa divisa per il tempo totale di movimento.

Considera il problema per la velocità media.

Compito numero 1503 dal libro di testo "Vilenkin Grade 5"

L'auto ha viaggiato 3,2 ore su autostrada a una velocità di 90 km/h, poi 1,5 ore su sterrato a una velocità di 45 km/h e infine 0,3 ore su una strada di campagna a una velocità di 30 km/h. Trova la velocità media dell'auto per l'intero viaggio.

Per calcolare la velocità media di movimento, è necessario conoscere l'intera distanza percorsa dall'auto e tutto il tempo in cui l'auto è stata in movimento.

S 1 \u003d V 1 t 1

S 1 \u003d 90 3,2 \u003d 288 (km)

- autostrada.

S 2 \u003d V 2 t 2

S 2 \u003d 45 1,5 \u003d 67,5 (km) - strada sterrata.

S 3 \u003d V 3 t 3

S 3 \u003d 30 0,3 \u003d 9 (km) - strada di campagna.

S = S 1 + S 2 + S 3

S \u003d 288 + 67,5 + 9 \u003d 364,5 (km) - l'intero percorso percorso dall'auto.

T \u003d t 1 + t 2 + t 3

T \u003d 3,2 + 1,5 + 0,3 \u003d 5 (h) - sempre.

V cf \u003d S: t

V cf \u003d 364,5: 5 \u003d 72,9 (km / h) - velocità media movimento del veicolo.

Risposta: V av = 72,9 (km / h) - la velocità media dell'auto.

In matematica, la media aritmetica dei numeri (o semplicemente la media) è la somma di tutti i numeri in un dato insieme divisa per il loro numero. Questo è il concetto più generalizzato e diffuso di valore medio. Come hai già capito, per trovare il valore medio, devi sommare tutti i numeri che ti sono stati dati e dividere il risultato per il numero di termini.

Qual è la media aritmetica?

Diamo un'occhiata a un esempio.

Esempio 1. I numeri sono: 6, 7, 11. Devi trovare il loro valore medio.

Soluzione.

Per prima cosa, troviamo la somma di tutti i numeri dati.

Ora dividiamo la somma risultante per il numero di termini. Poiché abbiamo rispettivamente tre termini, li divideremo per tre.

Pertanto, la media dei numeri 6, 7 e 11 è 8. Perché 8? Sì, perché la somma di 6, 7 e 11 sarà uguale a tre otto. Questo è chiaramente visibile nell'illustrazione.

Il valore medio ricorda in qualche modo l'"allineamento" di una serie di numeri. Come puoi vedere, le pile di matite sono diventate di un livello.

Considera un altro esempio per consolidare le conoscenze acquisite.

Esempio 2 I numeri sono dati: 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29. Devi trovare la loro media aritmetica.

Soluzione.

Troviamo la somma.

3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330

Dividi per il numero di termini (in questo caso, 15).

Pertanto, il valore medio di questa serie di numeri è 22.

Consideriamo ora i numeri negativi. Ricordiamo come riassumerli. Ad esempio, hai due numeri 1 e -4. Troviamo la loro somma.

1 + (-4) = 1 – 4 = -3

Sapendo questo, considera un altro esempio.

Esempio 3 Trova il valore medio di una serie di numeri: 3, -7, 5, 13, -2.

Soluzione.

Trovare la somma dei numeri.

3 + (-7) + 5 + 13 + (-2) = 12

Poiché i termini sono 5, dividiamo la somma risultante per 5.

Pertanto, la media aritmetica dei numeri 3, -7, 5, 13, -2 è 2,4.

Nel nostro tempo di progresso tecnologico, è molto più conveniente utilizzare per trovare il valore medio programmi per computer. Microsoft Office Excel è uno di questi. Trovare la media in Excel è facile e veloce. Inoltre, questo programma è incluso nel pacchetto software di Microsoft Office. Ritenere brevi istruzioni come trovare la media aritmetica usando questo programma.

Per calcolare il valore medio di una serie di numeri, è necessario utilizzare la funzione MEDIA. La sintassi per questa funzione è:
=Media(argomento1, argomento2, ...argomento255)
dove argomento1, argomento2, ... argomento255 sono numeri o riferimenti di cella (le celle indicano intervalli e matrici).

Per renderlo più chiaro, testiamo le conoscenze acquisite.

  1. Immettere i numeri 11, 12, 13, 14, 15, 16 nelle celle C1 - C6.
  2. Seleziona la cella C7 facendo clic su di essa. In questa cella visualizzeremo il valore medio.
  3. Fare clic sulla scheda "Formule".
  4. Selezionare Altre funzioni > Statistiche per aprire l'elenco a discesa.
  5. Seleziona MEDIA. Successivamente, dovrebbe aprirsi una finestra di dialogo.
  6. Seleziona e trascina le celle C1-C6 lì per impostare l'intervallo nella finestra di dialogo.
  7. Conferma le tue azioni con il pulsante "OK".
  8. Se hai fatto tutto correttamente, nella cella C7 dovresti avere la risposta: 13.7. Quando si fa clic sulla cella C7, la funzione (=Media(C1:C6)) verrà visualizzata nella barra della formula.

È molto utile utilizzare questa funzione per la contabilità, le fatture o quando si ha solo bisogno di trovare la media di un intervallo di numeri molto lungo. Pertanto, viene spesso utilizzato negli uffici e nelle grandi aziende. Ciò consente di tenere in ordine le registrazioni e consente di calcolare rapidamente qualcosa (ad esempio, il reddito medio mensile). Puoi anche usare Excel per trovare la media di una funzione.

Media

Questo termine ha altri significati, vedi il significato medio.

Media(in matematica e statistica) insiemi di numeri - la somma di tutti i numeri divisa per il loro numero. È una delle misure più comuni di tendenza centrale.

Fu proposto (insieme alla media geometrica e alla media armonica) dai Pitagorici.

Casi particolari della media aritmetica sono la media (della popolazione generale) e la media campionaria (dei campioni).

introduzione

Indica l'insieme di dati X = (X 1 , X 2 , …, X n), la media campionaria è solitamente indicata da una barra orizzontale sopra la variabile (x ¯ (\displaystyle (\bar (x))) , pronunciata " X con un trattino").

La lettera greca μ è usata per indicare la media aritmetica dell'intera popolazione. Per variabile casuale, per il quale è definito il valore medio, μ è probabilità media o l'aspettativa matematica di una variabile casuale. Se il set Xè una raccolta di numeri casuali con una probabilità media μ, quindi per qualsiasi campione X io da questa raccolta μ = E( X io) è l'aspettativa di questo campione.

In pratica, la differenza tra μ e x ¯ (\displaystyle (\bar (x))) è che μ è una variabile tipica perché puoi vedere il campione anziché l'intera popolazione. Pertanto, se il campione è rappresentato in modo casuale (in termini di teoria della probabilità), allora x ¯ (\ displaystyle (\bar (x))) (ma non μ) può essere trattato come una variabile casuale avente una distribuzione di probabilità sul campione ( distribuzione di probabilità della media).

Entrambe queste quantità sono calcolate allo stesso modo:

X ¯ = 1 n ∑ io = 1 n x io = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Se una Xè una variabile casuale, quindi l'aspettativa matematica X può essere considerata come la media aritmetica dei valori nelle misurazioni ripetute della quantità X. Questa è una manifestazione della legge grandi numeri. Pertanto, la media campionaria viene utilizzata per stimare l'incognita aspettativa matematica.

In algebra elementare si dimostra che la media n+ 1 numeri sopra la media n numeri se e solo se il nuovo numero è maggiore della vecchia media, minore se e solo se il nuovo numero è minore della media, e non cambia se e solo se il nuovo numero è uguale alla media. Più n, minore è la differenza tra la nuova e la vecchia media.

Si noti che ci sono molti altri "mezzi" disponibili, tra cui la media della legge di potenza, la media di Kolmogorov, la media armonica, la media aritmetico-geometrica e varie medie pesate (ad esempio, media ponderata aritmetica, media ponderata geometrica, media ponderata armonica) .

Esempi

  • Per tre numeri, devi sommarli e dividere per 3:
x 1 + x 2 + x 3 3 . (\ displaystyle (\ frac (x_(1)+x_(2)+x_(3))(3)).)
  • Per quattro numeri, devi sommarli e dividere per 4:
x 1 + x 2 + x 3 + x 4 4 . (\ displaystyle (\ frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

O più facile 5+5=10, 10:2. Perché abbiamo aggiunto 2 numeri, il che significa che quanti numeri aggiungiamo, lo dividiamo per quello.

Variabile casuale continua

Per un valore distribuito in modo continuo f (x) (\ displaystyle f (x)) la media aritmetica sull'intervallo [ a ; b ] (\ displaystyle ) è definito tramite un integrale definito:

F (x) ¯ [ a ; b ] = 1 b - un ∫ un b f (x) d x (\ displaystyle (\ overline (f (x))) _() = (\ frac (1) (b-a)) \ int _ (a) ^ (b) f(x)dx)

Alcuni problemi di utilizzo della media

Mancanza di robustezza

Articolo principale: Robustezza nelle statistiche

Sebbene la media aritmetica sia spesso utilizzata come media o trend centrale, questo concetto non si applica alle statistiche robuste, il che significa che la media aritmetica è fortemente influenzata da "grandi deviazioni". È interessante notare che per le distribuzioni con una grande asimmetria, la media aritmetica potrebbe non corrispondere al concetto di "media" e i valori della media di statistiche robuste (ad esempio la mediana) potrebbero descrivere meglio la tendenza centrale.

L'esempio classico è il calcolo del reddito medio. La media aritmetica può essere interpretata erroneamente come mediana, il che può portare alla conclusione che ci sono più persone con più entrate di quante ce ne siano in realtà. Il reddito "medio" è interpretato in modo tale che i redditi della maggior parte delle persone siano vicini a questo numero. Questo reddito "medio" (nel senso della media aritmetica) è superiore al reddito della maggior parte delle persone, poiché un reddito elevato con una grande deviazione dalla media rende la media aritmetica fortemente distorta (al contrario, il reddito mediano "resiste" una tale inclinazione). Tuttavia, questo reddito "medio" non dice nulla sul numero di persone vicino al reddito mediano (e non dice nulla sul numero di persone vicino al reddito modale). Tuttavia, se i concetti di "media" e "maggioranza" vengono presi alla leggera, si può erroneamente concludere che la maggior parte delle persone ha redditi più alti di quanto non siano in realtà. Ad esempio, un rapporto sul reddito netto "medio" a Medina, Washington, calcolato come media aritmetica di tutti i redditi netti annuali dei residenti, darà un sorprendente gran numero a causa di Bill Gates. Considera il campione (1, 2, 2, 2, 3, 9). La media aritmetica è 3,17, ma cinque dei sei valori sono al di sotto di questa media.

Interesse composto

Articolo principale: ROI

Se numeri moltiplicare, ma no piega, devi usare la media geometrica, non la media aritmetica. Molto spesso, questo incidente si verifica quando si calcola il ritorno sull'investimento in finanza.

Ad esempio, se le azioni sono scese del 10% nel primo anno e sono aumentate del 30% nel secondo anno, non è corretto calcolare l'aumento "medio" in questi due anni come media aritmetica (-10% + 30%) / 2 = 10%; la media corretta in questo caso è data dal tasso di crescita annuo composto, dal quale la crescita annua è solo di circa 8,16653826392% ≈ 8,2%.

Il motivo è che le percentuali hanno ogni volta un nuovo punto di partenza: 30% è 30% da un numero inferiore al prezzo all'inizio del primo anno: se il titolo è iniziato a $ 30 ed è sceso del 10%, all'inizio del secondo anno vale $ 27. Se il titolo è in rialzo del 30%, alla fine del secondo anno varrà $ 35,1. La media aritmetica di questa crescita è del 10%, ma poiché il titolo è cresciuto di soli $ 5,1 in 2 anni, un aumento medio dell'8,2% dà risultato finale $35.1:

[$ 30 (1 - 0,1) (1 + 0,3) = $ 30 (1 + 0,082) (1 + 0,082) = $ 35,1]. Se utilizziamo la media aritmetica del 10% allo stesso modo, non otterremo il valore effettivo: [$ 30 (1 + 0,1) (1 + 0,1) = $ 36,3].

Interesse composto alla fine dell'anno 2: 90% * 130% = 117%, ovvero un aumento totale del 17% e l'interesse composto medio annuo è 117% ≈ 108,2% (\displaystyle (\sqrt (117\%)) \circa 108,2\%) , ovvero un aumento medio annuo dell'8,2%.

Indicazioni

Articolo principale: Statistiche di destinazione

Quando si calcola la media aritmetica di una variabile che cambia ciclicamente (ad esempio, fase o angolo), occorre prestare particolare attenzione. Ad esempio, la media di 1° e 359° sarebbe 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Questo numero non è corretto per due motivi.

  • Innanzitutto, le misure angolari sono definite solo per l'intervallo da 0° a 360° (o da 0 a 2π se misurato in radianti). Pertanto, la stessa coppia di numeri potrebbe essere scritta come (1° e −1°) o come (1° e 719°). Le medie di ciascuna coppia saranno diverse: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2))= 0 ^ (\ circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\ displaystyle (\ frac (1 ^ (\ circ )+719 ^ (\ circ )) (2)) = 360 ^ (\ circ )) .
  • In secondo luogo, in questo caso, un valore di 0° (equivalente a 360°) sarebbe la media geometricamente migliore, poiché i numeri deviano meno da 0° che da qualsiasi altro valore (il valore 0° ha la varianza minima). Confrontare:
    • il numero 1° devia da 0° solo di 1°;
    • il numero 1° devia dalla media calcolata di 180° per 179°.

Il valore medio per una variabile ciclica, calcolato secondo la formula precedente, verrà spostato artificialmente rispetto alla media reale al centro dell'intervallo numerico. Per questo motivo, la media viene calcolata in modo diverso, ovvero come valore medio viene scelto il numero con la minima varianza (punto centrale). Inoltre, invece di sottrarre, viene utilizzata la distanza modulo (cioè la distanza circonferenziale). Ad esempio, la distanza modulare tra 1° e 359° è 2°, non 358° (su un cerchio tra 359° e 360°==0° - un grado, tra 0° e 1° - anche 1°, in totale - 2°).

Media ponderata: cos'è e come calcolarla?

Nel processo di studio della matematica, gli studenti familiarizzano con il concetto di media aritmetica. In futuro, nella statistica e in alcune altre scienze, gli studenti dovranno anche affrontare il calcolo di altre medie. Cosa possono essere e in che cosa differiscono l'uno dall'altro?

Medie: significato e differenze

Non sempre indicatori accurati danno una comprensione della situazione. Per valutare questa o quella situazione, a volte è necessario analizzare un numero enorme di cifre. E poi le medie vengono in soccorso. Ti permettono di valutare la situazione in generale.


Fin dai tempi della scuola, molti adulti ricordano l'esistenza della media aritmetica. È molto facile da calcolare: la somma di una sequenza di n termini è divisibile per n. Cioè, se devi calcolare la media aritmetica nella sequenza di valori 27, 22, 34 e 37, devi risolvere l'espressione (27 + 22 + 34 + 37) / 4, poiché 4 valori vengono utilizzati nei calcoli. In questo caso, il valore desiderato sarà pari a 30.

Spesso, nell'ambito del percorso scolastico, si studia anche la media geometrica. Calcolo dato valore basato sull'estrazione della radice ennesimo grado dal prodotto di n termini. Se prendiamo gli stessi numeri: 27, 22, 34 e 37, il risultato dei calcoli sarà 29,4.

significa armonica in scuola di educazione generale di solito non è oggetto di studio. Tuttavia, è usato abbastanza spesso. Questo valore è il reciproco della media aritmetica ed è calcolato come quoziente di n - il numero di valori e la somma 1/a 1 +1/a 2 +...+1/a n . Se prendiamo ancora la stessa serie di numeri per il calcolo, l'armonica sarà 29,6.

Media Ponderata: Caratteristiche

Tuttavia, tutti i valori di cui sopra potrebbero non essere utilizzati ovunque. Ad esempio, nelle statistiche, quando si calcolano alcuni valori medi ruolo importante ha un "peso" di ogni numero utilizzato nei calcoli. I risultati sono più rivelatori e corretti perché tengono conto di più informazioni. Questo gruppo di valori è indicato collettivamente come "media ponderata". Non vengono superati a scuola, quindi vale la pena soffermarsi su di loro in modo più dettagliato.

Prima di tutto, vale la pena spiegare cosa si intende per "peso" di un determinato valore. Il modo più semplice per spiegarlo è con un esempio specifico. La temperatura corporea di ciascun paziente viene misurata due volte al giorno in ospedale. Dei 100 pazienti nei diversi reparti dell'ospedale, 44 avranno una temperatura normale - 36,6 gradi. Altri 30 avranno un valore aumentato - 37,2, 14 - 38, 7 - 38,5, 3 - 39 e i restanti due - 40. E se prendiamo la media aritmetica, allora questo valore in generale per l'ospedale sarà superiore a 38 gradi ! Ma quasi la metà dei pazienti ha una temperatura completamente normale. E qui sarebbe più corretto utilizzare la media ponderata e il "peso" di ogni valore sarà il numero di persone. In questo caso, il risultato del calcolo sarà 37,25 gradi. La differenza è evidente.

Nel caso di calcoli di media pesata, il "peso" può essere preso come il numero di spedizioni, il numero di persone che lavorano in un determinato giorno, in generale, tutto ciò che può essere misurato e influenzare il risultato finale.

Varietà

La media ponderata corrisponde alla media aritmetica discussa all'inizio dell'articolo. Tuttavia, il primo valore, come già accennato, tiene conto anche del peso di ogni numero utilizzato nei calcoli. Inoltre, ci sono anche valori geometrici e armonici ponderati.

C'è un'altra varietà interessante usata in serie di numeri. Questa è una media mobile ponderata. È su questa base che si calcolano le tendenze. Oltre ai valori stessi e al loro peso, viene utilizzata anche la periodicità. E quando si calcola il valore medio in un determinato momento, vengono presi in considerazione anche i valori ​​per periodi di tempo precedenti.

Calcolare tutti questi valori non è poi così difficile, ma in pratica si usa solo la solita media ponderata.

Metodi di calcolo

Nell'era dell'informatizzazione non è necessario calcolare manualmente la media ponderata. Sarebbe comunque utile conoscere la formula di calcolo in modo da poter verificare e, se necessario, correggere i risultati ottenuti.

Sarà più facile considerare il calcolo su un esempio specifico.

È necessario scoprire qual è il salario medio in questa impresa, tenendo conto del numero di lavoratori che ricevono uno stipendio particolare.

Pertanto, il calcolo della media ponderata viene effettuato utilizzando la seguente formula:

x = (a 1 *w 1 +a 2 *w 2 +...+a n *w n)/(w 1 +w 2 +...+w n)

Ad esempio, il calcolo sarebbe:

x = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33,48

Ovviamente non vi sono particolari difficoltà nel calcolare manualmente la media ponderata. La formula per calcolare questo valore in una delle più popolari applicazioni con formule - Excel - assomiglia alla funzione SOMMA PRODOTTO (serie di numeri; serie di pesi) / SOMMA (serie di pesi).

Come trovare il valore medio in Excel?

come trovare la media aritmetica in excel?

Vladimir09854

Vai tranquillo. Per trovare il valore medio in Excel, hai solo bisogno di 3 celle. Nel primo scriviamo un numero, nel secondo un altro. E nella terza cella, assegneremo un punteggio a una formula che ci darà il valore medio tra questi due numeri dalla prima e dalla seconda cella. Se la cella n. 1 si chiama A1, la cella n. 2 si chiama B1, quindi nella cella con la formula devi scrivere in questo modo:

Questa formula calcola la media aritmetica di due numeri.

Per la bellezza dei nostri calcoli, possiamo evidenziare le celle con delle linee, a forma di piatto.

C'è anche una funzione in Excel stesso per determinare il valore medio, ma io uso il metodo vecchio stile e inserisco la formula di cui ho bisogno. Pertanto, sono sicuro che Excel calcolerà esattamente di cui ho bisogno e non produrrà alcun tipo di arrotondamento proprio.

Sergey M3

Questo è molto facile se i dati sono già inseriti nelle celle. Se sei interessato solo a un numero, seleziona l'intervallo/gli intervalli desiderati, e il valore della somma di questi numeri, la loro media aritmetica e il loro numero appariranno nella barra di stato in basso a destra.

Puoi selezionare una cella vuota, fare clic sul triangolo (elenco a discesa) "Autosum" e selezionare "Media" lì, dopodiché sarai d'accordo con l'intervallo proposto per il calcolo o scegli il tuo.

Infine, puoi utilizzare direttamente le formule: fai clic su "Inserisci funzione" accanto alla barra della formula e all'indirizzo della cella. La funzione MEDIA si trova nella categoria "Statistica" e prende come argomenti sia i numeri che i riferimenti di cella, ecc. Lì puoi anche scegliere opzioni più complesse, ad esempio SE MEDIA - calcolo della media per condizione.

Trova la media in Excelè un compito abbastanza semplice. Qui devi capire se vuoi utilizzare questo valore medio in alcune formule o meno.

Se è necessario ottenere solo il valore, è sufficiente selezionare l'intervallo di numeri richiesto, dopodiché Excel calcolerà automaticamente il valore medio: verrà visualizzato nella barra di stato, l'intestazione "Media".

Nel caso in cui desideri utilizzare il risultato nelle formule, puoi farlo:

1) Somma le celle usando la funzione SOMMA e dividi il tutto per il numero di numeri.

2) Un'opzione più corretta è usare una funzione speciale chiamata MEDIA. Gli argomenti di questa funzione possono essere numeri dati in sequenza o un intervallo di numeri.

Vladimir Tikhonov

cerchia i valori che saranno coinvolti nel calcolo, fai clic sulla scheda "Formule", lì vedrai "AutoSum" sulla sinistra e accanto ad esso un triangolo rivolto verso il basso. fai clic su questo triangolo e scegli "Media". Voilà, fatto) in fondo alla colonna vedrai il valore medio :)

Ekaterina Mutalapova

Cominciamo dall'inizio e con ordine. Cosa significa media?

Il valore medio è il valore che è la media aritmetica, cioè viene calcolato sommando un insieme di numeri e quindi dividendo la somma totale dei numeri per il loro numero. Ad esempio, per i numeri 2, 3, 6, 7, 2 sarà 4 (la somma dei numeri 20 è divisa per il loro numero 5)

In un foglio di calcolo Excel, per me personalmente, il modo più semplice era usare la formula =MEDIA. Per calcolare il valore medio, è necessario inserire i dati nella tabella, scrivere la funzione =MEDIA() sotto la colonna dei dati e tra parentesi indicare l'intervallo di numeri nelle celle, evidenziando la colonna con i dati. Successivamente, premi INVIO o fai semplicemente clic con il pulsante sinistro del mouse su qualsiasi cella. Il risultato verrà visualizzato nella cella sotto la colonna. A prima vista, la descrizione è incomprensibile, ma in realtà è questione di minuti.

Avventuriero 2000

Il programma Excel è sfaccettato, quindi ci sono diverse opzioni che ti permetteranno di trovare la media:

Prima opzione. Somma semplicemente tutte le celle e dividi per il loro numero;

Seconda opzione. Usa un apposito comando, scrivi nella cella richiesta la formula "=MEDIA (e qui specifica l'intervallo di celle)";

Terza opzione. Se selezioni l'intervallo richiesto, tieni presente che nella pagina seguente viene visualizzato anche il valore medio in queste celle.

Pertanto, ci sono molti modi per trovare il valore medio, devi solo scegliere quello migliore per te e usarlo costantemente.

In Excel, utilizzando la funzione MEDIA, puoi calcolare la media aritmetica semplice. Per fare ciò, è necessario inserire un numero di valori. Premere uguale e selezionare nella categoria Statistica, tra cui selezionare la funzione MEDIA



Inoltre, utilizzando formule statistiche, puoi calcolare la media aritmetica ponderata, che è considerata più accurata. Per calcolarlo, abbiamo bisogno dei valori dell'indicatore e della frequenza.

Come trovare la media in Excel?

La situazione è questa. C'è la seguente tabella:

Le colonne ombreggiate in rosso contengono i valori numerici dei voti per le materie. Nella colonna "Media", devi calcolare il loro valore medio.
Il problema è questo: ci sono 60-70 oggetti in totale e alcuni sono su un altro foglio.
Ho guardato in un altro documento, la media è già stata calcolata e nella cella c'è una formula simile
="nome foglio"!|E12
ma questo è stato fatto da un programmatore che è stato licenziato.
Dimmi, per favore, chi lo capisce.

Ettore

Nella riga delle funzioni, inserisci "MEDIA" dalle funzioni proposte e scegli da dove devono essere calcolate (B6: N6) per Ivanov, ad esempio. Non sono sicuro dei fogli vicini, ma di sicuro questo è contenuto nella guida standard di Windows

Dimmi come calcolare il valore medio in Word

Per favore dimmi come calcolare il valore medio in Word. Vale a dire, il valore medio delle valutazioni e non il numero di persone che hanno ricevuto valutazioni.


Giulia Pavlova

Word può fare molto con le macro. Premi ALT+F11 e scrivi un programma macro..
Inoltre, Inserisci-Oggetto... ti permetterà di utilizzare altri programmi, anche Excel, per creare un foglio con una tabella all'interno di un documento Word.
Ma in questo caso, devi annotare i tuoi numeri nella colonna della tabella e inserire la media nella cella in basso della stessa colonna, giusto?
Per fare ciò, inserisci un campo nella cella inferiore.
Inserisci-Campo...-Formula
Contenuto del campo
[=MEDIA(SOPRA)]
restituisce la media della somma delle celle sopra.
Se il campo è selezionato e viene premuto il tasto destro del mouse, può essere Aggiornato se i numeri sono cambiati,
visualizzare il codice o il valore del campo, modificare il codice direttamente nel campo.
Se qualcosa va storto, elimina l'intero campo nella cella e ricrealo.
MEDIA significa media, SOPRA - circa, cioè una riga di celle sopra.
Non sapevo tutto questo da solo, ma l'ho trovato facilmente in AIUTO, ovviamente, pensando un po'.

Nella maggior parte dei casi, i dati sono concentrati intorno a un punto centrale. Quindi, per descrivere qualsiasi set di dati, è sufficiente indicare il valore medio. Diamo un'occhiata a tre caratteristiche numeriche, che vengono utilizzati per stimare la media della distribuzione: media aritmetica, mediana e moda.

Media

La media aritmetica (spesso indicata semplicemente come media) è la stima più comune della media di una distribuzione. È il risultato della divisione della somma di tutti i valori numerici osservati per il loro numero. Per un campione di numeri X 1, X 2, ..., Xn, la media campionaria (indicata dal simbolo ) è uguale a \u003d (X 1 + X 2 + ... + Xn) / n, o

dov'è la media campionaria, n- misura di prova, Xioi-esimo elemento campioni.

Scarica nota in o formato, esempi in formato

Considerare di calcolare la media aritmetica dei rendimenti medi annuali quinquennali di 15 fondi comuni di investimento con molto alto livello rischio (Fig. 1).

Riso. 1. Rendimento medio annuo di 15 fondi comuni di investimento ad altissimo rischio

La media campionaria è calcolata come segue:

Questo è un buon rendimento, soprattutto se confrontato con il 3-4% di rendimento ricevuto dai depositanti di banche o cooperative di credito nello stesso periodo di tempo. Se si ordinano i valori di ritorno, è facile vedere che otto fondi hanno un rendimento superiore e sette - inferiore alla media. La media aritmetica funge da punto di equilibrio, in modo che i fondi a basso reddito bilanciano i fondi ad alto reddito. Tutti gli elementi del campione sono coinvolti nel calcolo della media. Nessuno degli altri stimatori della media di distribuzione ha questa proprietà.

Quando calcolare la media aritmetica. Poiché la media aritmetica dipende da tutti gli elementi del campione, la presenza di valori estremi influisce in modo significativo sul risultato. In tali situazioni, la media aritmetica può distorcere il significato dei dati numerici. Pertanto, quando si descrive un insieme di dati contenente valori estremi, è necessario indicare la mediana o la media aritmetica e la mediana. Ad esempio, se il rendimento del fondo RS Emerging Growth viene rimosso dal campione, la media campionaria del rendimento dei 14 fondi diminuisce di quasi l'1% al 5,19%.

Mediano

La mediana è il valore medio di una matrice ordinata di numeri. Se l'array non contiene numeri ripetuti, metà dei suoi elementi sarà inferiore e metà superiore alla mediana. Se il campione contiene valori estremi, è meglio utilizzare la mediana piuttosto che la media aritmetica per stimare la media. Per calcolare la mediana di un campione, è necessario prima ordinarlo.

Questa formula è ambigua. Il suo risultato dipende dal fatto che il numero sia pari o dispari. n:

  • Se il campione contiene un numero dispari di elementi, la mediana è (n+1)/2-esimo elemento.
  • Se il campione contiene un numero pari di elementi, la mediana si trova tra i due elementi centrali del campione ed è uguale alla media aritmetica calcolata su questi due elementi.

Per calcolare la mediana per un campione di 15 fondi comuni di investimento ad altissimo rischio, dobbiamo prima ordinare i dati grezzi (Figura 2). Quindi la mediana sarà opposta al numero dell'elemento centrale del campione; nel nostro esempio numero 8. Excel ha funzione speciale=MEDIAN(), che funziona anche con array non ordinati.

Riso. 2. Mediana 15 fondi

Pertanto, la mediana è 6,5. Ciò significa che la metà dei fondi ad altissimo rischio non supera 6,5, mentre l'altra metà lo fa. Si noti che la mediana di 6,5 è leggermente maggiore della mediana di 6,08.

Se eliminiamo dal campione la redditività del fondo RS Emerging Growth, la mediana dei restanti 14 fondi diminuirà al 6,2%, cioè non in modo così significativo come la media aritmetica (Fig. 3).

Riso. 3. Mediana 14 fondi

Moda

Il termine fu introdotto per la prima volta da Pearson nel 1894. La moda è il numero che ricorre più spesso nel campione (il più alla moda). La moda descrive bene, ad esempio, la tipica reazione degli automobilisti a un semaforo per fermare il traffico. Un classico esempio di utilizzo della moda è la scelta della misura del lotto di scarpe prodotto o del colore della carta da parati. Se una distribuzione ha più modi, allora si dice multimodale o multimodale (ha due o più "picchi"). La multimodalità di distribuzione dà Informazioni importanti sulla natura della variabile in esame. Ad esempio, nelle indagini sociologiche, se una variabile rappresenta una preferenza o un atteggiamento verso qualcosa, la multimodalità potrebbe significare che esistono diverse opinioni nettamente diverse. La multimodalità è anche un indicatore che il campione non è omogeneo e che le osservazioni possono essere generate da due o più distribuzioni "sovrapposte". A differenza della media aritmetica, i valori anomali non influiscono sulla modalità. Per variabili casuali distribuite in modo continuo, come i rendimenti medi annui dei fondi comuni di investimento, la modalità a volte non esiste affatto (o non ha senso). Poiché questi indicatori possono assumere una varietà di valori, i valori ripetuti sono estremamente rari.

quartili

I quartili sono misure più comunemente utilizzate per valutare la distribuzione dei dati quando si descrivono le proprietà di campioni numerici di grandi dimensioni. Mentre la mediana divide a metà l'array ordinato (il 50% degli elementi dell'array è inferiore alla mediana e il 50% è maggiore), i quartili suddividono il set di dati ordinato in quattro parti. I valori Q1, mediana e Q3 sono rispettivamente il 25°, 50° e 75° percentile. Il primo quartile Q 1 è un numero che divide il campione in due parti: il 25% degli elementi è inferiore a e il 75% è superiore al primo quartile.

Il terzo quartile Q 3 è un numero che divide anche il campione in due parti: il 75% degli elementi è inferiore a e il 25% è superiore al terzo quartile.

Per calcolare i quartili nelle versioni di Excel precedenti al 2007, è stata utilizzata la funzione =QUARTILE(array, parte). A partire da Excel 2010, si applicano due funzioni:

  • =QUARTILE.ON(array, parte)
  • =QUARTILE.EXC(array, parte)

Queste due funzioni danno valori leggermente diversi (Figura 4). Ad esempio, quando si calcolano i quartili di un campione contenente i dati sul rendimento medio annuo di 15 fondi comuni di investimento ad altissimo rischio, Q 1 = 1,8 o -0,7 rispettivamente per QUARTILE.INC e QUARTILE.EXC. A proposito, corrisponde alla funzione QUARTILE usata in precedenza funzione moderna QUARTILE SU Per calcolare i quartili in Excel utilizzando le formule precedenti, l'array di dati può essere lasciato non ordinato.

Riso. 4. Calcola quartili in Excel

Sottolineiamo ancora. Excel può calcolare quartili per univariato serie discreta, contenente i valori di una variabile casuale. Il calcolo dei quartili per una distribuzione basata sulla frequenza è riportato nella sezione seguente.

media geometrica

A differenza della media aritmetica, la media geometrica misura quanto una variabile è cambiata nel tempo. La media geometrica è la radice n esimo grado dal prodotto n valori (in Excel si usa la funzione = CUGEOM):

G= (X 1 * X 2 * ... * X n) 1/n

Un parametro simile - la media geometrica del tasso di rendimento - è determinato dalla formula:

G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

dove R io- tasso di rendimento io-esimo periodo di tempo.

Ad esempio, supponiamo che l'investimento iniziale sia di $ 100.000. Entro la fine del primo anno, scende a $ 50.000 ed entro la fine del secondo anno torna ai $ 100.000 originali. anno è uguale a 0, poiché l'importo iniziale e finale dei fondi sono uguali tra loro. Tuttavia, la media aritmetica dei tassi di rendimento annuali è = (-0,5 + 1) / 2 = 0,25 o 25%, poiché il tasso di rendimento nel primo anno R 1 = (50.000 - 100.000) / 100.000 = -0,5 e nel secondo R 2 = (100.000 - 50.000) / 50.000 = 1. Allo stesso tempo, la media geometrica del tasso di rendimento per due anni è: G = [(1–0,5) * (1 + 1 )] 1 /2 – 1 = ½ – 1 = 1 – 1 = 0. Pertanto, la media geometrica riflette più accuratamente la variazione (più precisamente, l'assenza di cambiamento) nel volume degli investimenti nel biennio rispetto alla media aritmetica.

Fatti interessanti. Innanzitutto, la media geometrica sarà sempre minore della media aritmetica degli stessi numeri. Tranne il caso in cui tutti i numeri presi sono uguali tra loro. In secondo luogo, considerando le proprietà triangolo rettangolo, puoi capire perché la media è chiamata geometrica. L'altezza di un triangolo rettangolo, ribassato all'ipotenusa, è la media proporzionale tra le proiezioni delle gambe sull'ipotenusa, e ciascuna gamba è la media proporzionale tra l'ipotenusa e la sua proiezione sull'ipotenusa (Fig. 5). Questo dà un modo geometrico di costruire la media geometrica di due (lunghezze) segmenti: sulla somma di questi due segmenti è necessario costruire un cerchio come diametro, quindi l'altezza, ripristinata dal punto del loro collegamento all'intersezione con il cerchio, darà il valore richiesto:

Riso. 5. La natura geometrica della media geometrica (figura da Wikipedia)

La seconda importante proprietà dei dati numerici è la loro variazione caratterizzare il grado di dispersione dei dati. Due campioni diversi possono differire sia nei valori medi che nelle variazioni. Tuttavia, come mostrato in fig. 6 e 7, due campioni possono avere la stessa variazione ma medie differenti, oppure la stessa media e variazione completamente diversa. I dati corrispondenti al poligono B in Fig. 7 cambiano molto meno dei dati da cui è stato costruito il poligono A.

Riso. 6. Due distribuzioni a campana simmetriche con lo stesso spread e valori medi differenti

Riso. 7. Due distribuzioni a campana simmetriche con gli stessi valori medi e dispersione diversa

Esistono cinque stime di variazione dei dati:

  • intervallo,
  • intervallo interquartile,
  • dispersione,
  • deviazione standard,
  • il coefficiente di variazione.

scopo

L'intervallo è la differenza tra gli elementi più grandi e quelli più piccoli del campione:

Scorri = XMax-Xmin

L'intervallo di un campione contenente i rendimenti medi annui di 15 fondi comuni di investimento ad altissimo rischio può essere calcolato utilizzando un array ordinato (vedi Figura 4): range = 18,5 - (-6,1) = 24,6. Ciò significa che la differenza tra il rendimento medio annuo più alto e quello più basso per i fondi ad altissimo rischio è del 24,6%.

L'intervallo misura la diffusione complessiva dei dati. Sebbene l'intervallo di campionamento sia una stima molto semplice della diffusione totale dei dati, il suo punto debole è che non tiene conto esattamente di come i dati sono distribuiti tra gli elementi minimo e massimo. Questo effetto è ben visibile in Fig. 8 che illustra campioni aventi lo stesso intervallo. La scala B mostra che se il campione contiene almeno un valore estremo, l'intervallo di campionamento è una stima molto imprecisa della dispersione dei dati.

Riso. 8. Confronto di tre campioni con lo stesso range; il triangolo simboleggia il supporto della bilancia e la sua posizione corrisponde al valore medio del campione

Intervallo interquartile

L'intervallo interquartile, o medio, è la differenza tra il terzo e il primo quartile del campione:

Intervallo interquartile \u003d Q 3 - Q 1

Questo valore consente di stimare lo spread del 50% degli elementi e di non tenere conto dell'influenza di elementi estremi. Utilizzando i dati di Fig. 4 (ad esempio, per la funzione QUARTILE.EXC): Intervallo interquartile = 9,8 - (-0,7) = 10,5. L'intervallo tra 9,8 e -0,7 viene spesso definito metà centrale.

Si noti che i valori di Q 1 e Q 3, e quindi l'intervallo interquartile, non dipendono dalla presenza di valori anomali, poiché il loro calcolo non tiene conto di alcun valore che sia inferiore a Q 1 o maggiore di Q 3 . Totale caratteristiche quantitative, come la mediana, il primo e il terzo quartile e l'intervallo interquartile, che non sono interessati da valori anomali, sono detti misure robuste.

Sebbene l'intervallo e l'intervallo interquartile forniscano rispettivamente una stima della dispersione totale e media del campione, nessuna di queste stime tiene conto esattamente di come vengono distribuiti i dati. Varianza e deviazione standard libero da questa mancanza. Questi indicatori consentono di valutare il grado di fluttuazione dei dati attorno alla media. Varianza di campionamentoè un'approssimazione della media aritmetica calcolata dalle differenze al quadrato tra ciascun elemento del campione e la media del campione. Per un campione di X 1 , X 2 , ... X n la varianza campionaria (indicata dal simbolo S 2 è data dalla seguente formula:

In generale, la varianza campionaria è la somma delle differenze al quadrato tra gli elementi campionari e la media campionaria, divisa per un valore uguale alla dimensione campionaria meno uno:

dove - significato aritmetico, n- misura di prova, X i - io-esimo elemento campione X. In Excel prima della versione 2007, la funzione =VAR() veniva utilizzata per calcolare la varianza del campione, dalla versione 2010 viene utilizzata la funzione =VAR.V().

La stima più pratica e ampiamente accettata della dispersione dei dati è deviazione standard. Questo indicatore è indicato dal simbolo S ed è uguale a radice quadrata dalla varianza campionaria:

In Excel prima della versione 2007, la funzione =STDEV() veniva utilizzata per calcolare la deviazione standard, dalla versione 2010 viene utilizzata la funzione =STDEV.V(). Per calcolare queste funzioni, l'array di dati può essere disordinato.

Né la varianza campionaria né la deviazione standard campionaria possono essere negative. L'unica situazione in cui gli indicatori S 2 e S possono essere zero è se tutti gli elementi del campione sono uguali. In questo caso del tutto improbabile, anche l'intervallo e l'intervallo interquartile sono zero.

I dati numerici sono intrinsecamente volatili. Qualsiasi variabile può assumere un insieme valori diversi. Ad esempio, diversi fondi comuni di investimento hanno diversi indicatori redditività e perdite. A causa della variabilità dei dati numerici, è molto importante studiare non solo le stime della media, che sono di natura sommativa, ma anche le stime della varianza, che caratterizzano la dispersione dei dati.

La varianza e la deviazione standard consentono di stimare la diffusione dei dati attorno alla media, in altre parole, di determinare quanti elementi del campione sono inferiori alla media e quanti sono maggiori. La dispersione ha alcune proprietà matematiche preziose. Tuttavia, il suo valore è il quadrato di un'unità di misura: una percentuale quadrata, un dollaro quadrato, un pollice quadrato, ecc. Pertanto, una stima naturale della varianza è la deviazione standard, che è espressa nelle solite unità di misura: percentuale di reddito, dollari o pollici.

La deviazione standard consente di stimare la quantità di fluttuazione degli elementi del campione attorno al valore medio. In quasi tutte le situazioni, la maggior parte dei valori osservati si trova all'interno di più o meno una deviazione standard dalla media. Pertanto, conoscendo la media aritmetica degli elementi campionari e la deviazione standard del campione, è possibile determinare l'intervallo a cui appartiene la maggior parte dei dati.

La deviazione standard dei rendimenti di 15 fondi comuni di investimento ad altissimo rischio è 6,6 (Figura 9). Ciò significa che la redditività della maggior parte dei fondi differisce dal valore medio di non più del 6,6% (ovvero fluttua nell'intervallo da - S= 6,2 – 6,6 = da –0,4 a +S= 12,8). Infatti, questo intervallo contiene un rendimento medio annuo quinquennale del 53,3% (8 su 15) dei fondi.

Riso. 9. Deviazione standard

Si noti che nel processo di somma delle differenze al quadrato, gli elementi più lontani dalla media acquistano più peso rispetto agli elementi più vicini. Questa proprietà è il motivo principale per cui la media aritmetica viene spesso utilizzata per stimare la media di una distribuzione.

Il coefficiente di variazione

A differenza delle precedenti stime di dispersione, il coefficiente di variazione è una stima relativa. Viene sempre misurato in percentuale, non nelle unità di dati originali. Il coefficiente di variazione, indicato dai simboli CV, misura la dispersione dei dati attorno alla media. Il coefficiente di variazione è uguale alla deviazione standard divisa per la media aritmetica e moltiplicata per 100%:

dove S- deviazione standard del campione, - campione medio.

Il coefficiente di variazione consente di confrontare due campioni i cui elementi sono espressi in diverse unità di misura. Ad esempio, il gestore di un servizio di recapito della posta intende potenziare la flotta di camion. Quando si caricano i pacchi, ci sono due tipi di restrizioni da considerare: il peso (in libbre) e il volume (in piedi cubi) di ciascun pacco. Si supponga che in un campione di 200 sacchi, il peso medio sia 26,0 libbre, la deviazione standard del peso sia 3,9 libbre, il volume medio del pacco sia 8,8 piedi cubi e la deviazione standard del volume sia 2,2 piedi cubi. Come confrontare la diffusione del peso e del volume dei pacchi?

Poiché le unità di misura di peso e volume differiscono tra loro, il gestore deve confrontare lo spread relativo di questi valori. Il coefficiente di variazione del peso è CV W = 3,9 / 26,0 * 100% = 15% e il coefficiente di variazione del volume CV V = 2,2 / 8,8 * 100% = 25%. Pertanto, la dispersione relativa dei volumi dei pacchetti è molto maggiore della dispersione relativa dei loro pesi.

Modulo di distribuzione

La terza proprietà importante del campione è la forma della sua distribuzione. Questa distribuzione può essere simmetrica o asimmetrica. Per descrivere la forma di una distribuzione, è necessario calcolarne la media e la mediana. Se queste due misure sono uguali, la variabile si dice distribuita simmetricamente. Se il valore medio di una variabile è maggiore della mediana, la sua distribuzione ha un'asimmetria positiva (Fig. 10). Se la mediana è maggiore della media, la distribuzione della variabile è asimmetrica negativamente. L'asimmetria positiva si verifica quando la media aumenta a valori insolitamente alti. L'asimmetria negativa si verifica quando la media diminuisce a valori insolitamente piccoli. Una variabile è distribuita simmetricamente se non assume valori estremi in nessuna delle due direzioni, in modo tale che i valori grandi e piccoli della variabile si annullino a vicenda.

Riso. 10. Tre tipi di distribuzioni

I dati rappresentati sulla scala A hanno un'asimmetria negativa. Questa figura mostra una coda lunga e un'inclinazione a sinistra causata da valori insolitamente piccoli. Questi valori estremamente piccoli spostano il valore medio a sinistra e diventa inferiore alla mediana. I dati riportati sulla scala B sono distribuiti simmetricamente. Le metà sinistra e destra della distribuzione sono le loro immagini speculari. I valori grandi e piccoli si bilanciano a vicenda e la media e la mediana sono uguali. I dati mostrati sulla scala B hanno un'asimmetria positiva. Questa figura mostra una lunga coda e un'inclinazione a destra, causata dalla presenza di valori insolitamente alti. Questi valori troppo grandi spostano la media a destra e diventa più grande della mediana.

In Excel, le statistiche descrittive possono essere ottenute utilizzando il componente aggiuntivo Pacchetto analisi. Passa attraverso il menu DatiAnalisi dei dati, nella finestra che si apre, seleziona la riga Statistiche descrittive e fare clic Ok. Nella finestra Statistiche descrittive assicurati di indicare intervallo di input(Fig. 11). Se vuoi vedere le statistiche descrittive sullo stesso foglio dei dati originali, seleziona il pulsante di opzione intervallo di uscita e specifica la cella in cui vuoi posizionare l'angolo in alto a sinistra delle statistiche visualizzate (nel nostro esempio, $C$1). Se desideri inviare i dati in un nuovo foglio o in una nuova cartella di lavoro, seleziona semplicemente il pulsante di opzione appropriato. Seleziona la casella accanto a Statistiche finali. Opzionalmente, puoi anche scegliere Livello di difficoltà,k-esimo più piccolo ek-esimo più grande.

Se in deposito Dati nell'area di Analisi non vedi l'icona Analisi dei dati, devi prima installare il componente aggiuntivo Pacchetto analisi(vedi ad esempio).

Riso. 11. Statistiche descrittive dei rendimenti medi annui quinquennali dei fondi con livelli di rischio molto elevati, calcolati utilizzando l'add-on Analisi dei dati Programmi Excel

Excel calcola intera linea statistiche discusse sopra: media, mediana, moda, deviazione standard, varianza, intervallo ( intervallo), minima, massima e dimensione del campione ( dai un'occhiata). Inoltre, Excel calcola per noi alcune nuove statistiche: errore standard, curtosi e asimmetria. errore standardè uguale alla deviazione standard divisa per la radice quadrata della dimensione del campione. asimmetria caratterizza lo scostamento dalla simmetria della distribuzione ed è una funzione che dipende dal cubo delle differenze tra gli elementi del campione e il valore medio. La curtosi è una misura della concentrazione relativa di dati attorno alla media rispetto alle code della distribuzione e dipende dalle differenze tra il campione e la media elevata alla quarta potenza.

Calcolo di statistiche descrittive per la popolazione generale

La media, la dispersione e la forma della distribuzione discussa sopra sono caratteristiche basate sul campione. Tuttavia, se il set di dati contiene misurazioni numeriche dell'intera popolazione, è possibile calcolarne i parametri. Questi parametri includono la media, la varianza e la deviazione standard della popolazione.

Valore attesoè uguale alla somma di tutti i valori della popolazione generale divisa per il volume della popolazione generale:

dove µ - valore atteso, Xio- io-esima variabile osservazione X, N- il volume della popolazione generale. In Excel, per calcolare l'aspettativa matematica, viene utilizzata la stessa funzione della media aritmetica: =MEDIA().

Variazione della popolazione uguale alla somma delle differenze al quadrato tra gli elementi della popolazione generale e mat. aspettativa divisa per la dimensione della popolazione:

dove σ2è la varianza della popolazione generale. Excel precedente alla versione 2007 utilizza la funzione =VAR() per calcolare la varianza della popolazione, a partire dalla versione 2010 =VAR.G().

deviazione standard della popolazioneè uguale alla radice quadrata della varianza della popolazione:

Excel precedente alla versione 2007 utilizza =STDEV() per calcolare la deviazione standard della popolazione, a partire dalla versione 2010 =STDEV.Y(). Si noti che le formule per la varianza della popolazione e la deviazione standard sono diverse dalle formule per la varianza campionaria e la deviazione standard. Quando si calcolano le statistiche del campione S2 e S il denominatore della frazione è n - 1 e durante il calcolo dei parametri σ2 e σ - il volume della popolazione generale N.

regola del pollice

Nella maggior parte dei casi, gran parte delle osservazioni si concentra intorno alla mediana, formando un cluster. Nei set di dati con asimmetria positiva, questo cluster si trova a sinistra (cioè sotto) dell'aspettativa matematica e negli insiemi con asimmetria negativa questo cluster si trova a destra (cioè sopra) dell'aspettativa matematica. I dati simmetrici hanno la stessa media e mediana e le osservazioni si raggruppano attorno alla media, formando una distribuzione a campana. Se la distribuzione non ha un'asimmetria pronunciata e i dati sono concentrati attorno a un certo baricentro, è possibile utilizzare una regola pratica per stimare la variabilità, che dice: se i dati hanno una distribuzione a campana, allora circa il 68% delle osservazioni sono inferiori a una deviazione standard dall'aspettativa matematica, circa il 95% delle osservazioni è entro due deviazioni standard del valore atteso e il 99,7% delle osservazioni è entro tre deviazioni standard del valore atteso.

Pertanto, la deviazione standard, che è una stima della fluttuazione media attorno all'aspettativa matematica, aiuta a capire come sono distribuite le osservazioni e ad identificare i valori anomali. Ne consegue dalla regola pratica che per le distribuzioni a campana, solo un valore su venti differisce dall'aspettativa matematica di più di due deviazioni standard. Pertanto, valori al di fuori dell'intervallo µ±2σ, possono essere considerati valori anomali. Inoltre, solo tre osservazioni su 1000 differiscono dalle aspettative matematiche per più di tre deviazioni standard. Pertanto, valori al di fuori dell'intervallo µ± 3σ sono quasi sempre valori anomali. Per le distribuzioni che sono molto asimmetriche o non a forma di campana, può essere applicata la regola pratica di Biename-Chebyshev.

Più di cento anni fa, i matematici Bienamay e Chebyshev lo scoprirono indipendentemente proprietà utile deviazione standard. Hanno scoperto che per qualsiasi set di dati, indipendentemente dalla forma della distribuzione, la percentuale di osservazioni che si trovano a una distanza non superiore a K deviazioni standard dall'aspettativa matematica, non meno (1 – 1/ 2)*100%.

Ad esempio, se K= 2, la regola Biename-Chebyshev afferma che almeno (1 - (1/2) 2) x 100% = 75% delle osservazioni deve trovarsi nell'intervallo µ±2σ. Questa regola vale per chiunque K superiore a uno. La regola di Biename-Chebyshev è di natura molto generale ed è valida per distribuzioni di qualsiasi tipo. Indica il numero minimo di osservazioni, la distanza dalla quale l'aspettativa matematica non supera un dato valore. Tuttavia, se la distribuzione è a forma di campana, la regola pratica stima in modo più accurato la concentrazione di dati attorno alla media.

Calcolo di statistiche descrittive per una distribuzione basata sulla frequenza

Se i dati originali non sono disponibili, la distribuzione di frequenza diventa l'unica fonte di informazioni. In tali situazioni, è possibile calcolare i valori approssimativi degli indicatori quantitativi della distribuzione, come la media aritmetica, la deviazione standard, i quartili.

Se i dati del campione sono presentati come una distribuzione di frequenza, è possibile calcolare un valore approssimativo della media aritmetica, assumendo che tutti i valori all'interno di ciascuna classe siano concentrati in punto medio classe:

dove - campione medio, n- numero di osservazioni, o dimensione del campione, Insieme a- il numero di classi nella distribuzione di frequenza, mj- punto medio j-a classe, fj- frequenza corrispondente a j-esima classe.

Per calcolare la deviazione standard dalla distribuzione di frequenza, si assume inoltre che tutti i valori all'interno di ciascuna classe siano concentrati nel punto medio della classe.

Per capire come vengono determinati i quartili delle serie in base alle frequenze, si consideri il calcolo del quartile inferiore basato sui dati del 2013 sulla distribuzione della popolazione russa per reddito medio pro capite in contanti (Fig. 12).

Riso. 12. La quota della popolazione russa con reddito monetario pro capite in media al mese, rubli

Per calcolare il primo quartile della serie di variazioni di intervallo, puoi utilizzare la formula:

dove Q1 è il valore del primo quartile, xQ1 è il limite inferiore dell'intervallo contenente il primo quartile (l'intervallo è determinato dalla frequenza accumulata, la prima superiore al 25%); i è il valore dell'intervallo; Σf è la somma delle frequenze dell'intero campione; probabilmente sempre pari al 100%; SQ1–1 è la frequenza cumulativa dell'intervallo che precede l'intervallo contenente il quartile inferiore; fQ1 è la frequenza dell'intervallo contenente il quartile inferiore. La formula per il terzo quartile differisce in quanto in tutti i punti, invece di Q1, è necessario utilizzare Q3 e sostituire ¾ invece di ¼.

Nel nostro esempio (Fig. 12), il quartile inferiore è compreso nell'intervallo 7000,1 - 10.000, la cui frequenza cumulativa è del 26,4%. Il limite inferiore di questo intervallo è di 7000 rubli, il valore dell'intervallo è di 3000 rubli, la frequenza accumulata dell'intervallo che precede l'intervallo contenente il quartile inferiore è del 13,4%, la frequenza dell'intervallo contenente il quartile inferiore è del 13,0%. Quindi: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13,4) / 13 \u003d 9677 rubli.

Insidie ​​associate alla statistica descrittiva

In questa nota, abbiamo esaminato come descrivere un set di dati utilizzando varie statistiche che ne stimano la media, la dispersione e la distribuzione. Il passo successivo è analizzare e interpretare i dati. Finora abbiamo studiato le proprietà oggettive dei dati e ora passiamo alla loro interpretazione soggettiva. Due errori attendono il ricercatore: un argomento di analisi scelto in modo errato e un'interpretazione errata dei risultati.

Un'analisi della performance di 15 fondi comuni di investimento ad altissimo rischio è abbastanza imparziale. Ha portato a conclusioni completamente obiettive: tutti i fondi comuni di investimento hanno rendimenti diversi, lo spread dei rendimenti dei fondi varia da -6,1 a 18,5 e il rendimento medio è 6,08. L'obiettività dell'analisi dei dati è assicurata la scelta giusta indicatori quantitativi totali di distribuzione. Sono stati presi in considerazione diversi metodi per stimare la media e la dispersione dei dati e sono stati indicati i loro vantaggi e svantaggi. Come scegliere le statistiche giuste che forniscano un'analisi obiettiva e imparziale? Se la distribuzione dei dati è leggermente asimmetrica, è necessario scegliere la mediana rispetto alla media aritmetica? Quale indicatore caratterizza in modo più accurato la diffusione dei dati: deviazione standard o intervallo? Deve essere indicata l'asimmetria positiva della distribuzione?

D'altra parte, l'interpretazione dei dati è un processo soggettivo. Persone diverse giungono a conclusioni diverse, interpretando gli stessi risultati. Ognuno ha il proprio punto di vista. Qualcuno considera buono il rendimento medio annuo totale di 15 fondi con un livello di rischio molto elevato ed è abbastanza soddisfatto del reddito percepito. Altri potrebbero pensare che questi fondi abbiano rendimenti troppo bassi. Pertanto, la soggettività dovrebbe essere compensata dall'onestà, dalla neutralità e dalla chiarezza delle conclusioni.

Problemi etici

L'analisi dei dati è indissolubilmente legata a questioni etiche. Si dovrebbe essere critici nei confronti delle informazioni diffuse dai giornali, dalla radio, dalla televisione e da Internet. Con il tempo imparerai ad essere scettico non solo sui risultati, ma anche sugli obiettivi, sull'argomento e sull'obiettività della ricerca. Il famoso politico britannico Benjamin Disraeli lo ha detto meglio: "Ci sono tre tipi di bugie: bugie, maledette bugie e statistiche".

Come indicato nella nota, nella scelta dei risultati da presentare nella relazione sorgono problemi etici. Sia i risultati positivi che quelli negativi dovrebbero essere pubblicati. Inoltre, quando si effettua una relazione o una relazione scritta, i risultati devono essere presentati in modo onesto, neutrale e oggettivo. Distinguere tra presentazioni cattive e disoneste. Per fare ciò, è necessario determinare quali fossero le intenzioni dell'oratore. A volte l'oratore omette informazioni importanti per ignoranza e talvolta deliberatamente (ad esempio, se usa la media aritmetica per stimare la media di dati chiaramente distorti al fine di ottenere il risultato desiderato). È anche disonesto sopprimere risultati che non corrispondono al punto di vista del ricercatore.

Vengono utilizzati i materiali del libro Levin et al.. Statistiche per manager. - M.: Williams, 2004. - p. 178–209

QUARTILE funzione mantenuta per allinearsi con le versioni precedenti di Excel

Condividere