Kako pronaći aritmetičku sredinu brojeva. Izračunavanje prosječne vrijednosti niza brojeva

Da biste pronašli prosječnu vrijednost u Excel-u (bilo da je brojčana, tekstualna, procentualna ili druga vrijednost), postoji mnogo funkcija. I svaki od njih ima svoje karakteristike i prednosti. Uostalom, u ovom zadatku se mogu postaviti određeni uvjeti.

Na primjer, prosječne vrijednosti niza brojeva u Excelu se izračunavaju pomoću statističkih funkcija. Također možete ručno unijeti vlastitu formulu. Razmotrimo razne opcije.

Kako pronaći aritmetičku sredinu brojeva?

Da biste pronašli aritmetičku sredinu, sabirate sve brojeve u skupu i podijelite zbir brojem. Na primjer, ocjene učenika iz informatike: 3, 4, 3, 5, 5. Šta vrijedi za četvrtinu: 4. Pronašli smo aritmetičku sredinu koristeći formulu: \u003d (3 + 4 + 3 + 5 + 5) / 5.

Kako to učiniti brzo koristeći Excel funkcije? Uzmimo, na primjer, seriju slučajni brojevi U redu:

Ili: učinite ćeliju aktivnom i jednostavno ručno unesite formulu: =PROSJEK(A1:A8).

Sada da vidimo šta još funkcija AVERAGE može učiniti.


Pronađite aritmetičku sredinu prva dva i posljednja tri broja. Formula: =PROSJEK(A1:B1;F1:H1). rezultat:



Prosjek po stanju

Uslov za pronalaženje aritmetičke sredine može biti numerički ili tekstualni kriterijum. Koristićemo funkciju: =AVERAGEIF().

Nađi sredinu aritmetički brojevi koji su veći ili jednaki 10.

Funkcija: =AVERAGEIF(A1:A8,">=10")


Rezultat korištenja funkcije AVERAGEIF pod uvjetom ">=10":

Treći argument - "Raspon usrednjavanja" - je izostavljen. Prvo, nije potrebno. Drugo, opseg koji je analizirao program sadrži SAMO numeričke vrijednosti. U ćelijama navedenim u prvom argumentu, pretraga će se izvršiti u skladu sa uslovom navedenim u drugom argumentu.

Pažnja! Kriterijum pretrage se može odrediti u ćeliji. I u formuli da se referencira na to.

Nađimo prosječnu vrijednost brojeva po tekstualnom kriteriju. Na primjer, prosječna prodaja proizvoda "stolovi".

Funkcija će izgledati ovako: =AVERAGEIF($A$2:$A$12;A7;$B$2:$B$12). Raspon - kolona s nazivima proizvoda. Kriterijum za pretragu je veza do ćelije sa riječju "tabele" (možete umetnuti riječ "tabele" umjesto veze A7). Raspon prosjeka - one ćelije iz kojih će se uzeti podaci za izračunavanje prosječne vrijednosti.

Kao rezultat izračunavanja funkcije dobijamo sljedeću vrijednost:

Pažnja! Za tekstualni kriterij (uvjet) mora se specificirati raspon prosjeka.

Kako izračunati ponderisanu prosječnu cijenu u Excelu?

Kako znamo ponderisanu prosječnu cijenu?

Formula: =SUMPROIZVOD(C2:C12,B2:B12)/SUM(C2:C12).


Koristeći formulu SUMPRODUCT, saznajemo ukupan prihod nakon prodaje cjelokupne količine robe. A funkcija SUM - sumira količinu robe. Dijeljenjem ukupnog prihoda od prodaje robe sa ukupnim brojem jedinica robe, dobija se prosječna ponderirana cijena. Ovaj indikator uzima u obzir "težinu" svake cijene. Njegov udio u ukupnoj masi vrijednosti.

Standardna devijacija: formula u Excel-u

Razlikovati standardnu ​​devijaciju za opću populaciju i za uzorak. U prvom slučaju, ovo je korijen opće varijanse. U drugom, iz varijanse uzorka.

Za izračunavanje ovog statističkog pokazatelja sastavlja se formula disperzije. Iz nje se uzima korijen. Ali u Excelu postoji gotova funkcija za pronalaženje standardne devijacije.


Standardna devijacija je povezana sa skalom izvornih podataka. Ovo nije dovoljno za figurativni prikaz varijacije analiziranog raspona. Da bi se dobio relativni nivo raspršenosti u podacima, izračunava se koeficijent varijacije:

standardna devijacija / aritmetička sredina

Formula u Excelu izgleda ovako:

STDEV (opseg vrijednosti) / AVERAGE (opseg vrijednosti).

Koeficijent varijacije se izračunava kao procenat. Stoga postavljamo format postotka u ćeliji.

Recimo da trebate pronaći prosječan broj dana za izvršavanje zadataka od strane različitih zaposlenika. Takođe, želite da izračunate prosječnu temperaturu za određeni dan u periodu od 10 godina. Izračunavanje prosječne vrijednosti za grupu brojeva može se izvršiti na nekoliko načina.

Funkcija AVERAGE izračunava srednju vrijednost, koja je centar skupa brojeva u statističkoj distribuciji. Postoje tri najčešća načina za određivanje srednje vrijednosti:

    Zlo Ovo je aritmetički prosjek koji se izračunava dodavanjem grupe brojeva i njihovim dijeljenjem brojem ovih brojeva. Na primjer, prosjek za brojeve 2, 3, 3, 5, 7 i 10 je 5, što je rezultat dijeljenja njihovog zbira, koji je 30, njihovim brojem, koji je 6.

    Medijan Srednji broj grupe brojeva. Polovina brojeva sadrži vrijednosti veće od medijane, a polovina brojeva sadrži vrijednosti manje od medijane. Na primjer, medijana za brojeve 2, 3, 3, 5, 7 i 10 je 4.

    Moda Broj koji se najčešće pojavljuje u grupi brojeva. Na primjer, način rada za brojeve 2, 3, 3, 5, 7 i 10 bi bio 3.

Sa simetričnom distribucijom skupa brojeva, sve tri vrijednosti središnje tendencije će se poklopiti. U devijantnoj distribuciji grupe brojeva, oni mogu biti različiti.

Izračunajte prosječnu vrijednost u susjednim redovima ili kolonama

Slijedite dolje navedene korake.

Izračunavanje prosječne vrijednosti izvan kontinuiranog reda ili kolone

Da biste izvršili ovaj zadatak, koristite funkciju PROSJEČNO. Kopirajte donju tabelu na prazan list.

Izračunavanje ponderisanog prosjeka

Da biste izvršili ovaj zadatak, koristite funkcije SUMPRODUCT I suma. WWIS primjer izračunava prosječne cijene plaćene po jedinici za tri kupovine, pri čemu je svaka za različitu stavku na drugoj jedinici.

Kopirajte donju tabelu na prazan list.

Zapamtite!

To pronađite aritmetičku sredinu, trebate sabrati sve brojeve i njihov zbir podijeliti njihovim brojem.


Pronađite aritmetičku sredinu za 2, 3 i 4.

Označimo aritmetičku sredinu slovom "m". Prema gornjoj definiciji, nalazimo zbir svih brojeva.


Dobiveni iznos podijelite s brojem uzetih brojeva. Imamo tri broja.

Kao rezultat, dobijamo formula aritmetičke sredine:


Čemu služi aritmetička sredina?

Osim što se stalno nudi da se nađe u učionici, pronalaženje aritmetičke sredine je vrlo korisno u životu.

Na primjer, odlučite prodati fudbalske lopte. Ali pošto ste novi u ovom poslu, potpuno je neshvatljivo po kojoj cijeni prodajete lopte.

Tada odlučite da saznate po kojoj ceni vaši konkurenti već prodaju fudbalske lopte u vašem kraju. Saznajte cijene u trgovinama i napravite tabelu.

Ispostavilo se da su cijene loptica u trgovinama prilično različite. Koju cijenu da odaberemo za prodaju fudbalske lopte?

Ako odaberemo najnižu (290 rubalja), onda ćemo robu prodati s gubitkom. Ako odaberete najvišu (360 rubalja), kupci neće kupovati fudbalske lopte od nas.

Potrebna nam je prosječna cijena. Ovdje dolazi u pomoć prosjek.

Izračunajte aritmetičku sredinu cijena fudbalskih lopti:

prosječna cijena =

290 + 360 + 310
3
=
960
3
= 320 rub.

Tako smo dobili prosječnu cijenu (320 rubalja), po kojoj fudbalsku loptu možemo prodati ni prejeftino ni preskupo.

Prosječna brzina kretanja

Koncept je blisko povezan sa aritmetičkom sredinom prosječna brzina.

Posmatrajući kretanje saobraćaja u gradu, možete vidjeti da automobili ili ubrzavaju i putuju velikom brzinom, zatim usporavaju i putuju malom brzinom.

Mnogo je takvih dionica duž rute vozila. Zbog toga se radi lakšeg izračunavanja koristi koncept prosječne brzine.

Zapamtite!

Prosječna brzina kretanja je ukupna pređena udaljenost podijeljena s ukupnim vremenom kretanja.

Razmotrite problem za prosječnu brzinu.

Zadatak broj 1503 iz udžbenika "Vilenkin 5 razred"

Autoput je putovao 3,2 sata na autoputu brzinom od 90 km/h, zatim 1,5 sata na zemljanom putu brzinom od 45 km/h i na kraju 0,3 sata na seoskom putu brzinom od 30 km/h. Pronađite prosječnu brzinu automobila za cijelo putovanje.

Da biste izračunali prosječnu brzinu kretanja, morate znati cijeli put koji je prešao automobil i cijelo vrijeme u kojem se automobil kretao.

S 1 \u003d V 1 t 1

S 1 = 90 3,2 = 288 (km)

- autoput.

S 2 \u003d V 2 t 2

S 2 = 45 1,5 = 67,5 (km) - zemljani put.

S 3 \u003d V 3 t 3

S 3 \u003d 30 0,3 \u003d 9 (km) - seoski put.

S = S 1 + S 2 + S 3

S \u003d 288 + 67,5 + 9 \u003d 364,5 (km) - cijeli put koji je prešao automobil.

T \u003d t 1 + t 2 + t 3

T = 3,2 + 1,5 + 0,3 \u003d 5 (h) - cijelo vrijeme.

V cf \u003d S: t

V cf = 364,5: 5 = 72,9 (km / h) - prosječna brzina kretanje vozila.

Odgovor: V av = 72,9 (km / h) - prosječna brzina automobila.

U matematici, aritmetička sredina brojeva (ili jednostavno prosjek) je zbir svih brojeva u datom skupu podijeljen njihovim brojem. Ovo je najopćenitiji i najrašireniji koncept prosječne vrijednosti. Kao što ste već shvatili, da biste pronašli prosječnu vrijednost, morate zbrojiti sve brojeve koji su vam dati i rezultat podijeliti s brojem pojmova.

Šta je aritmetička sredina?

Pogledajmo primjer.

Primjer 1. Dati su brojevi: 6, 7, 11. Potrebno je pronaći njihovu prosječnu vrijednost.

Rješenje.

Prvo, hajde da nađemo zbir svih datih brojeva.

Sada podijelimo rezultirajuću sumu sa brojem članova. Pošto imamo tri člana, respektivno, podelićemo sa tri.

Dakle, prosek brojeva 6, 7 i 11 je 8. Zašto 8? Da, jer će zbir 6, 7 i 11 biti isti kao tri osmice. Ovo se jasno vidi na ilustraciji.

Prosječna vrijednost donekle podsjeća na "poravnanje" niza brojeva. Kao što vidite, gomile olovaka su postale jedan nivo.

Razmotrite još jedan primjer kako biste konsolidirali stečeno znanje.

Primjer 2 Dati su brojevi: 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29. Potrebno je pronaći njihovu aritmetičku sredinu.

Rješenje.

Nalazimo sumu.

3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330

Podijelite s brojem pojmova (u ovom slučaju 15).

Dakle, prosječna vrijednost ove serije brojeva je 22.

Sada razmotrite negativne brojeve. Prisjetimo se kako ih sažeti. Na primjer, imate dva broja 1 i -4. Nađimo njihov zbir.

1 + (-4) = 1 – 4 = -3

Znajući ovo, razmotrite još jedan primjer.

Primjer 3 Pronađite prosječnu vrijednost niza brojeva: 3, -7, 5, 13, -2.

Rješenje.

Pronalaženje zbira brojeva.

3 + (-7) + 5 + 13 + (-2) = 12

Pošto postoji 5 članova, dobijeni zbir podijelimo sa 5.

Dakle, aritmetička sredina brojeva 3, -7, 5, 13, -2 je 2,4.

U našem vremenu tehnološkog napretka mnogo je zgodnije koristiti kompjuterske programe za pronalaženje prosječne vrijednosti. Microsoft Office Excel je jedan od njih. Pronalaženje prosjeka u Excelu je brzo i jednostavno. Štaviše, ovaj program je uključen u softverski paket iz Microsoft Office-a. Razmislite kratka uputstva kako pronaći aritmetičku sredinu koristeći ovaj program.

Da biste izračunali prosječnu vrijednost niza brojeva, morate koristiti funkciju AVERAGE. Sintaksa za ovu funkciju je:
=Prosjek(argument1, argument2, ... argument255)
gdje su argument1, argument2, ... argument255 ili brojevi ili reference na ćelije (ćelije znače opsege i nizove).

Da bude jasnije, hajde da testiramo stečeno znanje.

  1. Unesite brojeve 11, 12, 13, 14, 15, 16 u ćelije C1 - C6.
  2. Odaberite ćeliju C7 klikom na nju. U ovoj ćeliji ćemo prikazati prosječnu vrijednost.
  3. Kliknite na karticu "Formule".
  4. Odaberite Više funkcija > Statistički da biste otvorili padajuću listu.
  5. Odaberite PROSJEČNO. Nakon toga bi se trebao otvoriti dijaloški okvir.
  6. Odaberite i povucite ćelije C1-C6 tamo da biste postavili raspon u dijaloškom okviru.
  7. Potvrdite svoje radnje tipkom "OK".
  8. Ako ste sve uradili ispravno, u ćeliji C7 bi trebalo da imate odgovor - 13.7. Kada kliknete na ćeliju C7, funkcija (=Prosjek(C1:C6)) će se prikazati u traci formule.

Vrlo je korisno koristiti ovu funkciju za računovodstvo, fakture ili kada samo trebate pronaći prosjek za veoma dug raspon brojeva. Stoga se često koristi u uredima i velikim kompanijama. To vam omogućava da evidenciju vodite uredno i omogućava brzo izračunavanje nečega (na primjer, prosječni mjesečni prihod). Također možete koristiti Excel da pronađete srednju vrijednost funkcije.

Prosjek

Ovaj izraz ima druga značenja, pogledajte prosječno značenje.

Prosjek(u matematici i statistici) skupovi brojeva - zbir svih brojeva podijeljen njihovim brojem. To je jedna od najčešćih mjera centralne tendencije.

Predložili su ga (zajedno sa geometrijskom sredinom i harmonijskom sredinom) Pitagorejci.

Posebni slučajevi aritmetičke sredine su srednja vrijednost (opće populacije) i uzorkovana sredina (uzoraka).

Uvod

Označite skup podataka X = (x 1 , x 2 , …, x n), tada se srednja vrijednost uzorka obično označava horizontalnom crtom iznad varijable (x ¯ (\displaystyle (\bar (x))) , izgovara se " x sa crticom").

Grčko slovo μ koristi se za označavanje aritmetičke sredine cjelokupne populacije. Za slučajna varijabla, za koji je srednja vrijednost definirana, μ je srednja verovatnoća ili matematičko očekivanje slučajne varijable. Ako je set X je zbirka slučajnih brojeva sa srednjom vjerovatnoćom μ, tada za bilo koji uzorak x i iz ove kolekcije μ = E( x i) je očekivanje ovog uzorka.

U praksi, razlika između μ i x ¯ (\displaystyle (\bar (x))) je u tome što je μ tipična varijabla jer možete vidjeti uzorak, a ne cijelu populaciju. Stoga, ako je uzorak predstavljen nasumično (u smislu teorije vjerovatnoće), tada se x ¯ (\displaystyle (\bar (x))) (ali ne μ) može tretirati kao slučajna varijabla koja ima distribuciju vjerovatnoće na uzorku ( distribucija vjerovatnoće srednje vrijednosti).

Obje ove količine se izračunavaju na isti način:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\suma _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Ako X je slučajna varijabla, zatim matematičko očekivanje X može se smatrati aritmetičkom sredinom vrijednosti u ponovljenim mjerenjima količine X. Ovo je manifestacija zakona veliki brojevi. Stoga se srednja vrijednost uzorka koristi za procjenu nepoznatog matematičko očekivanje.

U elementarnoj algebri je dokazano da je srednja vrijednost n+ 1 broj iznad prosjeka n brojevi ako i samo ako je novi broj veći od starog prosjeka, manji ako i samo ako je novi broj manji od prosjeka i ne mijenja se ako i samo ako je novi broj jednak prosjeku. Više n, što je manja razlika između novog i starog prosjeka.

Imajte na umu da postoji nekoliko drugih dostupnih "sredstava", uključujući postepenu sredinu, Kolmogorovljevu sredinu, harmonijsku sredinu, aritmetičko-geometrijsku sredinu i različite ponderisane sredine (npr. aritmetičku ponderisanu sredinu, geometrijsku ponderisanu sredinu, harmonijsku sredinu) .

Primjeri

  • Za tri broja, trebate ih sabrati i podijeliti sa 3:
x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).)
  • Za četiri broja, trebate ih sabrati i podijeliti sa 4:
x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

Ili lakše 5+5=10, 10:2. Zato što smo dodali 2 broja, što znači da koliko brojeva saberemo, sa tim dijelimo.

Kontinuirana slučajna varijabla

Za kontinuirano distribuiranu vrijednost f (x) (\displaystyle f(x)) aritmetička sredina na intervalu [ a ; b ] (\displaystyle ) je definiran preko određenog integrala:

F (x) ¯ [ a ; b ] = 1 b − a ∫ abf (x) dx (\displaystyle (\overline (f(x)))_()=(\frac (1)(ba))\int _(a)^(b) f(x)dx)

Neki problemi korištenja prosjeka

Nedostatak robusnosti

Glavni članak: Robustnost u statistici

Iako se aritmetička sredina često koristi kao srednja vrijednost ili centralni trend, ovaj koncept se ne primjenjuje na robusnu statistiku, što znači da je aritmetička sredina pod velikim utjecajem "velikih odstupanja". Važno je napomenuti da za distribucije sa velikom iskrivljenošću, aritmetička sredina možda neće odgovarati konceptu „prosjeka“, a vrijednosti srednje vrijednosti iz robusne statistike (na primjer, medijan) mogu bolje opisati središnji trend.

Klasičan primjer je obračun prosječnog dohotka. Aritmetička sredina se može pogrešno protumačiti kao medijana, što može dovesti do zaključka da ima više ljudi s većim prihodima nego što ih stvarno ima. "Srednji" prihod se tumači na način da su prihodi većine ljudi blizu ovom broju. Ovaj "prosječni" (u smislu aritmetičke sredine) prihod je veći od prihoda većine ljudi, budući da visok dohodak sa velikim odstupanjem od prosjeka čini aritmetičku sredinu snažno iskrivljenom (nasuprot tome, srednji dohodak se "opire" takva iskrivljenost). Međutim, ovaj "prosječni" prihod ne govori ništa o broju ljudi blizu srednjeg prihoda (i ne govori ništa o broju ljudi blizu modalnog prihoda). Međutim, ako se pojmovi "prosjek" i "većina" olako shvate, onda se može pogrešno zaključiti da većina ljudi ima prihode veće nego što jesu. Na primjer, izvještaj o "prosječnom" neto prihodu u Medini u Washingtonu, izračunatom kao aritmetička sredina svih godišnjih neto prihoda stanovnika, daće iznenađujuće veliki broj zbog Bila Gejtsa. Razmotrite uzorak (1, 2, 2, 2, 3, 9). Aritmetička sredina je 3,17, ali pet od šest vrijednosti je ispod ove sredine.

Složena kamata

Glavni članak: ROI

Ako brojevi umnožiti, ali ne fold, trebate koristiti geometrijsku sredinu, a ne aritmetičku sredinu. Najčešće se ovaj incident dešava prilikom izračunavanja povrata ulaganja u finansije.

Na primjer, ako su dionice pale za 10% u prvoj godini i porasle za 30% u drugoj godini, onda je pogrešno izračunati "prosječno" povećanje u ove dvije godine kao aritmetičku sredinu (−10% + 30%) / 2 = 10%; tačan prosjek u ovom slučaju je dat složenom godišnjom stopom rasta, od koje je godišnji rast samo oko 8,16653826392% ≈ 8,2%.

Razlog tome je što procenti svaki put imaju novu početnu tačku: 30% je 30% od broja manjeg od cijene na početku prve godine: ako je dionica počela na 30 dolara i pala za 10%, vrijedi 27 dolara na početku druge godine. Ako dionica poraste za 30%, na kraju druge godine vrijedi 35,1 USD. Aritmetički prosjek ovog rasta je 10%, ali pošto je dionica porasla za samo 5,1 USD u 2 godine, prosječno povećanje od 8,2% daje konačni rezultat $35.1:

[30 USD (1 - 0,1) (1 + 0,3) = 30 USD (1 + 0,082) (1 + 0,082) = 35,1 USD]. Ako koristimo aritmetičku sredinu od 10% na isti način, nećemo dobiti stvarnu vrijednost: [30 USD (1 + 0,1) (1 + 0,1) = 36,3 USD].

Složena kamata na kraju 2. godine: 90% * 130% = 117% , odnosno ukupno povećanje od 17%, a prosječna godišnja složena kamata je 117% ≈ 108,2% (\displaystyle (\sqrt (117\%)) \cca 108,2\%), odnosno prosječno godišnje povećanje od 8,2%.

Upute

Glavni članak: Statistika odredišta

Prilikom izračunavanja aritmetičke sredine neke varijable koja se ciklički mijenja (na primjer, faza ili ugao), treba obratiti posebnu pažnju. Na primjer, prosjek od 1° i 359° bi bio 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Ovaj broj je netačan iz dva razloga.

  • Prvo, ugaone mjere su definirane samo za raspon od 0° do 360° (ili od 0 do 2π kada se mjere u radijanima). Dakle, isti par brojeva može se napisati kao (1° i −1°) ili kao (1° i 719°). Prosjeci svakog para će biti različiti: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2))= 0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\circ )) .
  • Drugo, u ovom slučaju, vrijednost od 0° (ekvivalentno 360°) bi bila geometrijski najbolja sredina, budući da brojevi odstupaju manje od 0° nego od bilo koje druge vrijednosti (vrijednost 0° ima najmanju varijansu). uporedi:
    • broj 1° odstupa od 0° samo za 1°;
    • broj 1° odstupa od izračunatog prosjeka od 180° za 179°.

Prosječna vrijednost za cikličnu varijablu, izračunata prema gornjoj formuli, bit će umjetno pomjerena u odnosu na stvarni prosjek do sredine numeričkog raspona. Zbog toga se prosjek izračunava na drugačiji način, naime, kao prosječnu vrijednost bira se broj sa najmanjom varijansom (centralna tačka). Također, umjesto oduzimanja, koristi se modulo udaljenost (tj. obodna udaljenost). Na primjer, modularna udaljenost između 1° i 359° je 2°, a ne 358° (na krugu između 359° i 360°==0° - jedan stepen, između 0° i 1° - također 1°, ukupno - 2°).

Ponderisani prosek - šta je to i kako ga izračunati?

U procesu izučavanja matematike studenti se upoznaju sa pojmom aritmetičke sredine. U budućnosti, u statistici i nekim drugim naukama, studenti se suočavaju i sa izračunavanjem drugih prosjeka. Šta mogu biti i po čemu se razlikuju jedni od drugih?

Prosjeci: značenje i razlike

Nisu uvijek tačni pokazatelji daju razumijevanje situacije. Da bi se procijenila ova ili ona situacija, ponekad je potrebno analizirati ogroman broj brojki. A onda prosjeci priskaču u pomoć. Oni vam omogućavaju da generalno procenite situaciju.


Od školskih dana mnogi odrasli pamte postojanje aritmetičke sredine. Vrlo je lako izračunati - zbir niza od n članova je djeljiv sa n. Odnosno, ako trebate izračunati aritmetičku sredinu u nizu vrijednosti 27, 22, 34 i 37, tada morate riješiti izraz (27 + 22 + 34 + 37) / 4, budući da su 4 vrijednosti se koriste u proračunima. U ovom slučaju, željena vrijednost će biti jednaka 30.

Često se u okviru školskog predmeta proučava i geometrijska sredina. Izračunavanje ove vrijednosti zasniva se na uzimanju korijena n-ti stepen iz proizvoda n-članova. Ako uzmemo iste brojeve: 27, 22, 34 i 37, onda će rezultat izračuna biti 29,4.

Harmonska sredina u opšteobrazovnoj školi obično nije predmet proučavanja. Međutim, koristi se prilično često. Ova vrijednost je recipročna aritmetička sredina i izračunava se kao količnik n - broja vrijednosti i sume 1/a 1 +1/a 2 +...+1/a n. Ako opet uzmemo isti niz brojeva za izračun, onda će harmonik biti 29,6.

Ponderisani prosjek: karakteristike

Međutim, sve gore navedene vrijednosti se ne mogu svugdje koristiti. Na primjer, u statistici, kada se računaju neke prosječne vrijednosti važnu ulogu ima "težinu" svakog broja koji se koristi u proračunima. Rezultati su jasniji i tačniji jer uzimaju u obzir više informacija. Ova grupa vrijednosti se zajednički naziva "ponderisani prosjek". Oni se ne polažu u školi, pa se vrijedi detaljnije osvrnuti na njih.

Prije svega, vrijedno je objasniti šta se podrazumijeva pod "težinom" određene vrijednosti. Najlakši način da to objasnite je konkretnim primjerom. Tjelesna temperatura svakog pacijenta mjeri se dva puta dnevno u bolnici. Od 100 pacijenata na različitim odeljenjima bolnice, 44 će imati normalnu temperaturu - 36,6 stepeni. Još 30 će imati povećanu vrijednost - 37,2, 14 - 38, 7 - 38,5, 3 - 39, a preostala dva - 40. A ako uzmemo aritmetičku sredinu, onda će ova vrijednost općenito za bolnicu biti preko 38 stepeni ! Ali skoro polovina pacijenata ima potpuno normalnu temperaturu. I ovdje bi bilo ispravnije koristiti ponderirani prosjek, a "težina" svake vrijednosti će biti broj ljudi. U ovom slučaju, rezultat izračuna će biti 37,25 stepeni. Razlika je očigledna.

U slučaju izračunavanja ponderisanog prosjeka, "težina" se može uzeti kao broj pošiljki, broj ljudi koji rade u datom danu, općenito, sve što se može izmjeriti i uticati na konačni rezultat.

Sorte

Ponderisani prosjek odgovara aritmetičkom prosjeku o kojem se govori na početku članka. Međutim, prva vrijednost, kao što je već spomenuto, također uzima u obzir težinu svakog broja korištenog u proračunima. Pored toga, postoje i ponderisane geometrijske i harmonijske vrednosti.

Postoji još jedna zanimljiva sorta koja se koristi u serijama brojeva. Ovo je ponderisani pokretni prosek. Na osnovu njega se izračunavaju trendovi. Osim samih vrijednosti i njihove težine, tu se koristi i periodičnost. A prilikom izračunavanja prosječne vrijednosti u nekom trenutku, u obzir se uzimaju i vrijednosti ​​​za prethodne vremenske periode.

Izračunavanje svih ovih vrijednosti nije tako teško, ali u praksi se obično koristi samo uobičajeni ponderirani prosjek.

Metode proračuna

U doba kompjuterizacije, nema potrebe za ručno izračunavanjem ponderisanog prosjeka. Međutim, bilo bi korisno znati formulu izračuna kako biste mogli provjeriti i, ako je potrebno, ispraviti dobivene rezultate.

Izračun će biti najlakše razmotriti na konkretnom primjeru.

Potrebno je saznati kolika je prosječna plata u ovom preduzeću, uzimajući u obzir broj radnika koji primaju određenu platu.

Dakle, izračun ponderiranog prosjeka se vrši pomoću sljedeće formule:

x = (a 1 *w 1 +a 2 *w 2 +...+a n *w n)/(w 1 +w 2 +...+w n)

Na primjer, izračun bi bio:

x = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33,48

Očigledno, nema posebnih poteškoća u ručnom izračunavanju ponderisanog prosjeka. Formula za izračunavanje ove vrijednosti u jednoj od najpopularnijih aplikacija sa formulama - Excelu - izgleda kao funkcija SUMPRODUCT (serija brojeva; niz pondera) / SUM (serija pondera).

Kako pronaći prosječnu vrijednost u excelu?

kako pronaći aritmetičku sredinu u excelu?

Vladimir09854

Lako peasy. Da biste pronašli prosječnu vrijednost u excelu, potrebne su vam samo 3 ćelije. U prvom upisujemo jedan broj, u drugom - drugi. I u trećoj ćeliji ćemo postići formulu koja će nam dati prosječnu vrijednost između ova dva broja iz prve i druge ćelije. Ako se ćelija br. 1 zove A1, ćelija br. 2 se zove B1, tada u ćeliju sa formulom morate napisati ovako:

Ova formula izračunava aritmetičku sredinu dva broja.

Za ljepotu naših proračuna, ćelije možemo istaknuti linijama, u obliku ploče.

U samom Excelu postoji i funkcija za određivanje prosječne vrijednosti, ali ja koristim starinski metod i unosim formulu koja mi je potrebna. Dakle, siguran sam da će Excel izračunati tačno onoliko koliko mi treba, i da neće doći do nekakvog sopstvenog zaokruživanja.

M3sergey

To je vrlo lako ako su podaci već uneseni u ćelije. Ako vas samo zanima broj, samo odaberite željeni raspon/opsege, a vrijednost zbira ovih brojeva, njihove aritmetičke sredine i njihovog broja pojavit će se u statusnoj traci dolje desno.

Možete odabrati praznu ćeliju, kliknuti na trokut (padajuća lista) "Autosum" i tamo odabrati "Prosjek", nakon čega ćete se složiti s predloženim rasponom za izračunavanje ili odabrati svoj.

Konačno, formule možete koristiti direktno - kliknite na "Umetni funkciju" pored trake formule i adrese ćelije. Funkcija AVERAGE je u kategoriji "Statistički" i uzima kao argument i brojeve i reference ćelija, itd. Tu možete odabrati i složenije opcije, na primjer, AVERAGEIF - izračunavanje prosjeka po uslovu.

Pronađite prosjek u Excelu je prilično jednostavan zadatak. Ovdje morate razumjeti da li želite da koristite ovu prosječnu vrijednost u nekim formulama ili ne.

Ako trebate dobiti samo vrijednost, tada je dovoljno odabrati traženi raspon brojeva, nakon čega će Excel automatski izračunati prosječnu vrijednost - ona će se prikazati u statusnoj traci, naslov "Prosjek".

U slučaju kada želite koristiti rezultat u formulama, možete učiniti sljedeće:

1) Zbrojite ćelije pomoću funkcije SUM i podijelite sve s brojem brojeva.

2) Ispravnija opcija je korištenje posebne funkcije koja se zove PROSJEČNO. Argumenti ovoj funkciji mogu biti brojevi dati uzastopno ili raspon brojeva.

Vladimir Tikhonov

zaokružite vrijednosti koje će se koristiti u proračunu, kliknite na karticu "Formule", tamo ćete vidjeti "AutoSum" na lijevoj strani i pored njega trokut okrenut prema dolje. kliknite na ovaj trokut i odaberite "Prosjek". Voila, gotovo) na dnu kolone vidjet ćete prosječnu vrijednost :)

Ekaterina Mutalapova

Počnimo od početka i redom. Šta znači prosjek?

Srednja vrijednost je vrijednost koja je aritmetička sredina, tj. izračunava se dodavanjem skupa brojeva, a zatim dijeljenjem ukupnog zbroja brojeva njihovim brojem. Na primjer, za brojeve 2, 3, 6, 7, 2 bit će 4 (zbir brojeva 20 podijeljen je sa njihovim brojem 5)

U Excel tabeli, meni lično, najlakši način je bio da koristim formulu =PROSEK. Da biste izračunali prosječnu vrijednost, potrebno je unijeti podatke u tabelu, upisati funkciju =AVERAGE() ispod stupca podataka, a u zagradama označiti raspon brojeva u ćelijama, naglašavajući kolonu sa podacima. Nakon toga pritisnite ENTER ili jednostavno kliknite lijevom tipkom miša na bilo koju ćeliju. Rezultat će biti prikazan u ćeliji ispod kolone. Na prvi pogled, opis je nerazumljiv, ali u stvari je to pitanje minuta.

Avanturist 2000

Excel program je višestruki, tako da postoji nekoliko opcija koje će vam omogućiti da pronađete prosjek:

Prva opcija. Jednostavno zbrojite sve ćelije i podijelite s njihovim brojem;

Druga opcija. Koristite posebnu naredbu, upišite u potrebnu ćeliju formulu "=PROSJEK (i ovdje navedite raspon ćelija)";

Treća opcija. Ako odaberete traženi raspon, imajte na umu da je na donjoj stranici prikazana i prosječna vrijednost u ovim ćelijama.

Dakle, postoji mnogo načina da pronađete prosječnu vrijednost, samo trebate odabrati najbolji za vas i stalno ga koristiti.

U Excelu, koristeći funkciju AVERAGE, možete izračunati jednostavnu aritmetičku sredinu. Da biste to učinili, morate unijeti određeni broj vrijednosti. Pritisnite jednako i odaberite u kategoriji Statistike, među kojima odaberite funkciju PROSJEČNO



Takođe, koristeći statističke formule, možete izračunati aritmetički ponderisani prosjek, koji se smatra preciznijim. Da bismo ga izračunali, potrebne su nam vrijednosti ​​indikatora i frekvencije.

Kako pronaći prosjek u Excelu?

Situacija je ovakva. Tu je sljedeća tabela:

Kolone zasjenjene crvenom bojom sadrže numeričke vrijednosti ocjena za predmete. U koloni "Prosjek" morate izračunati njihovu prosječnu vrijednost.
Problem je sljedeći: ukupno ima 60-70 objekata i neki od njih su na drugom listu.
Pogledao sam u drugi dokument, prosek je već izračunat, a u ćeliji je formula kao
="ime lista"!|E12
ali to je uradio neki programer koji je dobio otkaz.
Recite mi, molim vas, ko ovo razume.

Hector

U liniju funkcija ubacujete "PROSEK" od predloženih funkcija i birate gde ih treba izračunati (B6: N6) za Ivanova, na primer. Ne znam sigurno za susjedne listove, ali sigurno je ovo sadržano u standardnoj pomoći za Windows

Reci mi kako da izračunam prosječnu vrijednost u Wordu

Recite mi kako da izračunam prosječnu vrijednost u Wordu. Naime, prosječna vrijednost ocjena, a ne broj ljudi koji su ocijenjeni.


Julia pavlova

Word može puno učiniti s makroima. Pritisnite ALT+F11 i napišite makro program.
Pored toga, Insert-Object... će vam omogućiti da koristite druge programe, čak i Excel, za kreiranje lista sa tabelom unutar Word dokumenta.
Ali u ovom slučaju, trebate zapisati svoje brojeve u kolonu tabele i staviti prosjek u donju ćeliju iste kolone, zar ne?
Da biste to učinili, umetnite polje u donju ćeliju.
Insert-Field...-Formula
Sadržaj polja
[=PROSJEK (IZNAD)]
vraća prosjek zbira ćelija iznad.
Ako je polje odabrano i pritisnuta desna tipka miša, onda se može ažurirati ako su se brojevi promijenili,
pogledajte kod ili vrijednost polja, promijenite kod direktno u polju.
Ako nešto pođe po zlu, izbrišite cijelo polje u ćeliji i ponovo ga kreirajte.
PROSJEČNO znači prosjek, IZNAD - oko, odnosno red ćelija iznad.
Sve ovo nisam ni sam znao, ali sam lako pronašao u HELP-u, naravno, malo razmislivši.

U većini slučajeva, podaci su koncentrisani oko neke centralne tačke. Dakle, da bi se opisali bilo koji skup podataka, dovoljno je navesti prosječnu vrijednost. Razmotrite sukcesivno tri numeričke karakteristike koje se koriste za procjenu srednje vrijednosti distribucije: aritmetičku sredinu, medijan i mod.

Prosjek

Aritmetička sredina (koja se često naziva jednostavno srednja vrijednost) je najčešća procjena srednje vrijednosti distribucije. To je rezultat dijeljenja zbroja svih promatranih numeričkih vrijednosti njihovim brojem. Za uzorak brojeva X 1, X 2, ..., Xn, srednja vrijednost uzorka (označena simbolom ) jednako \u003d (X 1 + X 2 + ... + Xn) / n, ili

gdje je srednja vrijednost uzorka, n- veličina uzorka, Xii-ti element uzorci.

Preuzmite bilješku u formatu ili, primjere u formatu

Razmislite o izračunavanju aritmetičke sredine petogodišnjeg prosječnog godišnjeg prinosa 15 investicijskih fondova sa vrlo visoki nivo rizik (slika 1).

Rice. 1. Prosječni godišnji prinos na 15 vrlo rizičnih investicijskih fondova

Srednja vrijednost uzorka se izračunava na sljedeći način:

Ovo je dobar prinos, posebno u poređenju sa povratom od 3-4% koji su štediše banke ili kreditne unije primili u istom vremenskom periodu. Ako sortirate vrijednosti povrata, lako je vidjeti da osam fondova ima prinos iznad, a sedam - ispod prosjeka. Aritmetička sredina djeluje kao ravnotežna tačka, tako da fondovi s niskim prihodima uravnotežuju fondove s visokim prihodima. Svi elementi uzorka su uključeni u izračunavanje prosjeka. Nijedan od ostalih procjenitelja srednje vrijednosti raspodjele nema ovo svojstvo.

Kada izračunati aritmetičku sredinu. Pošto aritmetička sredina zavisi od svih elemenata uzorka, prisustvo ekstremnih vrednosti značajno utiče na rezultat. U takvim situacijama, aritmetička sredina može iskriviti značenje brojčanih podataka. Stoga, kada se opisuje skup podataka koji sadrži ekstremne vrijednosti, potrebno je navesti medijan ili aritmetičku sredinu i medijan. Na primjer, ako se iz uzorka izuzme prinos Fonda za razvoj RS-a, prosjek uzorka prinosa 14 fondova se smanjuje za skoro 1% na 5,19%.

Medijan

Medijan je srednja vrijednost uređenog niza brojeva. Ako niz ne sadrži ponavljajuće brojeve, tada će polovina njegovih elemenata biti manja od, a pola više od medijane. Ako uzorak sadrži ekstremne vrijednosti, bolje je koristiti medijanu umjesto aritmetičke sredine za procjenu srednje vrijednosti. Da bi se izračunao medijan uzorka, prvo se mora sortirati.

Ova formula je dvosmislena. Njegov rezultat ovisi o tome da li je broj paran ili neparan. n:

  • Ako uzorak sadrži neparan broj stavki, medijan je (n+1)/2-th element.
  • Ako uzorak sadrži paran broj elemenata, medijan leži između dva srednja elementa uzorka i jednak je aritmetičkoj sredini izračunatoj za ova dva elementa.

Da bismo izračunali medijan za uzorak od 15 vrlo rizičnih investicijskih fondova, prvo moramo sortirati neobrađene podatke (Slika 2). Tada će medijan biti suprotan broju srednjeg elementa uzorka; u našem primjeru broj 8. Excel ima posebna funkcija=MEDIAN(), koji radi i sa neuređenim nizovima.

Rice. 2. Medijan 15 fondova

Dakle, medijan je 6,5. To znači da polovina veoma rizičnih fondova ne prelazi 6,5, dok druga polovina to čini. Imajte na umu da je medijan od 6,5 nešto veći od medijane od 6,08.

Ako iz uzorka izbacimo profitabilnost fonda RS Emerging Growth, medijan preostalih 14 fondova će se smanjiti na 6,2%, odnosno ne toliko značajno kao aritmetička sredina (slika 3).

Rice. 3. Medijan 14 fondova

Moda

Termin je prvi uveo Pearson 1894. Moda je broj koji se najčešće pojavljuje u uzorku (najmoderniji). Moda dobro opisuje, na primjer, tipičnu reakciju vozača na semafor da zaustavi saobraćaj. Klasičan primjer korištenja mode je izbor veličine proizvedene serije cipela ili boje tapeta. Ako distribucija ima više načina, onda se kaže da je multimodalna ili multimodalna (ima dva ili više "vrhova"). Multimodalnost distribucije daje važna informacija o prirodi varijable koja se proučava. Na primjer, u sociološkim istraživanjima, ako varijabla predstavlja sklonost ili stav prema nečemu, onda multimodalnost može značiti da postoji nekoliko izrazito različitih mišljenja. Multimodalnost je također pokazatelj da uzorak nije homogen i da zapažanja mogu biti generirana pomoću dvije ili više „preklapanih“ distribucija. Za razliku od aritmetičke sredine, outliers ne utiču na mod. Za kontinuirano distribuirane slučajne varijable, kao što su prosječni godišnji prinosi investicijskih fondova, modus ponekad uopće ne postoji (ili nema smisla). Budući da ovi indikatori mogu poprimiti različite vrijednosti, ponavljajuće vrijednosti su izuzetno rijetke.

Kvartili

Kvartili su mjere koje se najčešće koriste za procjenu distribucije podataka kada se opisuju svojstva velikih numeričkih uzoraka. Dok medijan dijeli uređeni niz na pola (50% elemenata niza je manje od medijane, a 50% veće), kvartili razbijaju uređeni skup podataka na četiri dijela. Vrijednosti Q 1 , medijana i Q 3 su 25., 50. i 75. percentil, respektivno. Prvi kvartil Q 1 je broj koji dijeli uzorak na dva dijela: 25% elemenata je manje od, a 75% više od prvog kvartila.

Treći kvartil Q 3 je broj koji također dijeli uzorak na dva dijela: 75% elemenata je manje od, a 25% više od trećeg kvartila.

Za izračunavanje kvartila u verzijama Excel-a prije 2007. korištena je funkcija =QUARTILE(niz, dio). Počevši od Excel 2010, primjenjuju se dvije funkcije:

  • =QUARTILE.ON(niz, dio)
  • =QUARTILE.EXC(niz, dio)

Ove dvije funkcije daju malo različite vrijednosti (slika 4). Na primjer, kada se izračunaju kvartili uzorka koji sadrži podatke o prosječnom godišnjem prinosu 15 vrlo rizičnih investicijskih fondova, Q 1 = 1,8 ili -0,7 za QUARTILE.INC i QUARTILE.EXC, respektivno. Inače, funkcija QUARTILE korištena ranije odgovara modernoj funkciji QUARTILE.ON. Za izračunavanje kvartila u Excelu koristeći gornje formule, niz podataka se može ostaviti neuređenim.

Rice. 4. Izračunajte kvartile u Excelu

Da još jednom naglasimo. Excel može izračunati kvartile za univarijaciju diskretne serije, koji sadrži vrijednosti slučajne varijable. Izračun kvartila za distribuciju zasnovanu na frekvenciji dat je u odeljku ispod.

geometrijska sredina

Za razliku od aritmetičke sredine, geometrijska sredina mjeri koliko se varijabla promijenila tokom vremena. Geometrijska sredina je korijen n stepena od proizvoda n vrijednosti (u Excelu se koristi funkcija = CUGEOM):

G= (X 1 * X 2 * ... * X n) 1/n

Sličan parametar - geometrijska sredina stope povrata - određuje se formulom:

G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

gdje R i- stopa povrata i-th vremenski period.

Na primjer, pretpostavimo da je početna investicija 100 000 USD. Do kraja prve godine padne na 50 000 USD, a do kraja druge godine se oporavlja na prvobitnih 100 000 USD. Stopa povrata na ovu investiciju tokom dvije- godišnji period je jednak 0, pošto su početni i konačni iznos sredstava međusobno jednaki. Međutim, aritmetički prosjek godišnjih stopa prinosa je = (-0,5 + 1) / 2 = 0,25 ili 25%, budući da je stopa prinosa u prvoj godini R 1 = (50.000 - 100.000) / 100.000 = -0.5, i u drugom R 2 = (100.000 - 50.000) / 50.000 = 1. Istovremeno, geometrijska sredina stope prinosa za dvije godine je: G = [(1–0,5) * (1 + 1 )] 1 /2 – 1 = ½ – 1 = 1 – 1 = 0. Dakle, geometrijska sredina preciznije odražava promjenu (tačnije, odsustvo promjene) obima investicija tokom dvogodišnjeg perioda od aritmetičke sredine.

Zanimljivosti. Prvo, geometrijska sredina će uvijek biti manja od aritmetičke sredine istih brojeva. Osim u slučaju kada su svi uzeti brojevi međusobno jednaki. Drugo, s obzirom na svojstva pravougaonog trougla, možete razumjeti zašto se sredina naziva geometrijska. Visina pravokutnog trougla, spuštenog na hipotenuzu, je prosječna proporcionalna između projekcija kateta na hipotenuzu, a svaka kateta je prosječna proporcionalna između hipotenuze i njene projekcije na hipotenuzu (slika 5). Ovo daje geometrijski način konstruisanja geometrijske sredine dva (dužina) segmenta: potrebno je izgraditi krug na zbiru ova dva segmenta kao prečnik, zatim visinu, vraćenu od tačke njihove veze do preseka sa krug, dat će željenu vrijednost:

Rice. 5. Geometrijska priroda geometrijske sredine (slika sa Wikipedije)

Drugo važno svojstvo numeričkih podataka je njihovo varijacija karakterizira stepen disperzije podataka. Dva različita uzorka mogu se razlikovati i u srednjim vrijednostima i u varijacijama. Međutim, kao što je prikazano na sl. 6 i 7, dva uzorka mogu imati istu varijaciju, ali različite srednje vrijednosti, ili istu srednju vrijednost i potpuno različite varijacije. Podaci koji odgovaraju poligonu B na Sl. 7 mijenjaju mnogo manje od podataka iz kojih je izgrađen poligon A.

Rice. 6. Dvije simetrične distribucije u obliku zvona sa istim širenjem i različitim srednjim vrijednostima

Rice. 7. Dvije simetrične distribucije u obliku zvona sa istim srednjim vrijednostima i različitim rasipanjem

Postoji pet procjena varijacije podataka:

obim

Raspon je razlika između najvećeg i najmanjeg elementa uzorka:

Prevucite prstom = XMax-XMin

Opseg uzorka koji sadrži prosječne godišnje prinose 15 vrlo rizičnih investicijskih fondova može se izračunati korištenjem uređenog niza (vidi sliku 4): raspon = 18,5 - (-6,1) = 24,6. To znači da je razlika između najvećeg i najnižeg prosječnog godišnjeg prinosa za vrlo rizične fondove 24,6%.

Opseg mjeri ukupnu rasprostranjenost podataka. Iako je raspon uzorka vrlo jednostavna procjena ukupnog širenja podataka, njegova slabost je u tome što ne uzima u obzir tačno kako su podaci raspoređeni između minimalnih i maksimalnih elemenata. Ovaj efekat je dobro vidljiv na sl. 8 koji ilustruje uzorke koji imaju isti raspon. B skala pokazuje da ako uzorak sadrži barem jednu ekstremnu vrijednost, raspon uzorka je vrlo netačna procjena raspršenosti podataka.

Rice. 8. Poređenje tri uzorka istog opsega; trokut simbolizira potporu ravnoteže, a njegova lokacija odgovara prosječnoj vrijednosti uzorka

Interkvartilni raspon

Interkvartil ili srednji raspon je razlika između trećeg i prvog kvartila uzorka:

Interkvartilni raspon \u003d Q 3 - Q 1

Ova vrijednost omogućava procjenu širenja 50% elemenata i ne uzimajući u obzir uticaj ekstremnih elemenata. Interkvartilni raspon za uzorak koji sadrži podatke o prosječnim godišnjim prinosima 15 vrlo rizičnih investicijskih fondova može se izračunati korištenjem podataka na Sl. 4 (na primjer, za funkciju QUARTILE.EXC): Interkvartilni raspon = 9,8 - (-0,7) = 10,5. Interval između 9,8 i -0,7 često se naziva srednjom polovinom.

Treba napomenuti da vrijednosti Q 1 i Q 3, a time i interkvartilni raspon, ne zavise od prisustva outliera, jer njihov proračun ne uzima u obzir nijednu vrijednost koja bi bila manja od Q 1 ili veća od Q 3 . Ukupne kvantitativne karakteristike, kao što su medijan, prvi i treći kvartil, i interkvartilni raspon, na koje ne utječu outliers, nazivaju se robusnim indikatorima.

Dok raspon i interkvartilni raspon daju procjenu ukupnog i srednjeg raspršenosti uzorka, respektivno, nijedna od ovih procjena ne uzima u obzir tačno kako se podaci distribuiraju. Varijanca i standardna devijacija oslobođeni ovog nedostatka. Ovi indikatori vam omogućavaju da procenite stepen fluktuacije podataka oko srednje vrednosti. Varijanca uzorka je aproksimacija aritmetičke sredine izračunate iz kvadrata razlike između svakog elementa uzorka i srednje vrijednosti uzorka. Za uzorak od X 1 , X 2 , ... X n varijansa uzorka (označena simbolom S 2 data je sljedećom formulom:

Općenito, varijansa uzorka je zbir kvadrata razlika između elemenata uzorka i srednje vrijednosti uzorka, podijeljen s vrijednošću jednakom veličini uzorka minus jedan:

gdje - aritmetička sredina, n- veličina uzorka, X i - i-ti element uzorka X. U Excel-u prije verzije 2007, funkcija =VAR() se koristila za izračunavanje varijanse uzorka, od verzije 2010. koristi se funkcija =VAR.V().

Najpraktičnija i široko prihvaćena procjena rasipanja podataka je standardna devijacija. Ovaj indikator je označen simbolom S i jednak je kvadratni korijen iz varijanse uzorka:

U Excelu prije verzije 2007, funkcija =STDEV() se koristila za izračunavanje standardne devijacije, od verzije 2010 koristi se funkcija =STDEV.B(). Za izračunavanje ovih funkcija, niz podataka može biti neuređen.

Ni varijansa uzorka ni standardna devijacija uzorka ne mogu biti negativni. Jedina situacija u kojoj indikatori S 2 i S mogu biti nula je ako su svi elementi uzorka jednaki. U ovom potpuno nevjerovatnom slučaju, raspon i interkvartilni raspon su također nula.

Numerički podaci su inherentno promjenjivi. Bilo koja varijabla može preuzeti skup različite vrijednosti. Na primjer, različiti zajednički fondovi imaju različiti indikatori profitabilnost i gubitke. Zbog varijabilnosti numeričkih podataka, veoma je važno proučavati ne samo procjene srednje vrijednosti koje su sumativne prirode, već i procjene varijanse koje karakterišu raspršenost podataka.

Varijanca i standardna devijacija nam omogućavaju da procijenimo širenje podataka oko srednje vrijednosti, drugim riječima, da odredimo koliko je elemenata uzorka manje od srednje vrijednosti, a koliko veće. Disperzija ima neka vrijedna matematička svojstva. Međutim, njegova vrijednost je kvadrat jedinice mjere - kvadratni postotak, kvadratni dolar, kvadratni inč itd. Stoga je prirodna procjena varijanse standardna devijacija, koja se izražava u uobičajenim mjernim jedinicama - postocima prihoda, dolarima ili inčima.

Standardna devijacija vam omogućava da procijenite količinu fluktuacije elemenata uzorka oko srednje vrijednosti. U gotovo svim situacijama, većina posmatranih vrijednosti nalazi se unutar plus ili minus jedne standardne devijacije od srednje vrijednosti. Stoga, poznavajući aritmetičku sredinu elemenata uzorka i standardnu ​​devijaciju uzorka, moguće je odrediti interval kojem pripada najveći dio podataka.

Standardna devijacija prinosa na 15 vrlo rizičnih investicijskih fondova iznosi 6,6 (Slika 9). To znači da se profitabilnost najvećeg dijela sredstava razlikuje od prosječne vrijednosti za najviše 6,6% (tj. varira u rasponu od – S= 6,2 – 6,6 = –0,4 do + S= 12,8). Zapravo, ovaj interval sadrži petogodišnji prosječni godišnji prinos od 53,3% (8 od 15) sredstava.

Rice. 9. Standardna devijacija

Imajte na umu da u procesu sabiranja kvadrata razlika, stavke koje su dalje od srednje vrijednosti dobijaju veću težinu od stavki koje su bliže. Ovo svojstvo je glavni razlog zašto se aritmetička sredina najčešće koristi za procjenu sredine distribucije.

Koeficijent varijacije

Za razliku od prethodnih procjena raspršenosti, koeficijent varijacije je relativna procjena. Uvijek se mjeri kao postotak, a ne u izvornim jedinicama podataka. Koeficijent varijacije, označen simbolima CV, mjeri rasipanje podataka oko srednje vrijednosti. Koeficijent varijacije jednak je standardnoj devijaciji podijeljenoj sa aritmetičkom sredinom i pomnoženoj sa 100%:

gdje S- standardna devijacija uzorka, - srednja vrijednost uzorka.

Koeficijent varijacije vam omogućava da uporedite dva uzorka, čiji su elementi izraženi u različitim mjernim jedinicama. Na primjer, menadžer jedne službe za dostavu pošte namjerava unaprijediti vozni park kamiona. Prilikom utovara paketa, postoje dvije vrste ograničenja koja treba uzeti u obzir: težina (u funtama) i zapremina (u kubnim stopama) svakog paketa. Pretpostavimo da je u uzorku od 200 vreća prosječna težina 26,0 funti, standardna devijacija težine 3,9 funti, prosječna zapremina pakovanja 8,8 kubnih stopa, a standardna devijacija zapremine 2,2 kubna stopa. Kako uporediti širinu težine i zapremine pakovanja?

Pošto se jedinice mere za težinu i zapreminu razlikuju jedna od druge, menadžer mora da uporedi relativnu širinu ovih vrednosti. Koeficijent varijacije težine je CV W = 3,9 / 26,0 * 100% = 15%, a koeficijent varijacije zapremine CV V = 2,2 / 8,8 * 100% = 25% . Dakle, relativni raspršivanje volumena paketa je mnogo veće od relativnog raspršenja njihovih težina.

Obrazac za distribuciju

Treće važno svojstvo uzorka je oblik njegove distribucije. Ova raspodjela može biti simetrična ili asimetrična. Da bismo opisali oblik distribucije, potrebno je izračunati njenu srednju vrijednost i medijan. Ako su ove dvije mjere iste, kaže se da je varijabla simetrično raspoređena. Ako je srednja vrijednost varijable veća od medijane, njena distribucija ima pozitivnu asistenciju (slika 10). Ako je medijan veći od srednje vrijednosti, distribucija varijable je negativno iskrivljena. Pozitivna asimetrija se javlja kada se srednja vrijednost poveća na neuobičajeno visoke vrijednosti. Negativna iskrivljenost nastaje kada se srednja vrijednost smanji na neobično male vrijednosti. Varijabla je simetrično raspoređena ako ne poprima nikakve ekstremne vrijednosti ni u jednom smjeru, tako da se velike i male vrijednosti varijable međusobno poništavaju.

Rice. 10. Tri vrste distribucija

Podaci prikazani na A skali imaju negativnu asistenciju. Ova slika prikazuje dugačak rep i lijevu kosinu uzrokovanu neobično malim vrijednostima. Ove izuzetno male vrijednosti pomiču srednju vrijednost ulijevo i ona postaje manja od medijane. Podaci prikazani na skali B raspoređeni su simetrično. Lijeva i desna polovina distribucije su njihove zrcalne slike. Velike i male vrijednosti balansiraju jedna drugu, a srednja vrijednost i medijan su jednaki. Podaci prikazani na skali B imaju pozitivnu asistenciju. Ova slika prikazuje dugačak rep i nagnutost udesno, uzrokovano prisustvom neobično visokih vrijednosti. Ove prevelike vrijednosti pomiču srednju vrijednost udesno i ona postaje veća od medijane.

U Excelu se deskriptivna statistika može dobiti pomoću dodatka Paket analiza. Prođite kroz meni PodaciAnaliza podataka, u prozoru koji se otvori odaberite liniju Deskriptivna statistika i kliknite Uredu. U prozoru Deskriptivna statistika obavezno naznačite interval unosa(Sl. 11). Ako želite da vidite deskriptivnu statistiku na istom listu kao i originalni podaci, izaberite radio dugme izlazni interval i odredite ćeliju u koju želite da postavite gornji lijevi ugao prikazane statistike (u našem primjeru, $C$1). Ako želite da izbacite podatke na novi list ili u novu radnu svesku, jednostavno izaberite odgovarajući radio dugme. Označite polje pored Konačna statistika. Opciono, možete i birati Nivo težine,k-ti najmanji ik-ti najveći.

Ako je na depozit Podaci u regiji Analiza ne vidite ikonu Analiza podataka, prvo morate instalirati dodatak Paket analiza(vidi, na primjer,).

Rice. 11. Deskriptivna statistika petogodišnjih prosječnih godišnjih prinosa sredstava sa vrlo visokim nivoom rizika, izračunata uz pomoć dodatka Analiza podataka Excel programi

Excel izračunava brojne statistike o kojima je bilo riječi: srednja vrijednost, medijana, mod, standardna devijacija, varijansa, raspon ( interval), minimalna, maksimalna i veličina uzorka ( provjeriti). Osim toga, Excel izračunava neke nove statistike za nas: standardnu ​​grešku, eksces i iskrivljenost. standardna greška jednaka je standardnoj devijaciji podijeljenoj s kvadratnim korijenom veličine uzorka. Asimetrija karakterizira odstupanje od simetrije distribucije i predstavlja funkciju koja ovisi o kocki razlika između elemenata uzorka i srednje vrijednosti. Kurtoza je mjera relativne koncentracije podataka oko srednje vrijednosti naspram repova distribucije i ovisi o razlikama između uzorka i srednje vrijednosti podignute na četvrtu potenciju.

Izračunavanje deskriptivne statistike za opću populaciju

Srednja vrijednost, raspršivanje i oblik distribucije o kojoj se gore raspravljalo su karakteristike zasnovane na uzorku. Međutim, ako skup podataka sadrži numerička mjerenja cjelokupne populacije, tada se njegovi parametri mogu izračunati. Ovi parametri uključuju srednju vrijednost, varijansu i standardnu ​​devijaciju populacije.

Očekivana vrijednost jednak je zbroju svih vrijednosti opće populacije podijeljen sa volumenom opće populacije:

gdje µ - očekivana vrijednost, Xi- i-th varijabla opservacija X, N- obim opšte populacije. U Excelu, za izračunavanje matematičkog očekivanja, koristi se ista funkcija kao i za aritmetičku sredinu: =AVERAGE().

Varijanca stanovništva jednak zbiru kvadrata razlika između elemenata opće populacije i mat. očekivanja podijeljena sa veličinom populacije:

gdje σ2 je varijansa opće populacije. Excel prije verzije 2007 koristi funkciju =VAR() za izračunavanje varijanse populacije, počevši od verzije 2010 =VAR.G().

standardna devijacija populacije jednak je kvadratnom korijenu varijanse populacije:

Excel prije verzije 2007 koristi =STDEV() za izračunavanje standardne devijacije populacije, počevši od verzije 2010 =STDEV.Y(). Imajte na umu da se formule za varijansu populacije i standardnu ​​devijaciju razlikuju od formula za varijansu uzorka i standardnu ​​devijaciju. Prilikom izračunavanja statistike uzorka S2 I S imenilac razlomka je n - 1, te prilikom izračunavanja parametara σ2 I σ - obim opšte populacije N.

pravilo

U većini situacija, veliki dio opažanja koncentrisan je oko medijane, formirajući klaster. U skupovima podataka s pozitivnom asimetrijom, ovaj klaster se nalazi lijevo (tj. ispod) matematičkog očekivanja, a u skupovima s negativnom asimetrijom, ovaj klaster se nalazi desno (tj. iznad) matematičkog očekivanja. Simetrični podaci imaju istu srednju vrijednost i medijan, a opažanja se grupišu oko srednje vrijednosti, formirajući distribuciju u obliku zvona. Ako distribucija nema izraženu asimetriju, a podaci su koncentrirani oko određenog centra gravitacije, za procjenu varijabilnosti može se koristiti pravilo palca koje kaže: ako podaci imaju distribuciju u obliku zvona, onda otprilike 68% opservacija je unutar jedne standardne devijacije matematičkog očekivanja, približno 95% zapažanja je unutar dvije standardne devijacije očekivane vrijednosti, a 99,7% zapažanja je unutar tri standardne devijacije očekivane vrijednosti.

Dakle, standardna devijacija, koja je procjena prosječne fluktuacije oko matematičkog očekivanja, pomaže da se razumije kako su opservacije raspoređene i da se identifikuju odstupnici. Iz osnovnog pravila slijedi da se za zvonaste distribucije samo jedna vrijednost od dvadeset razlikuje od matematičkog očekivanja za više od dvije standardne devijacije. Dakle, vrijednosti su izvan intervala µ ± 2σ, mogu se smatrati izvanrednim. Osim toga, samo tri od 1000 opservacija razlikuju se od matematičkog očekivanja za više od tri standardne devijacije. Dakle, vrijednosti su izvan intervala µ ± 3σ su skoro uvek van granica. Za distribucije koje su jako nakrivljene ili nisu u obliku zvona, može se primijeniti Biename-Chebyshev pravilo.

Prije više od stotinu godina, matematičari Bienamay i Chebyshev su nezavisno otkrili korisno svojstvo standardna devijacija. Otkrili su da je za bilo koji skup podataka, bez obzira na oblik distribucije, postotak opažanja koji leže na udaljenosti koja ne prelazi k standardne devijacije od matematičkih očekivanja, ne manje (1 – 1/ 2)*100%.

Na primjer, ako k= 2, pravilo Biename-Chebyshev kaže da najmanje (1 - (1/2) 2) x 100% = 75% opservacija mora ležati u intervalu µ ± 2σ. Ovo pravilo važi za sve k prelazi jedan. Biename-Chebyshev pravilo je vrlo opće prirode i vrijedi za distribucije bilo koje vrste. Označava minimalni broj opservacija, udaljenost od koje do matematičkog očekivanja ne prelazi datu vrijednost. Međutim, ako je distribucija u obliku zvona, pravilo palca preciznije procjenjuje koncentraciju podataka oko srednje vrijednosti.

Izračunavanje deskriptivne statistike za distribuciju zasnovanu na frekvenciji

Ako originalni podaci nisu dostupni, distribucija frekvencija postaje jedini izvor informacija. U takvim situacijama možete izračunati približne vrijednosti kvantitativnih pokazatelja distribucije, kao što su aritmetička sredina, standardna devijacija, kvartili.

Ako su podaci uzorka predstavljeni kao distribucija frekvencije, može se izračunati približna vrijednost aritmetičke sredine, pod pretpostavkom da su sve vrijednosti unutar svake klase koncentrisane u srednja tačka klasa:

gdje - srednja vrijednost uzorka, n- broj zapažanja ili veličina uzorka, od- broj časova u distribuciji frekvencija, mj- srednja tačka j-ti razred, fj- frekvencija koja odgovara j-th class.

Za izračunavanje standardne devijacije od distribucije frekvencije, također se pretpostavlja da su sve vrijednosti unutar svake klase koncentrisane na sredini klase.

Da bismo razumeli kako se kvartili serije određuju na osnovu učestalosti, razmotrimo izračunavanje donjeg kvartila na osnovu podataka za 2013. o raspodeli ruskog stanovništva prema prosečnom novčanom dohotku po glavi stanovnika (slika 12).

Rice. 12. Udio stanovništva Rusije sa novčanim prihodima po glavi stanovnika u prosjeku mjesečno, rubalja

Da biste izračunali prvi kvartil serije varijacija intervala, možete koristiti formulu:

gdje je Q1 vrijednost prvog kvartila, xQ1 je donja granica intervala koji sadrži prvi kvartil (interval je određen akumuliranom frekvencijom, prva prelazi 25%); i je vrijednost intervala; Σf je zbir frekvencija cijelog uzorka; vjerovatno uvijek jednako 100%; SQ1–1 je kumulativna frekvencija intervala koji prethodi intervalu koji sadrži donji kvartil; fQ1 je frekvencija intervala koji sadrži donji kvartil. Formula za treći kvartil se razlikuje po tome što na svim mjestima umjesto Q1 trebate koristiti Q3 i zamijeniti ¾ umjesto ¼.

U našem primeru (Sl. 12), donji kvartil je u opsegu 7000,1 - 10,000, čija je kumulativna frekvencija 26,4%. Donja granica ovog intervala je 7000 rubalja, vrednost intervala je 3000 rubalja, akumulirana frekvencija intervala koji prethodi intervalu koji sadrži donji kvartil je 13,4%, učestalost intervala koji sadrži donji kvartil je 13,0%. Dakle: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13,4) / 13 = 9677 rubalja.

Zamke povezane s deskriptivnom statistikom

U ovoj napomeni pogledali smo kako opisati skup podataka koristeći različite statistike koje procjenjuju njegovu srednju vrijednost, raspršivanje i distribuciju. Sljedeći korak je analiza i interpretacija podataka. Do sada smo proučavali objektivna svojstva podataka, a sada prelazimo na njihovu subjektivnu interpretaciju. Istraživača čekaju dvije greške: pogrešno odabran predmet analize i pogrešna interpretacija rezultata.

Analiza učinka 15 vrlo rizičnih investicijskih fondova prilično je nepristrasna. Doveo je do potpuno objektivnih zaključaka: svi zajednički fondovi imaju različite prinose, raspon prinosa fondova kreće se od -6,1 do 18,5, a prosječan prinos je 6,08. Objektivnost analize podataka je osigurana pravilnim izborom ukupnih kvantitativnih indikatora distribucije. Razmotreno je nekoliko metoda za procjenu srednje vrijednosti i raspršenosti podataka, te su naznačene njihove prednosti i nedostaci. Kako odabrati pravu statistiku koja daje objektivnu i nepristrasnu analizu? Ako je distribucija podataka malo iskrivljena, treba li odabrati medijan umjesto aritmetičke sredine? Koji indikator preciznije karakterizira širenje podataka: standardna devijacija ili raspon? Treba li navesti pozitivnu asistenciju distribucije?

S druge strane, interpretacija podataka je subjektivan proces. Različiti ljudi dolaze do različitih zaključaka, tumačeći iste rezultate. Svako ima svoje gledište. Ukupne prosječne godišnje prinose 15 fondova sa vrlo visokim nivoom rizika neko smatra dobrim i prilično je zadovoljan primljenim prihodima. Drugi mogu misliti da ova sredstva imaju preniske prinose. Dakle, subjektivnost treba nadoknaditi iskrenošću, neutralnošću i jasnoćom zaključaka.

Etička pitanja

Analiza podataka je neraskidivo povezana sa etičkim pitanjima. Treba biti kritičan prema informacijama koje šire novine, radio, televizija i internet. S vremenom ćete naučiti da budete skeptični ne samo prema rezultatima, već i prema ciljevima, predmetu i objektivnosti istraživanja. Čuveni britanski političar Benjamin Disraeli je to najbolje rekao: “Postoje tri vrste laži: laži, proklete laži i statistika”.

Kao što je navedeno u bilješci, etička pitanja se javljaju prilikom odabira rezultata koji bi trebali biti predstavljeni u izvještaju. Treba objaviti i pozitivne i negativne rezultate. Osim toga, prilikom izrade izvještaja ili pisanog izvještaja rezultati moraju biti prikazani iskreno, neutralno i objektivno. Razlikujte loše i nepoštene prezentacije. Da biste to učinili, potrebno je utvrditi koje su bile namjere govornika. Ponekad govornik izostavi važne informacije iz neznanja, a ponekad namjerno (na primjer, ako koristi aritmetičku sredinu da procijeni srednju vrijednost jasno iskrivljenih podataka kako bi dobio željeni rezultat). Takođe je nepošteno potiskivati ​​rezultate koji ne odgovaraju gledištu istraživača.

Korišteni su materijali iz knjige Levin i dr. Statistika za menadžere. - M.: Williams, 2004. - str. 178–209

Funkcija QUARTILE je zadržana radi usklađivanja s ranijim verzijama Excela

Dijeli