Sunt aplicabile metode probabilistice și statistice. Metode probabilistice și statistice

În conformitate cu cele trei posibilități principale - luarea deciziilor în condiții de certitudine completă, risc și incertitudine - metodele și algoritmii de luare a deciziilor pot fi împărțiți în trei tipuri principale: analitice, statistice și bazate pe formalizare fuzzy. În fiecare caz specific, metoda de luare a deciziilor este selectată pe baza sarcinii în cauză, a datelor sursă disponibile, a modelelor de probleme disponibile, a mediului decizional, a procesului de luare a deciziilor, a acurateței necesare deciziei și a preferințelor personale ale analistului.

În unele sisteme informatice, procesul de selectare a unui algoritm poate fi automatizat:

Sistemul automatizat corespunzător are capacitatea de a utiliza multe tipuri diferite de algoritmi (biblioteca de algoritmi);

Sistemul solicită în mod interactiv utilizatorul să răspundă la o serie de întrebări despre principalele caracteristici ale sarcinii luate în considerare;

Pe baza rezultatelor răspunsurilor utilizatorului, sistemul oferă cel mai potrivit (în conformitate cu criteriile specificate în acesta) algoritm din bibliotecă.

2.3.1 Metode probabilistice și statistice de luare a deciziilor

Metodele probabilistic-statistice de luare a deciziilor (PSD) sunt utilizate în cazul în care eficacitatea deciziilor luate depinde de factori care sunt variabile aleatorii pentru care sunt cunoscute legile distribuției probabilităților și alte caracteristici statistice. Mai mult, fiecare decizie poate duce la unul dintre multele rezultate posibile, iar fiecare rezultat are o anumită probabilitate de apariție, care poate fi calculată. Indicatorii care caracterizează o situație problemă sunt descriși și folosind caracteristici probabilistice.Cu un astfel de ZPR, decidentul riscă întotdeauna să obțină un rezultat care nu este cel către care se orientează atunci când alege soluția optimă pe baza caracteristicilor statistice medii ale factorilor aleatori. , adică decizia se ia în condiții de risc.

În practică, metodele probabilistice și statistice sunt adesea utilizate atunci când concluziile extrase din datele eșantionului sunt transferate întregii populații (de exemplu, de la un eșantion la un întreg lot de produse). Cu toate acestea, în fiecare situație specifică, ar trebui mai întâi să se evalueze posibilitatea fundamentală de a obține date probabilistice și statistice suficient de fiabile.

Atunci când se utilizează ideile și rezultatele teoriei probabilităților și statisticii matematice la luarea deciziilor, baza este model matematic, în care relațiile obiective sunt exprimate în termeni de teoria probabilității. Probabilitățile sunt folosite în primul rând pentru a descrie aleatorietatea care trebuie luată în considerare la luarea deciziilor. Aceasta se referă atât la oportunități nedorite (riscuri), cât și la cele atractive („șansa norocoasă”).

Esența metodelor probabilistic-statistice de luare a deciziilor este utilizarea modelelor probabilistice bazate pe estimarea și testarea ipotezelor folosind caracteristicile eșantionului.

Subliniem că logica utilizării caracteristicilor eșantionului pentru a lua decizii pe baza modele teoretice presupune utilizarea simultană a două serii paralele de concepte– legate de teorie (model probabilistic) și legate de practică (eșantionarea rezultatelor observației). De exemplu, probabilitatea teoretică corespunde frecvenței găsite din eșantion. Aşteptările matematice (seria teoretică) corespunde mediei aritmetice eşantionului (seria practică). De obicei, caracteristicile eșantionului sunt estimări ale caracteristicilor teoretice.

Avantajele utilizării acestor metode includ capacitatea de a lua în considerare diferite scenarii pentru desfășurarea evenimentelor și probabilitățile acestora. Dezavantajul acestor metode este că valorile probabilității pentru scenariile utilizate în calcule sunt de obicei foarte greu de obținut în practică.

Aplicarea unei metode decizionale probabilistic-statistice specifice constă în trei etape:

Trecerea de la realitatea economică, managerială, tehnologică la o schemă abstractă matematică și statistică, i.e. construirea unui model probabilistic al unui sistem de control, proces tehnologic, procedură de luare a deciziilor, în special pe baza rezultatelor controlului statistic etc.

Efectuarea de calcule și tragerea de concluzii folosind mijloace pur matematice în cadrul unui model probabilistic;

Interpretarea concluziilor matematice și statistice în raport cu o situație reală și luarea unei decizii adecvate (de exemplu, cu privire la conformitatea sau nerespectarea calității produsului cu cerințele stabilite, necesitatea ajustării procesului tehnologic etc.), în special, concluzii (cu privire la proporția de unități defecte de produs într-un lot, asupra formei specifice a legilor de distribuție a parametrilor controlați ai procesului tehnologic etc.).

Un model probabilistic al unui fenomen real ar trebui considerat construit dacă mărimile luate în considerare și conexiunile dintre ele sunt exprimate în termeni de teoria probabilității. Adecvarea modelului probabilistic este fundamentată, în special, folosind metode statistice de testare a ipotezelor.

Pe baza tipului de problemă rezolvată, statistica matematică este de obicei împărțită în trei secțiuni: descrierea datelor, estimarea și testarea ipotezelor. Pe baza tipului de date statistice prelucrate, statistica matematică este împărțită în patru domenii:

Statistica univariată (statistica variabilelor aleatoare), în care rezultatul unei observații este descris printr-un număr real;

Analiza statistică multivariată, în care rezultatul observării unui obiect este descris prin mai multe numere (vector);

Statistica proceselor aleatoare și a seriilor de timp, unde rezultatul observației este o funcție;

Statistica obiectelor de natură nenumerică, în care rezultatul unei observații este de natură nenumerică, de exemplu, este o mulțime (o figură geometrică), o ordonare sau obținută ca urmare a unei măsurători bazate pe un criteriu calitativ.

Un exemplu când se recomandă utilizarea modelelor probabilistic-statistice.

Atunci când se controlează calitatea oricărui produs, o probă este selectată din acesta pentru a decide dacă lotul de produse care se produce îndeplinește cerințele stabilite. Pe baza rezultatelor controlului probei, se face o concluzie despre întregul lot. În acest caz, este foarte important să se evite subiectivitatea atunci când se formează o probă, adică este necesar ca fiecare unitate de produs din lotul controlat să aibă aceeași probabilitate de a fi selectată pentru probă. Selecția pe bază de lot într-o astfel de situație nu este suficient de obiectivă. Prin urmare, în condiții de producție, selecția unităților de produs pentru eșantion se realizează de obicei nu prin lot, ci prin tabele speciale de numere aleatorii sau folosind senzori de numere aleatoare de calculator.

În reglementarea statistică a proceselor tehnologice, pe baza metodelor statisticii matematice, se elaborează reguli și planuri pentru controlul proceselor statistice, care vizează detectarea în timp util a problemelor din procesele tehnologice și luarea de măsuri pentru ajustarea acestora și prevenirea eliberării produselor care nu îndeplini cerințele stabilite. Aceste măsuri vizează reducerea costurilor de producție și a pierderilor din furnizarea de unități de calitate scăzută. În timpul controlului statistic de acceptare, pe baza metodelor statisticii matematice, se elaborează planuri de control al calității prin analiza probelor din loturile de produse. Dificultatea constă în a putea construi corect modele probabilistic-statistice de luare a deciziilor, pe baza cărora să se răspundă la întrebările puse mai sus. În statistica matematică au fost dezvoltate în acest scop modele probabilistice și metode de testare a ipotezelor3.

În plus, într-o serie de situații manageriale, de producție, economice și economice naționale, apar probleme de alt tip - probleme de evaluare a caracteristicilor și parametrilor distribuțiilor probabilităților.

Sau, atunci când se analizează statistic acuratețea și stabilitatea proceselor tehnologice, este necesar să se evalueze astfel de indicatori de calitate precum valoarea medie a parametrului controlat și gradul de împrăștiere a acestuia în procesul luat în considerare. Conform teoriei probabilităților, ca valoare medie variabilă aleatorie Este recomandabil să se folosească așteptările sale matematice și ca o caracteristică statistică a răspândirii - dispersie, abatere standard sau coeficient de variație. Aceasta ridică întrebarea: cum să estimați aceste caracteristici statistice din datele eșantionului și cu ce precizie se poate face acest lucru? Există multe exemple similare în literatură. Toate arată cum teoria probabilității și statistica matematică pot fi utilizate în managementul producției atunci când se iau decizii în domeniul managementului statistic al calității produselor.

În domenii specifice de aplicare se folosesc atât metode probabilistice, cât și statistice de aplicare generală, cât și cele specifice. De exemplu, în secțiunea de management al producției dedicată metodelor statistice de management al calității produselor, sunt utilizate statistici matematice aplicate (inclusiv proiectarea experimentelor). Folosind metodele sale, se realizează analiza statistică a acurateței și stabilității proceselor tehnologice și evaluarea statistică a calității. Metodele specifice includ metode de control statistic al acceptării calității produselor, reglementarea statistică a proceselor tehnologice, evaluarea și controlul fiabilității etc.

În managementul producției, în special, atunci când se optimizează calitatea produsului și se asigură respectarea cerințelor standard, este deosebit de important să se aplice metode statistice în etapa inițială a ciclului de viață al produsului, de exemplu. în stadiul cercetării pregătirea dezvoltărilor de proiectare experimentală (dezvoltarea cerințelor de produs promițătoare, proiectare preliminară, specificații tehnice pentru dezvoltarea designului experimental). Acest lucru se datorează informațiilor limitate disponibile în etapa inițială a ciclului de viață al produsului și necesității de a prezice capacitățile tehnice și situația economică pentru viitor.

Cele mai comune metode statistice probabilistice sunt analiza de regresie, analiza factorială, analiza varianței, metodele statistice de evaluare a riscurilor, metoda scenariilor etc. Toate valoare mai mare dobândește domeniul metodelor statistice consacrat analizei datelor statistice de natură nenumerică, i.e. rezultate de măsurare pe baza unor caracteristici calitative și diferite. Una dintre principalele aplicații ale statisticii obiectelor de natură nenumerică este teoria și practica expertizelor legate de teoria deciziilor statistice și a problemelor de vot.

Rolul unei persoane atunci când rezolvă probleme folosind metodele teoriei soluțiilor statistice este de a enunța problema, adică de a reduce o problemă reală la cea standard corespunzătoare, de a determina probabilitățile evenimentelor pe baza datelor statistice și, de asemenea, de a aproba soluția optimă rezultată.

Partea 1. Fundamentul statisticii aplicate

1.2.3. Esența metodelor probabilistic-statistice de luare a deciziilor

Cum sunt abordările, ideile și rezultatele teoriei probabilităților și statisticii matematice utilizate în luarea deciziilor?

Baza este un model probabilistic al unui fenomen sau proces real, i.e. un model matematic în care relaţiile obiective sunt exprimate în termeni de teoria probabilităţilor. Probabilitățile sunt folosite în primul rând pentru a descrie incertitudinile care trebuie luate în considerare la luarea deciziilor. Aceasta se referă atât la oportunități nedorite (riscuri), cât și la cele atractive („șansa norocoasă”). Uneori, aleatorietatea este introdusă în mod deliberat într-o situație, de exemplu, la tragere la sorți, la selectarea aleatorie a unităților pentru control, la desfășurarea loteriei sau la efectuarea de sondaje ale consumatorilor.

Teoria probabilității permite utilizarea unei probabilități pentru a calcula altele de interes pentru cercetător. De exemplu, folosind probabilitatea de a obține o stemă, puteți calcula probabilitatea ca în 10 aruncări de monede să obțineți cel puțin 3 steme. Un astfel de calcul se bazează pe un model probabilistic, conform căruia aruncările de monede sunt descrise printr-un model de încercări independente; în plus, stema și semnele hash sunt la fel de posibile și, prin urmare, probabilitatea fiecăruia dintre aceste evenimente este egală. la ½. Un model mai complex este cel care are în vedere verificarea calității unei unități de producție în loc să arunce o monedă. Modelul probabilistic corespunzător se bazează pe presupunerea că controlul calității diferitelor unități de producție este descris printr-o schemă de testare independentă. Spre deosebire de modelul de aruncare a monedelor, este necesar să se introducă un nou parametru - probabilitatea R că produsul este defect. Modelul va fi pe deplin descris dacă presupunem că toate unitățile de producție au aceeași probabilitate de a fi defecte. Dacă ultima ipoteză este incorectă, atunci numărul parametrilor modelului crește. De exemplu, puteți presupune că fiecare unitate de producție are propria probabilitate de a fi defectă.

Să discutăm despre un model de control al calității cu o probabilitate de defectivitate comună tuturor unităților de producție R. Pentru a „a ajunge la număr” atunci când se analizează modelul, este necesar să se înlocuiască R la o anumită valoare. Pentru a face acest lucru, este necesar să trecem dincolo de modelul probabilistic și să apelăm la datele obținute în timpul controlului calității. Statistica matematică rezolvă problema inversă în raport cu teoria probabilității. Scopul său este, pe baza rezultatelor observațiilor (măsurători, analize, teste, experimente), de a obține concluzii despre probabilitățile care stau la baza modelului probabilistic. De exemplu, pe baza frecvenței de apariție a produselor defecte în timpul inspecției, se pot trage concluzii despre probabilitatea defectiunii (vezi teorema lui Bernoulli mai sus). Pe baza inegalității lui Chebyshev, s-au tras concluzii cu privire la corespondența frecvenței de apariție a produselor defecte cu ipoteza că probabilitatea defectiunii ia o anumită valoare.

Astfel, aplicarea statisticii matematice se bazează pe un model probabilistic al unui fenomen sau proces. Sunt utilizate două serii paralele de concepte - cele legate de teorie (model probabilistic) și cele legate de practică (eșantionarea rezultatelor observației). De exemplu, probabilitatea teoretică corespunde frecvenței găsite din eșantion. Aşteptările matematice (seria teoretică) corespunde mediei aritmetice eşantionului (seria practică). De regulă, caracteristicile eșantionului sunt estimări ale celor teoretice. În același timp, cantitățile legate de seria teoretică „sunt în capul cercetătorilor”, se referă la lumea ideilor (conform filosofului grec antic Platon) și nu sunt disponibile pentru măsurare directă. Cercetătorii au doar date eșantion cu care încearcă să stabilească proprietățile unui model probabilistic teoretic care îi interesează.

De ce avem nevoie de un model probabilistic? Cert este că numai cu ajutorul lui proprietățile stabilite din analiza unui eșantion anume pot fi transferate altor probe, precum și întregii așa-zise populații generale. Termenul „populație” este folosit atunci când se referă la o colecție mare, dar finită de unități studiate. De exemplu, despre totalitatea tuturor rezidenților Rusiei sau totalitatea tuturor consumatorilor de cafea instant din Moscova. Scopul anchetelor de marketing sau sociologice este de a transfera afirmațiile obținute dintr-un eșantion de sute sau mii de oameni către populații de câteva milioane de oameni. În controlul calității, un lot de produse acționează ca o populație generală.

Pentru a transfera concluziile de la un eșantion la o populație mai mare necesită unele ipoteze despre relația dintre caracteristicile eșantionului cu caracteristicile acestei populații mai mari. Aceste ipoteze se bazează pe un model probabilistic adecvat.

Desigur, este posibil să se prelucreze date eșantionului fără a utiliza unul sau altul model probabilistic. De exemplu, puteți calcula o medie aritmetică eșantion, puteți număra frecvența de îndeplinire a anumitor condiții etc. Cu toate acestea, rezultatele calculului se vor referi doar la un eșantion specific; transferul concluziilor obținute cu ajutorul lor către orice altă populație este incorect. Această activitate este uneori numită „analiza datelor”. Comparativ cu metodele probabilistic-statistice, analiza datelor are valoare educațională limitată.

Deci, utilizarea modelelor probabilistice bazate pe estimarea și testarea ipotezelor folosind caracteristicile eșantionului este esența metodelor probabilistic-statistice de luare a deciziilor.

Subliniem că logica utilizării caracteristicilor eșantionului pentru luarea deciziilor bazate pe modele teoretice presupune utilizarea simultană a două serii paralele de concepte, dintre care una corespunde modelelor probabilistice, iar a doua eșantionării datelor. Din păcate, într-o serie de surse literare, de obicei învechite sau scrise în spirit de rețetă, nu se face distincție între eșantion și caracteristicile teoretice, ceea ce duce cititorii la confuzii și erori în utilizarea practică a metodelor statistice.

Anterior

Fenomenele vieții, ca toate fenomenele lumii materiale în general, au două laturi indisolubil legate: calitative, percepute direct de simțuri, și cantitative, exprimate în numere folosind numărarea și măsurarea.

La studierea diferitelor fenomene naturale, se folosesc simultan atât indicatori calitativi, cât și cantitativi. Fără îndoială că numai în unitatea aspectelor calitative și cantitative se dezvăluie cel mai pe deplin esența fenomenelor studiate. Cu toate acestea, în realitate trebuie să folosiți unul sau alți indicatori.

Nu există nicio îndoială că metodele cantitative, ca mai obiective și mai precise, au un avantaj față de caracteristicile calitative ale obiectelor.

Rezultatele măsurătorii în sine, deși au valoare cunoscută, sunt încă insuficiente pentru a trage concluziile necesare din acestea. Datele digitale colectate în timpul testării în masă sunt doar material brut care necesită o prelucrare matematică adecvată. Fără prelucrarea - organizarea și sistematizarea datelor digitale, nu este posibilă extragerea informațiilor conținute în acestea, evaluarea fiabilității indicatorilor individuali de sinteză și verificarea fiabilității diferențelor observate între aceștia. Acest lucru necesită specialiști să aibă anumite cunoștințe și capacitatea de a rezuma și analiza corect datele experimentale. Sistemul acestor cunoștințe constituie conținutul statisticii - știință care se ocupă în principal cu analiza rezultatelor cercetării în domeniile teoretic și aplicativ ale științei.

Trebuie avut în vedere că statistica matematică și teoria probabilității sunt științe pur teoretice și abstracte; ei studiază agregatele statistice fără a ține seama de specificul elementelor lor constitutive. Metodele statisticii matematice și teoria probabilității care stau la baza sunt aplicabile într-o mare varietate de domenii de cunoaștere, inclusiv în științe umaniste.

Studiul fenomenelor se desfășoară nu pe baza observațiilor individuale, care se pot dovedi a fi aleatorii, atipice și care exprimă incomplet esența unui anumit fenomen, ci pe un set de observații omogene, care oferă mai multe informatii complete despre obiectul studiat. Un anumit set de obiecte relativ omogene, unite după una sau alta caracteristică pentru studiul comun, se numește statistic

ca un intreg, per total. O populație reunește un anumit număr de observații sau înregistrări omogene.

Elementele care alcătuiesc o colecție se numesc membrii acesteia, sau variante . Opțiuni– acestea sunt observații individuale sau valori numerice ale unei caracteristici. Deci, dacă notăm o caracteristică cu X (mare), atunci valorile sau variantele acesteia vor fi notate cu x (mic), adică. x 1, x 2 etc.

Numărul total de opțiuni incluse într-o anumită populație se numește volumul acesteia și este notat cu litera n (mică).

Atunci când întregul set de obiecte omogene în ansamblu este supus unui sondaj, se numește totalitate generală, generală.Un exemplu de acest tip de descriere continuă a unei totalități pot fi recensămintele naționale ale populației, înregistrările statistice universale ale animalelor din țară. Desigur, un studiu complet al populației generale oferă cele mai complete informații despre starea și proprietățile acesteia. Prin urmare, este firesc ca cercetătorii să se străduiască să combine cât mai multe observații într-o totalitate.

Cu toate acestea, în realitate este rareori necesar să se chestioneze toți membrii populației. În primul rând, pentru că această muncă necesită mult timp și muncă și, în al doilea rând, nu este întotdeauna fezabilă din mai multe motive și circumstanțe diferite. Deci, în loc de un sondaj complet al populației generale, de obicei este studiată o parte a acesteia, care se numește populație eșantion sau eșantion. Reprezintă eșantionul după care este judecată întreaga populație în ansamblu. De exemplu, pentru a afla înălțimea medie a populației conscriși dintr-o anumită regiune sau district, nu este deloc necesar să se măsoare toți conscrișii care trăiesc într-o anumită zonă, dar este suficient să se măsoare o parte din ei.

1. Eșantionul trebuie să fie complet reprezentativ sau tipic, adică astfel încât să includă predominant acele opțiuni care reflectă cel mai pe deplin populația generală. Prin urmare, pentru a începe procesarea datelor eșantion, acestea sunt revizuite cu atenție și opțiunile clar atipice sunt eliminate. De exemplu, atunci când se analizează costul produselor fabricate de o întreprindere, costul în acele perioade în care întreprinderea nu a fost complet furnizată cu componente sau materii prime ar trebui exclus.

2. Eșantionul trebuie să fie obiectiv. Când formați un eșantion, nu puteți acționa arbitrar, includeți numai acele opțiuni care par tipice și renunțați la toate celelalte. Un eșantion de bună calitate se realizează fără noțiuni preconcepute, folosind metoda tragerii la sorți sau a loteriei, atunci când niciuna dintre opțiunile din populația generală nu prezintă avantaje față de celelalte - de a fi inclusă sau de a nu fi inclusă în populația eșantionului. Cu alte cuvinte, eșantionul trebuie făcut după principiul selecției aleatorii, fără a influența compoziția sa.

3. Proba trebuie să fie omogenă calitativ. Nu puteți include în același eșantion date obținute în condiții diferite, de exemplu, costul produselor obținute cu un număr diferit de angajați.

6.2. Gruparea rezultatelor observației

De obicei, rezultatele experimentelor și observațiilor sunt înregistrate sub formă de numere pe fișe sau un jurnal și, uneori, pur și simplu pe foi de hârtie - se obține o declarație sau un registru. Astfel de documente inițiale, de regulă, conțin informații nu despre una, ci despre mai multe caracteristici asupra cărora s-au făcut observații. Aceste documente servesc ca sursă principală a populației eșantionului. Acest lucru se face de obicei astfel: pe o foaie de hârtie separată de documentul primar, de exemplu. indexul cardului, jurnalul sau declarația, se notează valorile numerice ale caracteristicii din care se formează populația. Opțiunile dintr-un astfel de set sunt de obicei prezentate sub forma unei mase amestecate de numere. Prin urmare, primul pas către procesarea unui astfel de material este comandarea, sistematizarea acestuia - gruparea opțiunilor în tabele statistice sau rânduri.

Una dintre cele mai comune forme de grupare a datelor eșantionului sunt tabelele statistice. Ele au o valoare ilustrativă, arătând unele rezultate generale, poziţia elementelor individuale într-o serie generală de observaţii.

O altă formă de grupare primară a datelor eșantionului este metoda de clasare, adică aranjarea opțiunii într-o anumită ordine - în funcție de valorile crescătoare sau descrescătoare ale caracteristicii. Rezultatul este o așa-numită serie clasată, care arată în ce limite și cum variază o anumită caracteristică. De exemplu, există un eșantion din următoarea compoziție:

5,2,1,5,7,9,3,5,4,10,4,5,7,3,5, 9,4,12,7,7

Se poate observa că semnul variază de la 1 la 12 unități. Aranjam optiunile in ordine crescatoare:

1,2,3,3,4,4,4,5,5,5,5,7,7,7,7,9,9,10,12.,

Rezultatul a fost o serie clasificată de valori ale caracteristicii diferite.

Este clar că metoda de clasare, așa cum este prezentată aici, este aplicabilă numai eșantioanelor mici. La un numar mare ierarhizarea observaţiilor este dificilă, deoarece rândul se dovedește a fi atât de lung încât își pierde sensul.

Cu un număr mare de observații, se obișnuiește să se ierarhească populația eșantion sub forma unui rând dublu, adică. indicând frecvența sau repetabilitatea variantelor individuale ale seriei clasate. O astfel de serie dublă de valori clasate ale unei caracteristici se numește serie de variații sau serie de distribuție. Cel mai simplu exemplu de serie de variații pot fi datele clasate mai sus, dacă sunt aranjate după cum urmează:

Valori caracteristice

(opțiuni) 1 2 3 4 5 7 9 10 12

repetabilitate

(opțional) frecvențe 1 1 2 3 5 4 2 1 1

Seria de variații arată frecvența cu care apar variantele individuale într-o anumită populație, modul în care sunt distribuite, ceea ce este de mare importanță, permițând să se judece modelul de variație și gama de variație a caracteristicilor cantitative. Construcția seriilor de variație facilitează calcularea indicatorilor totali - media aritmetică și opțiunile de dispersie sau dispersie în jurul valorii medii a acestora - indicatori care caracterizează orice populație statistică.

Există două tipuri de serie de variații: discontinue și continue. O serie de variații discontinue se obține prin distribuirea unor cantități discrete, care includ caracteristici de numărare. Dacă caracteristica variază continuu, i.e. poate lua orice valori de la varianta minimă până la cea maximă a populației, apoi aceasta din urmă este distribuită într-o serie de variații continue.

Pentru a construi o serie de variații a unei trăsături care variază discret, este suficient să aranjați întregul set de observații sub forma unei serii clasificate, indicând frecvențele opțiunilor individuale. Ca exemplu, oferim date care arată distribuția dimensiunilor a 267 de părți (Tabelul 5.4)

Tabelul 6.1. Distribuția pieselor după dimensiune.

Pentru a construi o serie variațională de caracteristici care variază continuu, trebuie să împărțiți întreaga variație de la opțiunea minimă la maximă în grupuri sau intervale separate (de la-la), numite clase și apoi să distribuiți toate opțiunile din populație în aceste clase. . Rezultatul va fi o serie de variații duble, în care frecvențele nu se mai referă la opțiuni specifice individuale, ci la întregul interval, adică. Se pare că frecvențele nu sunt o opțiune, ci clase.

Defalcarea variației totale în clase se realizează pe scara intervalului de clasă, care trebuie să fie aceeași pentru toate clasele seriei de variații. Valoarea intervalului de clasă se notează cu i (din cuvântul intervalum - interval, distanță); este determinat de următoarea formulă

, (6.1)

unde: i – interval de clasă, care este luat ca număr întreg;

- optiuni de esantionare maxima si minima;

lg.n este logaritmul numărului de clase în care este împărțită populația eșantion.

Numărul de clase este stabilit în mod arbitrar, dar ținând cont de faptul că numărul de clase este oarecum dependent de dimensiunea eșantionului: cu cât dimensiunea eșantionului este mai mare, cu atât ar trebui să existe mai multe clase și invers - cu dimensiuni mai mici ale eșantionului, un ar trebui luate un număr mai mic de clase. Experiența a arătat că, chiar și în eșantioane mici, atunci când este necesară gruparea opțiunilor sub forma unei serii de variații, nu ar trebui să se stabilească mai puțin de 5-6 clase. Dacă există 100-150 de opțiuni, numărul de clase poate fi mărit la 12-15. Dacă setul constă din 200-300 de opțiuni, atunci este împărțit în 15-18 clase etc. Desigur, aceste recomandări sunt foarte condiționate și nu pot fi acceptate ca o regulă stabilită.

La împărțirea în clase în fiecare caz specific, trebuie să se țină seama de o serie de circumstanțe diferite, asigurându-se că prelucrarea materialului statistic oferă cele mai precise rezultate.

După ce intervalul de clasă a fost stabilit și populația eșantion este împărțită în clase, variantele sunt afișate în clase și se determină numărul de variații (frecvențe) ale fiecărei clase. Rezultatul este o serie de variații în care frecvențele nu se referă la opțiuni individuale, ci la anumite clase. Suma tuturor frecvențelor seriei de variații trebuie să fie egală cu dimensiunea eșantionului, adică

(6.2)

Unde:
- semnul de însumare;

p – frecventa.

n – dimensiunea eșantionului.

Dacă nu există o astfel de egalitate, atunci a fost făcută o eroare la postarea opțiunii pe clasă, care trebuie corectată.

De obicei, pentru a posta o opțiune după clasă, se alcătuiește un tabel auxiliar, care are patru coloane: 1) clase pentru o anumită caracteristică (de la - la); 2) – valoarea medie a claselor, 3) afișarea variantelor pe clasă, 4) frecvențele clasei (vezi Tabelul 6.2.)

Postarea unei opțiuni la cursuri necesită multă atenție. Nu ar trebui să fie permis ca aceeași opțiune să fie marcată de două ori sau ca aceleași opțiuni să se încadreze în clase diferite. Pentru a evita greșelile la distribuirea opțiunilor între clase, se recomandă să nu căutați opțiuni identice în agregat, ci să le distribuiți între clase, ceea ce nu este același lucru. Ignorarea acestei reguli, care se întâmplă în munca cercetătorilor fără experiență, necesită mult timp la postarea opțiunilor și, cel mai important, duce la erori.

Tabelul 6.2. Opțiune de postare pe clasă

Limitele clasei

Mediile clasei (x)

Frecvențe de clasă (p), %

absolut

relativ

După ce am terminat de postat variantele și de numărat numărul acestora pentru fiecare clasă, obținem o serie de variații continue. Trebuie transformat într-o serie de variații intermitente. Pentru a face acest lucru, după cum sa menționat deja, luăm jumătățile de sume ale valorilor extreme ale claselor. De exemplu, valoarea mediană a primei clase de 8,8 se obține după cum urmează:

(8,6+9,0):2=8,8.

A doua valoare (9.3) a acestei coloane este calculată într-un mod similar:

(9,01+9,59):2=9,3 etc.

Rezultatul este o serie de variații intermitente care arată distribuția în funcție de caracteristica studiată (Tabelul 6.3.)

Tabelul 6.3. Seria de variații

Gruparea datelor eșantionului sub forma unei serii de variații are un scop dublu: în primul rând, ca operație auxiliară, este necesară la calcularea indicatorilor totali, iar în al doilea rând, seriile de distribuție arată modelul de variație a caracteristicilor, ceea ce este foarte important. Pentru a exprima mai clar acest model, se obișnuiește să se descrie grafic serii de variații sub forma unei histograme (Fig. 6.1.)


Fig. 6.1.Repartizarea întreprinderilor după numărul de salariați

diagramă cu bare înfățișează distribuția unei variante cu variație continuă a caracteristicii. Dreptunghiurile corespund claselor, iar înălțimea acestora corespunde numărului de opțiuni conținute în fiecare clasă. Dacă coborâți perpendicularele de la punctele mijlocii ale vârfurilor dreptunghiurilor histogramei pe axa absciselor și apoi conectați aceste puncte între ele, obțineți un grafic de variație continuă, numit poligon sau densitate de distribuție.

Metode de modelare probabilistic-statistică sisteme economice


Introducere


Problema identificării legii distribuției unei variabile aleatoare observate (identificarea structural-parametrică), de regulă, este înțeleasă ca problema alegerii unui model parametric al legii distribuției probabilităților care se potrivește cel mai bine cu rezultatele observațiilor experimentale. Erorile aleatorii în instrumentele de măsură nu se supun foarte des legii normale, mai precis, ele nu sunt atât de des descrise bine de model legea normală. Instrumentele și sistemele de măsurare se bazează pe diverse principii fizice, diverse metode măsurători și diverse conversii ale semnalelor de măsurare. Erorile de masurare ca marimi sunt o consecinta a influentei multor factori, aleatori si nealeatori, actionand constant sau episodic. Prin urmare, este clar că numai dacă sunt îndeplinite anumite condiții prealabile (teoretice și tehnice), erorile de măsurare sunt descrise destul de bine de modelul de lege normal.

În general, trebuie înțeles că adevărata lege a distribuției (dacă există, desigur), care descrie erorile unui anumit sistem de măsurare, rămâne (va rămâne) necunoscută, în ciuda tuturor încercărilor noastre de a-l identifica. Pe baza datelor de măsurare și a considerațiilor teoretice, putem selecta doar un model probabilist care, într-un anumit sens, apropie cel mai bine această lege adevărată. Dacă modelul construit este adecvat, adică criteriile aplicate nu oferă motive pentru respingerea lui, atunci pe baza acestui model putem calcula toate caracteristicile probabilistice ale componentei aleatorii a erorii instrumentului de măsurare care prezintă interes pentru noi, care va diferi de valorile adevărate numai datorită posibilei componente sistematice (neobservabile sau neînregistrate) a erorii de măsurare. Micimea lui caracterizează corectitudinea măsurătorilor. Setul de legi posibile de distribuție a probabilității care pot fi utilizate pentru a descrie variabilele aleatoare observate este nelimitat. Nu are sens să stabilim scopul problemei de identificare pentru a găsi adevărata lege de distribuție a mărimii observate. Putem rezolva doar problema alegerii celui mai bun model dintr-un anumit set. De exemplu, din acel set de legi parametrice și familii de distribuții care sunt utilizate în aplicații și referințe la care pot fi găsite în literatură.

Abordarea clasică a identificării structural-parametrice a legii distribuției. Prin abordarea clasică înțelegem un algoritm de alegere a unei legi de distribuție, bazat în întregime pe aparatul statisticii matematice.


1. Concepte de bază despre evenimente aleatorii, cantități și funcții


Am văzut deja că pentru multe experimente nu există diferențe în calcularea probabilităților de evenimente, în timp ce rezultatele elementare din aceste experimente sunt foarte diferite. Dar ar trebui să ne intereseze tocmai probabilitățile evenimentelor, și nu structura spațiului rezultatelor elementare. Prin urmare, este timpul să folosiți, de exemplu, numere în toate astfel de experimente „similare” în loc de o varietate de rezultate elementare. Cu alte cuvinte, fiecare rezultat elementar trebuie asociat cu unele numar real, și lucrează numai cu numere.

Să fie dat un spațiu de probabilitate.

Definiția 26.Funcţie numit variabilă aleatorie, dacă pentru orice set Borel o multime de este un eveniment, adică aparține - algebră .

O multime de , constând din acele rezultate elementare , pentru care aparține , se numește preimagine completă a setului.

Nota 9 . În general, lăsați funcția acţionează dintr-un set în mulţime , și dat -algebre Și subseturi Și respectiv. Funcţie numit măsurabile, dacă pentru orice set prototipul său complet aparține .

Nota 10. Cititorul care nu vrea să se deranjeze cu abstracții asociate cu -algebrele evenimentelor și cu măsurabilitate, pot presupune cu siguranță că orice set de rezultate elementare este un eveniment și, prin urmare, o variabilă aleatorie este gratuitfunctia de la V . În practică, acest lucru nu duce la probleme, așa că puteți sări peste totul în această secțiune.

Acum, după ce am scăpat de cititorii necuriosi, să încercăm să înțelegem de ce o variabilă aleatorie are nevoie de măsurare.

Dacă este dată o variabilă aleatorie , ar putea fi nevoie să calculăm probabilitățile formei , , , (și în general probabilități foarte diferite de a intra în seturile Borel pe linie). Acest lucru este posibil numai dacă seturile de sub semnul probabilității sunt evenimente - până la urmă probabilitateexistă o funcție definită numai pe -algebra evenimentelor. Cerința de măsurare este echivalentă cu faptul că pentru orice set Borel probabilitatea este determinată.

Puteți solicita altceva în Definiția 26. De exemplu, pentru ca un eveniment să fie un succes în orice interval: , sau în orice jumătate de interval: .

Să ne asigurăm, de exemplu, că definițiile 26 și 27 sunt echivalente:

Definiția 27. Funcţie se numește variabilă aleatoare dacă pentru orice real o multime de aparține -algebrei .

Dovada echivalența definițiilor 26, 27.

Dacă este o variabilă aleatoare în sensul Definiției 26, atunci va fi o variabilă aleatoare în sensul Definiției 27, deoarece orice interval este un set Borel.

Să demonstrăm că și contrariul este adevărat. Lăsați pentru orice interval Terminat . Trebuie să dovedim că același lucru este valabil pentru orice seturi Borel.

Să strângem din belșug toate subseturile liniei reale ale căror prototipuri sunt evenimente. O multime de conține deja toate intervalele . Să arătăm acum că setul este -algebră. A-priorie, dacă și numai dacă setul aparține .

1. Să ne asigurăm că . Dar prin urmare .

2. Să ne asigurăm că pentru oricine . Lăsa . Apoi , deoarece - -algebră.

3. Să ne asigurăm că pentru orice . Lăsa pentru toți . Dar - -algebră, prin urmare

Noi am dovedit asta - -algebră și conține toate intervalele de pe linie. Dar - cel mai mic dintre -algebre care conțin toate intervalele de pe linie. Prin urmare, contine: .

Să dăm exemple de funcții măsurabile și nemăsurabile.

Exemplul 25. Aruncă cubul. Lăsa , și două funcții de la V sunt date astfel: , . Nu setat încă -algebră , nu putem vorbi despre măsurabilitate. O funcție măsurabilă în raport cu unii -algebre poate să nu fie la fel pentru altul.

Dacă există un set de toate submulțimile , Acea Și sunt variabile aleatoare, deoarece îi aparține orice set de rezultate elementare , inclusiv sau . Puteți nota corespondența dintre valorile variabilelor aleatoare Și iar probabilitățile iau aceste valori sub formă "tabele de distribuție a probabilității"sau, pe scurt, „tabele de distribuție”:

Aici .


2. Lasă -algebra evenimentelor este format din patru seturi:



acestea. Un eveniment este, pe lângă evenimentele de încredere și imposibile, pierderea unui număr par sau impar de puncte. Să ne asigurăm că cu un astfel de relativ sărac -algebră sau , nici nu sunt variabile aleatoare pentru că sunt nemăsurabile. Sa spunem, . Noi vedem asta


2. Caracteristicile numerice ale variabilelor aleatoare


Valorea estimata.Așteptările matematice ale unei variabile aleatoare discrete X, luând un număr finit de valori xi cu probabilități pi, este suma:


(6a)


Așteptarea matematică a unei variabile aleatoare continue X este integrala produsului dintre valorile sale x și densitatea distribuției probabilităților f(x):


(6b)


Se presupune că integrala improprie (6b) este absolut convergentă (altfel spunem că așteptarea matematică M(X) nu există). Aşteptarea matematică caracterizează valoarea medie a variabilei aleatoare X. Dimensiunea acesteia coincide cu dimensiunea variabilei aleatoare. Proprietăți așteptări matematice:



Dispersia.Varianta unei variabile aleatoare X este numărul:



Dispersia este o caracteristică a dispersării valorilor unei variabile aleatoare X în raport cu valoarea sa medie M (X). Dimensiunea varianței este egală cu dimensiunea variabilei aleatoare la pătrat. Pe baza definițiilor varianței (8) și a așteptărilor matematice (5) pentru o variabilă aleatoare discretă și (6) pentru o variabilă aleatoare continuă, obținem expresii similare pentru varianță:



Aici m = M (X).

Proprietăți de dispersie:


(10)


Deviație standard:


(11)


Deoarece abaterea standard are aceeași dimensiune ca o variabilă aleatoare, este mai des folosită ca măsură de dispersie decât varianță.

Momente de distribuție.Conceptele de așteptare matematică și dispersie sunt cazuri speciale de mai mult concept general pentru caracteristicile numerice ale variabilelor aleatoare – momente de distribuţie. Momentele de distribuție ale unei variabile aleatoare sunt introduse ca așteptări matematice ale unor funcții simple ale unei variabile aleatoare. Astfel, un moment de ordin k relativ la punctul x0 se numește așteptarea matematică M (X - x0) k. Momentele relativ la originea x = 0 se numesc momente inițiale și se notează:


(12)


Momentul inițial de ordinul întâi este centrul distribuției variabilei aleatoare luate în considerare:


(13)


Momentele relativ la centrul distribuției x = m se numesc momente centrale și se notează:


(14)


Din (7) rezultă că momentul central de ordinul întâi este întotdeauna egal cu zero:


(15)


Momentele centrale nu depind de originea valorilor variabilei aleatoare, deoarece atunci când sunt deplasate cu o valoare constantă C, centrul său de distribuție se deplasează la aceeași valoare C, iar abaterea de la centru nu se modifică:


X - m = (X - C) - (m - C).


Acum este clar că varianța este un moment central de ordinul doi:


(16)


Asimetrie.Moment central a treia ordine:


(17)


servește la evaluarea asimetriei distribuției. Dacă distribuția este simetrică față de punctul x = m, atunci momentul central de ordinul trei va fi egal cu zero (ca toate momentele centrale de ordine impare). Prin urmare, dacă momentul central de ordinul trei este diferit de zero, atunci distribuția nu poate fi simetrică. Mărimea asimetriei este evaluată folosind coeficientul de asimetrie adimensională:


(18)


Semnul coeficientului de asimetrie (18) indică asimetria din dreapta sau din stânga (Fig. 2).


Orez. 1. Tipuri de asimetrie de distribuție


Exces.Moment central de ordinul al patrulea:


(19)


servește la evaluarea așa-numitei kurtosis, care determină gradul de abruptitate (peakedness) al curbei de distribuție în apropierea centrului distribuției în raport cu curba de distribuție normală. Deoarece pentru o distribuţie normală , atunci valoarea luată ca curtoză este:


(20)


În fig. Figura 3 prezintă exemple de curbe de distribuție cu diferite valori de curtoză. Pentru o distribuție normală, E = 0. Curbele care au vârfuri mai mari decât cele normale au o curtoză pozitivă, cele care sunt mai cu vârf plat au o curtoză negativă.


Orez. 2. Curbe de distribuție cu diferite grade de abrupție (kurtoză)


Momentele de ordin superior nu sunt utilizate de obicei în aplicațiile de inginerie ale statisticii matematice.

Modăa unei variabile aleatoare discrete este valoarea sa cea mai probabilă. Modul unei variabile aleatoare continue este valoarea acesteia la care densitatea de probabilitate este maximă (Fig. 2). Dacă curba de distribuție are un maxim, atunci distribuția se numește unimodală. Dacă curba de distribuție are mai mult de un maxim, atunci distribuția se numește multimodală. Uneori există distribuții ale căror curbe au mai degrabă un minim decât un maxim. Astfel de distribuții sunt numite antimodale. În cazul general, modul și așteptarea matematică a unei variabile aleatoare nu coincid. Într-un caz particular, pentru modal, i.e. având un mod, distribuție simetrică și cu condiția să existe o așteptare matematică, aceasta din urmă coincide cu modul și centrul de simetrie al distribuției.

Medianvariabila aleatoare X este valoarea sa Me, pentru care egalitatea este valabilă: acestea. Este la fel de probabil ca variabila aleatoare X să fie mai mică sau mai mare decât Me. Geometric, mediana este abscisa punctului în care aria de sub curba de distribuție este împărțită la jumătate. În cazul unei distribuții modale simetrice, mediana, modul și așteptarea matematică sunt aceleași.


. Evaluarea statistică a legilor de distribuție a variabilelor aleatoare


Populația generală este totalitatea tuturor obiectelor care urmează să fie studiate sau rezultatele posibile ale tuturor observațiilor efectuate în aceleasi conditii peste un obiect.

Eșantion de populație sau un eșantion este o colecție de obiecte sau rezultate ale observării unui obiect, selectate aleatoriu din populația generală.

Marime de mostraeste numărul de obiecte sau observații din eșantion.

Valorile specifice ale eșantionului se numesc valori observate ale variabilei aleatoare X. Valorile observate sunt înregistrate în protocol. Protocolul este un tabel. Protocolul compilat este forma principală de înregistrare a procesării materialului primit. Pentru a obține concluzii de încredere, eșantionul trebuie să fie suficient de reprezentativ ca mărime. Un eșantion mare este un set neordonat de numere. Pentru cercetare, proba este adusă într-o formă ordonată vizual. Pentru a face acest lucru, protocolul găsește cele mai mari și cele mai mici valori ale unei variabile aleatorii. Eșantionul, sortat în ordine crescătoare, este prezentat în Tabelul 1.

Tabelul 1. Protocol

8,66-5,49-4,11-3,48-2,9-2,32-1,82-1,09-0,440,64-8,31-4,71-3,92-3,41-2,85-2,31-1,82-1,01-0,430,71-8,23-4,68-3,85-3,33-2,83-2,29-1,8-0,99-0,430,73-7,67-4,6-3,85-3,25-2,77-2,27-1,77-0,95-0,310,99-6,64-4,43-3,81-3,08-2,72-2,25-1,73-0,89-0,31,03-6,6-4,38-3,8-3,07-2,67-2,19-1,38-0,70,041,05-6,22-4,38-3,77-3,01-2,6-2,15-1,32-0,560,081,13-5,87-4,25-3,73-3,01-2,49-2,09-1,3-0,510,151,76-5,74-4,18-3,59-2,99-2,37-2,01-1,28-0,490,262,95-5,68-4,14-3,49-2,98-2,33-1,91-1,24-0,480,534,42

Interval de probăse numește diferența dintre cel mai mare și cea mai mică valoare variabila aleatoare X:

Intervalul de eșantionare este împărțit în k intervale - cifre. Numărul de cifre este setat în funcție de intervalul de eșantion de la 8 la 25, în aceasta munca de curs să luăm k = 10.

Atunci lungimea intervalului va fi egală cu:

În protocol, numărăm numărul de valori observate care se încadrează în fiecare interval, notându-le m1, m2,..., m10. .

Să-l sunăm pe mi frecvența loviturilorvariabilă aleatoare în intervalul i. Dacă orice valoare observată a unei variabile aleatoare coincide cu sfârșitul intervalului, atunci această valoare a variabilei aleatoare este atribuită unuia dintre intervale prin acord.

După ce am determinat frecvențele mi, determinăm frecventevariabilă aleatoare, adică Să găsim raportul dintre frecvențele mi și numărul total de valori observate n.

Frecvența, starea de completitudine -

Să găsim mijlocul fiecărui interval: .

Să facem tabelul 2

Tabelul valorilor limitelor intervalului și frecvențele corespunzătoare , unde i = 1, 2, 3, …, k, se numește serie statistică. O reprezentare grafică a unei serii statistice se numește histogramă. Este construit după cum urmează: intervalele sunt trasate de-a lungul axei absciselor și la fiecare astfel de interval, ca pe bază, se construiește un dreptunghi, a cărui zonă este egală cu frecvența corespunzătoare.

, - înălțimea dreptunghiului, .


masa 2

Numărul intervalului Limita stângă a intervalului Limita dreaptă a intervaluluiIntervalMijlocul intervalului Frecvența intervaluluiFrecvența intervalului Înălțimea dreptunghiului1-8,66-7,352(-8,66; -7,352)-8,00640,040,03062-7,352-6,044(-7,352-6,044;-7,6,042(-7,6,03,042); 2293-6.044-4.736 (-6.044; -4.736)-5.3940.040.03064-4.736-3.428(-4.736; -3.428)-4.082200.20.15295-3.428-2.12(- 3.428.628)-2.7228.6; -2,12-0,812(-2,12; - 0,812)-1,466180,180,13767-0,8120,496(-0,812; 0,496) -0,158140,140,107080,4961,804 (0,496; 1,805,096) (1.804; 3.112) 2.45810.010.0076103.1124.42 (3.112 4.42; 4.4.4.4.4.4.4.4.4.4.4.4.4.4.4.4IAL )3.76610.010.0076Suma1001

Figura 3


Funcția de distribuție statistică este frecvența unei variabile aleatoare care nu depășește o valoare dată X:

Pentru o variabilă aleatoare discretă X, funcția de distribuție statistică se găsește prin formula:

Să scriem funcția de distribuție statistică în formă extinsă:

Unde este mijlocul intervalului i și sunt frecvențele corespunzătoare, unde i=1, 2,…, k.

Graficul funcției de distribuție statistică este o linie în trepte, ale cărei puncte de întrerupere sunt mijlocul intervalelor, iar salturile finale sunt egale cu frecvențele corespunzătoare.


Figura 3


Calculul caracteristicilor numerice ale unei serii statistice

așteptări statistice matematice,

Varianta statistica,

Abaterea standard statistică.

Așteptări statistice matematicesau statistic in mediese numește media aritmetică a valorilor observate ale variabilei aleatoare X.

Varianta statisticase numeşte valoarea medie aritmetică a unei mărimi sau

Cu o dimensiune mare a eșantionului, calculele folosind formule duc la calcule greoaie. Pentru a simplifica calculele, utilizați o serie statistică cu limite si frecvente , unde i = 1, 2, 3, …, k, găsiți punctele medii ale intervalelor și apoi toate elementele selecției , care a căzut în interval , înlocuit cu o singură valoare , atunci vor exista astfel de valori în fiecare interval.

Unde - valoarea medie a intervalului corespunzător ;- frecventa intervalului

Tabelul 4. Caracteristici numerice

Frecvența PiXiPi(Xi-m)^2(Xi-m)^2*Pi1-8.0060.04-0.320231.486911.25952-6.6980.03-0.200918.518560.55563-5.38.90231.486911.25952-6.6980.03-0.200918.518560.55563-5.38.904.915. .0820.20-0.81642.847050.56945 -2.7740.26-0.72120.143880.03746-1.4660.18-0.26390.862450.15527 -0.1580.14-0.02215.002740.7004881.0150.091.150.15527 2.4580.010.024623.548500.2355103.7660.010.037737.953980.3795Sta așteptare statistică -2,3947Varianta statistica 5,3822 Abatere standard statistică 2,3200

Determină poziția centrului grupării valorilor variabilelor aleatoare observate.

, caracterizați împrăștierea valorilor observate ale unei variabile aleatorii în jur

Orice distribuție statistică conține inevitabil elemente ale aleatoriei. Cu toate acestea, cu un număr foarte mare de observații, aceste caractere aleatorii sunt netezite, iar fenomenele aleatorii dezvăluie un model inerent.

Când se prelucrează materialul statistic, trebuie să se decidă întrebarea cum să selecteze o curbă teoretică pentru o serie statistică dată. Această curbă de distribuție teoretică ar trebui să exprime caracteristicile esențiale ale distribuției statistice - această sarcină se numește problema netezirii sau nivelării seriei statistice.

Uneori forma generala distribuția unei variabile aleatoare X rezultă din însăși natura acestei variabile aleatoare.

Fie variabila aleatoare X rezultatul măsurării unora cantitate fizica dispozitiv.

X = valoarea exactă a unei mărimi fizice + eroare de instrument.

Eroarea aleatorie a dispozitivului în timpul măsurării are o natură totală și este distribuită conform legii normale. În consecință, variabila aleatoare X are aceeași distribuție, adică. distribuție normală cu densitate de probabilitate:


Unde , , .


Opțiuni Și sunt definite astfel încât caracteristici numerice distribuția teoretică au fost egale cu caracteristicile numerice corespunzătoare ale distribuției statistice. Cu o distribuţie normală se presupune că ,,, atunci funcția normală de distribuție va lua forma:

Tabelul 5. Curba de nivelare

Numărul intervalului Punctul de mijloc al intervalului Xi Funcție tabelată Curba normala 1-8.0060-2.41870.02140.00922-6.6980-1.85490.07140.03083-5.3900-1.29110.17340.07474-4.0820-0.32083-5.3900-1.29110.17340.07474-4.0820-0.32083-0.32073-0.32073 6350,39360,1697M-2,394700,39890,17206-1,46600, 40030,36820,15877-0,15800,96410,25070,108081,15001,52790,12420,05 3592.45802, 09170.04480.01965150.03.6515.002.

Construim o curbă normală teoretică din puncte pe același grafic cu o histogramă a unei serii statistice (Eroare! Sursa de referință nu a fost găsită).


Figura 6


Alinierea funcției de distribuție statistică

Funcția de distribuție statistică aliniat cu funcția de distribuție normală:



Unde ,,- Funcția Laplace.


Tabelul 7. Funcția de distribuție

Numărul intervalului Punctul de mijloc al intervalului Xi Funcția Laplace Funcția de distribuție 1-8.0060-2.4187-0.49220.00782-6.6980-1.8549-0.46820.03183-5.3900-1.2911-0.40170.09834-4.0820-35-0.23183-5.3900-1.2911-0.40170.09834-4.0820-35-0.23183-0.23183 -0,1635-0,06490,4351m-2,3947000,50006-1,46600. 40030.15550.65557-0.15800.96410.33250.832581.15001 , 52790,43670,936792,45802,09170,48180,98180,9818690,981802

Construim un grafic al funcției de distribuție teoretică în puncte / împreună cu un grafic al funcției de distribuție statistică.


Figura 6


Să studiem o variabilă aleatoare X cu așteptări matematice si varianta , ambii parametri sunt necunoscuți.

Fie x1, x2, x3, …, xn un eșantion obținut ca urmare a n observații independente ale variabilei aleatoare X. Pentru a sublinia natura aleatorie a mărimilor x1, x2, x3, …, xn, le rescriem în formă:

X1, X2, X3, …, Xn, unde Xi este valoarea variabilei aleatoare X din experimentul i.

Pe baza acestor date experimentale, este necesar să se estimeze așteptările matematice și dispersia unei variabile aleatoare. Astfel de estimări sunt numite estimări punctuale; așteptarea statistică poate fi luată ca o estimare a m și D și varianța statistică, unde



Înainte de experiment, eșantionul X1, X2, X3, ..., Xn este un set de variabile aleatoare independente care au o așteptare și o varianță matematică, ceea ce înseamnă că distribuția probabilității este aceeași cu variabila aleatoare X în sine.


Unde i = 1, 2, 3, …, n.


Pe baza acestui lucru, găsim așteptarea și varianța matematică a variabilei aleatoare (folosind proprietățile așteptării matematice).

Astfel, așteptarea matematică a mediei statistice este egală cu valoarea exactă a așteptării matematice m a valorii măsurate și dispersia mediei statistice de n ori mai mică decât varianța rezultatelor măsurătorilor individuale.


la


Aceasta înseamnă că, cu o dimensiune mare a eșantionului N, media statistică este o mărime aproape nealeatorie; se abate doar puțin de la valoarea exactă a variabilei aleatoare m. Această lege se numește lege numere mari Cebysheva.

Estimările punctuale ale valorilor necunoscute ale așteptărilor și varianței matematice au mare importanțăîn stadiul iniţial de prelucrare a datelor statice. Dezavantajul lor este că nu se știe cu ce precizie dau parametrul estimat.

Să se obțină estimări statistice precise pentru un eșantion dat X1, X2, X3, …, Xn Și , atunci caracteristicile numerice ale variabilei aleatoare X vor fi aproximativ egale . Pentru o dimensiune mică a eșantionului, problema acurateței estimării este semnificativă, deoarece între m şi , D și abaterile nu vor fi suficient de mari. În plus, atunci când rezolvați probleme practice, este necesar nu numai să găsiți valori aproximative ale lui m și D, ci și să evaluați acuratețea și fiabilitatea acestora. Lăsa , adică este estimarea punctuală pentru m. Este evident că cu cât m este determinat mai precis, cu atât modulul de diferență este mai mic . Lăsa , Unde ?>0, atunci cu atât mai puțin ?, cu atât estimarea m este mai precisă. Prin urmare, ?>0 caracterizează acuratețea estimării parametrilor. Cu toate acestea, metodele statistice nu ne permit să afirmăm categoric că estimarea valorii adevărate a lui m satisface , putem vorbi doar de probabilitate ?, cu care această inegalitate este valabilă:

Prin urmare, ?- Acest probabilitatea de încrederesau fiabilitatea evaluării, sens ? sunt selectate în prealabil în funcție de problema rezolvată. Fiabilitate ? este obișnuit să alegeți 0,9; 0,95; 0,99; 0,999. Evenimentele cu o asemenea probabilitate sunt practic sigure. Folosind o probabilitate de încredere dată, puteți găsi numărul ?>0 din .

Apoi obținem intervalul , care acoperă cu probabilitate ? valoarea adevărată a așteptării matematice m, lungimea acestui interval este 2 ?. Acest interval se numește interval de încredere. Și această metodă de estimare a parametrului necunoscut m este interval.



Să fie dat un eșantion X1, X2, X3, ..., Xn și să fie găsit din acest eșantion, ,.

Trebuie să găsim un interval de încredere pentru așteptarea matematică m cu probabilitate de încredere ?. Magnitudinea este o cantitate aleatoare cu o așteptare matematică, .

Valoare aleatoare are un caracter rezumativ; cu o dimensiune mare a eșantionului, este distribuit conform unei legi apropiate de normal. Atunci probabilitatea ca o variabilă aleatorie să cadă în interval va fi egală cu:


Unde


Unde - Funcția Laplace.

Din formula (3) și tabelele funcției Laplace găsim numărul ?>0 și notează intervalul de încredere pentru valoarea exactă variabila aleatoare X cu fiabilitate ?.

În acest curs lucrați sensul ? vom înlocui , iar apoi formula (3) va lua forma:

Să găsim intervalul de încredere , care conține așteptarea matematică. La ? = 0,99, n = 100, ,.

Folosind tabelele Laplace găsim:

De aici? = 0,5986.

Un interval de încredere în care, cu 99% probabilitate, se află valoarea exactă a așteptării matematice.


Concluzie

distribuţie variabilă aleatorie economică

Rezolvarea problemelor de identificare structural-parametrică cu dimensiuni limitate ale eșantionului, pe care metrologii le au de obicei, agravează problema. În acest caz, aplicarea corectă a metodelor statistice de analiză este și mai importantă, folosind utilizarea estimărilor care au cele mai bune proprietăți statistice și criterii care au cea mai mare putere.

La rezolvarea problemelor de identificare este de preferat să se bazeze pe abordarea clasică. La identificare, se recomandă să se ia în considerare o varietate mai largă de legi de distribuție, inclusiv modele sub formă de amestecuri de legi. În acest caz, pentru orice distribuţie empirică putem construi întotdeauna un model matematic adecvat, semnificativ mai fundamentat statistic.

Ar trebui să se concentreze pe utilizare și dezvoltare sisteme software, oferind soluții la problemele de identificare structural-parametrică a legilor de distribuție pentru orice formă de observații (măsurători) înregistrate, inclusiv metode moderne statistici analiză analitică, se concentrează pe utilizarea pe scară largă, dar corectă, a metodelor de modelare computerizată în cercetare. Am văzut deja că pentru multe experimente nu există diferențe în calcularea probabilităților de evenimente, în timp ce rezultatele elementare din aceste experimente sunt foarte diferite. Dar ar trebui să ne intereseze tocmai probabilitățile evenimentelor, și nu structura spațiului rezultatelor elementare. Prin urmare, este timpul să folosiți, de exemplu, numere în toate astfel de experimente „similare” în loc de o varietate de rezultate elementare. Cu alte cuvinte, atribuiți fiecare rezultat elementar unui anumit număr real și lucrați numai cu numere.

Trimiteți-vă munca bună în baza de cunoștințe este simplu. Utilizați formularul de mai jos

Studenții, studenții absolvenți, tinerii oameni de știință care folosesc baza de cunoștințe în studiile și munca lor vă vor fi foarte recunoscători.

postat pe http://www.allbest.ru/

postat pe http://www.allbest.ru/

Introducere

1. Distribuția chi-pătrat

Concluzie

Aplicație

Introducere

Cum sunt abordările, ideile și rezultatele teoriei probabilităților folosite în viața noastră? teoria pătratului matematic

Baza este un model probabilistic al unui fenomen sau proces real, i.e. un model matematic în care relaţiile obiective sunt exprimate în termeni de teoria probabilităţilor. Probabilitățile sunt folosite în primul rând pentru a descrie incertitudinile care trebuie luate în considerare la luarea deciziilor. Aceasta se referă atât la oportunități (riscuri) nedorite, cât și la cele atractive („ Caz norocos"). Uneori, aleatorietatea este introdusă în mod deliberat într-o situație, de exemplu, la tragere la sorți, la selectarea aleatorie a unităților pentru control, la desfășurarea loteriei sau la efectuarea de sondaje ale consumatorilor.

Teoria probabilității permite utilizarea unei probabilități pentru a calcula altele de interes pentru cercetător.

Un model probabilistic al unui fenomen sau proces este fundamentul statisticii matematice. Sunt utilizate două serii paralele de concepte - cele legate de teorie (model probabilistic) și cele legate de practică (eșantionarea rezultatelor observației). De exemplu, probabilitatea teoretică corespunde frecvenței găsite din eșantion. Aşteptările matematice (seria teoretică) corespunde mediei aritmetice eşantionului (seria practică). De regulă, caracteristicile eșantionului sunt estimări ale celor teoretice. În același timp, cantitățile legate de seria teoretică „sunt în capul cercetătorilor”, se referă la lumea ideilor (conform filosofului grec antic Platon) și nu sunt disponibile pentru măsurare directă. Cercetătorii au doar date eșantion cu care încearcă să stabilească proprietățile unui model probabilistic teoretic care îi interesează.

De ce avem nevoie de un model probabilistic? Cert este că numai cu ajutorul lui proprietățile stabilite din analiza unui eșantion anume pot fi transferate altor probe, precum și întregii așa-zise populații generale. Termenul „populație” este folosit atunci când se referă la o colecție mare, dar finită de unități studiate. De exemplu, despre totalitatea tuturor rezidenților Rusiei sau totalitatea tuturor consumatorilor de cafea instant din Moscova. Scopul anchetelor de marketing sau sociologice este de a transfera afirmațiile obținute dintr-un eșantion de sute sau mii de oameni către populații de câteva milioane de oameni. În controlul calității, un lot de produse acționează ca o populație generală.

Pentru a transfera concluziile de la un eșantion la o populație mai mare necesită unele ipoteze despre relația dintre caracteristicile eșantionului cu caracteristicile acestei populații mai mari. Aceste ipoteze se bazează pe un model probabilistic adecvat.

Desigur, este posibil să se prelucreze date eșantionului fără a utiliza unul sau altul model probabilistic. De exemplu, puteți calcula o medie aritmetică eșantion, puteți număra frecvența de îndeplinire a anumitor condiții etc. Cu toate acestea, rezultatele calculului se vor referi doar la un eșantion specific; transferul concluziilor obținute cu ajutorul lor către orice altă populație este incorect. Această activitate este uneori numită „analiza datelor”. Comparativ cu metodele probabilistic-statistice, analiza datelor are valoare educațională limitată.

Deci, utilizarea modelelor probabilistice bazate pe estimarea și testarea ipotezelor folosind caracteristicile eșantionului este esența metodelor probabilistic-statistice de luare a deciziilor.

1. Distribuția chi-pătrat

Distribuția normală definește trei distribuții care sunt acum adesea folosite în prelucrare statistică date. Acestea sunt distribuțiile Pearson („chi-pătrat”), Student și Fisher.

Ne vom concentra pe distribuție („chi-pătrat”). Această distribuție a fost studiată pentru prima dată de astronomul F. Helmert în 1876. În legătură cu teoria erorii gaussiene, el a studiat sumele pătratelor a n variabile aleatoare independente distribuite normal normal. Mai târziu, Karl Pearson a dat numele „chi-pătrat” acestei funcții de distribuție. Și acum distribuția îi poartă numele.

Mulțumită legătură strânsă cu distribuție normală, distribuția h2 joacă rol importantîn teoria probabilităţilor şi statistica matematică. distribuția h2 și multe alte distribuții care sunt determinate prin intermediul distribuției h2 (de exemplu, distribuția Student), descriu distribuții eșantion de diferite funcții din normal rezultate distribuite observații și sunt utilizate pentru a construi intervale de încredere și teste statistice.

Distribuția Pearson (chi - pătrat) - distribuția unei variabile aleatoare, unde X1, X2,..., Xn sunt variabile aleatoare independente normale, iar așteptarea matematică a fiecăreia dintre ele este zero, iar abaterea standard este una.

Suma patratelor

distribuite conform legii („chi - pătrat”).

În acest caz, numărul de termeni, adică n se numește „numărul de grade de libertate” al distribuției chi-pătrat. Pe măsură ce numărul de grade de libertate crește, distribuția se apropie încet de normal.

Densitatea acestei distribuții

Deci, distribuția h2 depinde de un parametru n - numărul de grade de libertate.

Funcția de distribuție h2 are forma:

dacă h2?0. (2.7.)

Figura 1 prezintă un grafic al funcțiilor de densitate de probabilitate și distribuție h2 pentru diferite grade de libertate.

Figura 1 Dependența densității de probabilitate q (x) în distribuția h2 (chi - pătrat) pentru diferite numere de grade de libertate

Momente ale distribuției chi-pătrat:

Distribuția chi-pătrat este utilizată în estimarea varianței (folosind un interval de încredere), testarea ipotezelor de acord, omogenitate, independență, în primul rând pentru variabile calitative (categorizate) care iau un număr finit de valori și în multe alte sarcini de analiză a datelor statistice. .

2. „Chi-pătrat” în probleme de analiză a datelor statistice

Metodele statistice de analiză a datelor sunt utilizate în aproape toate domeniile activității umane. Sunt folosite ori de câte ori este necesar pentru a obține și justifica orice judecăți despre un grup (obiecte sau subiecți) cu o oarecare eterogenitate internă.

Etapa modernă de dezvoltare a metodelor statistice poate fi numărată din 1900, când englezul K. Pearson a fondat revista „Biometrika”. Prima treime a secolului XX. trecută sub semnul statisticii parametrice. Metodele au fost studiate pe baza analizei datelor din familiile parametrice de distribuții descrise de curbele familiei Pearson. Cea mai populară a fost distribuția normală. Pentru a testa ipotezele, au fost utilizate testele Pearson, Student și Fisher. Au fost propuse metoda probabilității maxime și analiza varianței și au fost formulate ideile de bază ale planificării experimentului.

Distribuția chi-pătrat este una dintre cele mai utilizate în statistică pentru testarea ipotezelor statistice. Pe baza distribuției chi-pătrat, se construiește unul dintre cele mai puternice teste de bunătate a potrivirii - testul Pearson chi-pătrat.

Criteriul acordului este criteriul de testare a ipotezei despre legea presupusă a unei distribuții necunoscute.

Testul h2 ("chi-pătrat") este folosit pentru a testa ipoteza diferitelor distribuții. Aceasta este demnitatea lui.

Formula de calcul a criteriului este egală cu

unde m și m" sunt frecvențe empirice și, respectiv, teoretice

distribuția în cauză;

n este numărul de grade de libertate.

Pentru a verifica, trebuie să comparăm frecvențele empirice (observate) și teoretice (calculate în ipoteza unei distribuții normale).

Dacă frecvențele empirice coincid complet cu frecvențele calculate sau așteptate, S (E - T) = 0 și criteriul h2 va fi, de asemenea, egal cu zero. Dacă S (E - T) nu este egal cu zero, aceasta va indica o discrepanță între frecvențele calculate și frecvențele empirice ale seriei. În astfel de cazuri, este necesar să se evalueze semnificația criteriului h2, care teoretic poate varia de la zero la infinit. Acest lucru se realizează prin compararea valorii reale a lui h2f cu valoarea sa critică (h2st).Ipoteza nulă, adică ipoteza că discrepanța dintre frecvențele empirice și teoretice sau așteptate este aleatorie, este infirmată dacă h2f este mai mare sau egală cu h2st. pentru nivelul de semnificație acceptat (a) și numărul de grade de libertate (n).

Distribuția valorilor probabile ale variabilei aleatoare h2 este continuă și asimetrică. Depinde de numărul de grade de libertate (n) și se apropie de o distribuție normală pe măsură ce crește numărul de observații. Prin urmare, aplicarea criteriului h2 la evaluare distribuții discrete este asociată cu unele erori care îi afectează valoarea, în special la eșantioanele mici. Pentru a obține estimări mai precise, eșantionul distribuit în seria de variații trebuie să aibă cel puțin 50 de opțiuni. Aplicarea corectă a criteriului h2 necesită, de asemenea, ca frecvențele variantelor din clasele extreme să nu fie mai mici de 5; dacă sunt mai puțin de 5, atunci acestea sunt combinate cu frecvențele claselor învecinate, astfel încât suma totală să fie mai mare sau egală cu 5. În funcție de combinația de frecvențe, numărul claselor (N) scade. Numărul de grade de libertate se stabilește prin numărul secundar de clase, ținând cont de numărul de restricții asupra libertății de variație.

Deoarece acuratețea determinării criteriului h2 depinde în mare măsură de acuratețea calculării frecvențelor teoretice (T), frecvențele teoretice nerotunjite ar trebui utilizate pentru a obține diferența dintre frecvențele empirice și cele calculate.

Ca exemplu, să luăm un studiu publicat pe un site dedicat aplicării metodelor statistice în științe umaniste.

Testul Chi-pătrat vă permite să comparați distribuțiile de frecvență indiferent dacă sunt distribuite în mod normal sau nu.

Frecvența se referă la numărul de apariții ale unui eveniment. De obicei, frecvența de apariție a evenimentelor este tratată atunci când variabilele sunt măsurate pe o scară de nume, iar celelalte caracteristici ale acestora, în afară de frecvență, sunt imposibil sau problematic de selectat. Cu alte cuvinte, atunci când o variabilă are caracteristici de calitate. De asemenea, mulți cercetători tind să convertească scorurile testelor în niveluri (mare, medie, scăzută) și să construiască tabele de distribuție a scorurilor pentru a afla numărul de persoane la aceste niveluri. Pentru a demonstra că într-unul dintre niveluri (într-una dintre categorii) numărul de persoane este într-adevăr mai mare (mai puțin) se folosește și coeficientul Chi-pătrat.

Să ne uităm la cel mai simplu exemplu.

A fost efectuat un test în rândul adolescenților mai tineri pentru a identifica stima de sine. Scorurile testelor au fost convertite în trei niveluri: mare, mediu, scăzut. Frecvențele au fost distribuite după cum urmează:

Mare (B) 27 de persoane.

Medie (C) 12 persoane.

Scăzut (L) 11 persoane

Este evident că majoritatea copiilor au o stima de sine ridicată, dar acest lucru trebuie dovedit statistic. Pentru a face acest lucru, folosim testul Chi-pătrat.

Sarcina noastră este să verificăm dacă datele empirice obţinute diferă de cele la fel de probabile teoretic. Pentru a face acest lucru, trebuie să găsiți frecvențele teoretice. În cazul nostru, frecvențele teoretice sunt frecvențe la fel de probabile, care se găsesc adunând toate frecvențele și împărțind la numărul de categorii.

În cazul nostru:

(B + C + H)/3 = (27+12+11)/3 = 16,6

Formula pentru calculul testului chi-pătrat:

h2 = ?(E - T)I / T

Construim tabelul:

Empiric (E)

Teoretic (T)

(E - T)I / T

Aflați suma ultimei coloane:

Acum trebuie să găsiți valoarea critică a criteriului folosind tabelul cu valori critice (Tabelul 1 din Anexă). Pentru a face acest lucru avem nevoie de numărul de grade de libertate (n).

n = (R - 1) * (C - 1)

unde R este numărul de rânduri din tabel, C este numărul de coloane.

În cazul nostru, există o singură coloană (adică frecvențele empirice originale) și trei rânduri (categorii), așa că formula se schimbă - excludem coloanele.

n = (R - 1) = 3-1 = 2

Pentru probabilitatea de eroare p?0,05 și n = 2, valoarea critică este h2 = 5,99.

Valoarea empirică obținută este mai mare decât valoarea critică - diferențele de frecvențe sunt semnificative (h2 = 9,64; p? 0,05).

După cum puteți vedea, calcularea criteriului este foarte simplă și nu necesită mult timp. Valoarea practică a testului chi-pătrat este enormă. Această metodă este cea mai valoroasă atunci când se analizează răspunsurile la chestionare.

Să ne uităm la un exemplu mai complex.

De exemplu, un psiholog vrea să știe dacă este adevărat că profesorii sunt mai părtinitori față de băieți decât față de fete. Acestea. mai probabil să laude fetele. Pentru a face acest lucru, psihologul a analizat caracteristicile elevilor scrise de profesori pentru frecvența de apariție a trei cuvinte: „activ”, „diligent”, „disciplinat” și au fost numărate și sinonimele cuvintelor.

Datele privind frecvența de apariție a cuvintelor au fost introduse în tabel:

Pentru a procesa datele obținute folosim testul chi-pătrat.

Pentru a face acest lucru, vom construi un tabel de distribuție a frecvențelor empirice, i.e. acele frecvențe pe care le observăm:

Teoretic, ne așteptăm ca frecvențele să fie distribuite egal, adică frecvența va fi distribuită proporțional între băieți și fete. Să construim un tabel de frecvențe teoretice. Pentru a face acest lucru, înmulțiți suma rândurilor cu suma coloanei și împărțiți numărul rezultat la suma totală (e).

Tabelul final pentru calcule va arăta astfel:

Empiric (E)

Teoretic (T)

(E - T)I / T

băieți

"Activ"

"Harnic"

"Disciplinat"

"Activ"

"Harnic"

"Disciplinat"

Suma: 4,21

h2 = ?(E - T)I / T

unde R este numărul de rânduri din tabel.

În cazul nostru, chi-pătrat = 4,21; n = 2.

Folosind tabelul de valori critice ale criteriului, găsim: cu n = 2 și un nivel de eroare de 0,05, valoarea critică h2 = 5,99.

Valoarea rezultată este mai mică decât valoarea critică, ceea ce înseamnă că ipoteza nulă este acceptată.

Concluzie: profesorii nu acordă importanță genului copilului atunci când scriu caracteristici pentru el.

Concluzie

Studenții de aproape toate specialitățile învață la sfârșitul cursului matematica superioara secțiunea „teoria probabilității și statistica matematică”, în realitate se familiarizează doar cu unele concepte și rezultate de bază, care în mod clar nu sunt suficiente pentru munca practica. Studenții sunt introduși în unele metode de cercetare matematică în cadrul unor cursuri speciale (de exemplu, „Prognoză și planificare tehnică și economică”, „Analiza tehnică și economică”, „Controlul calității produselor”, „Marketing”, „Control”, „ Metode matematice previzionare”, „Statistică” etc. – în cazul studenților specialităților economice), însă, prezentarea în majoritatea cazurilor este foarte prescurtată și de natură formulatică. Ca urmare, specialiștii în statistică aplicată au cunoștințe insuficiente.

Prin urmare, cursul „Statistică aplicată” în universități tehnice, iar în universitățile economice - cursul „Econometrie”, întrucât econometria este, după cum se știe, analiza statistică a datelor economice specifice.

Teoria probabilității și statistica matematică oferă cunoștințe fundamentale pentru statistica aplicată și econometrie.

Sunt necesare specialiștilor pentru lucrări practice.

M-am uitat la modelul probabilistic continuu și am încercat să-i arăt utilizarea cu exemple.

Și la sfârșitul lucrării mele, am ajuns la concluzia că implementarea competentă a procedurilor de bază de analiză a datelor matematico-statice și testarea statică a ipotezelor este imposibilă fără cunoașterea modelului chi-pătrat, precum și capacitatea de a-l folosi. masa.

Bibliografie

1. Orlov A.I. Statistici aplicate. M.: Editura „Examen”, 2004.

2. Gmurman V.E. Teoria Probabilității și Statistica Matematică. M.: facultate, 1999. - 479 p.

3. Ayvozyan S.A. Teoria probabilității și statistică aplicată, vol. 1. M.: Unitate, 2001. - 656 p.

4. Khamitov G.P., Vedernikova T.I. Probabilități și statistici. Irkutsk: BGUEP, 2006 - 272 p.

5. Ezhova L.N. Econometrie. Irkutsk: BGUEP, 2002. - 314 p.

6. Mosteller F. Cincizeci de probleme probabilistice distractive cu soluții. M.: Nauka, 1975. - 111 p.

7. Mosteller F. Probabilitate. M.: Mir, 1969. - 428 p.

8. Yaglom A.M. Probabilitate și informație. M.: Nauka, 1973. - 511 p.

9. Chistiakov V.P. Curs de teoria probabilității. M.: Nauka, 1982. - 256 p.

10. Kremer N.Sh. Teoria Probabilității și Statistica Matematică. M.: UNITATEA, 2000. - 543 p.

11. Enciclopedia matematică, vol.1. M.: Enciclopedia sovietică, 1976. - 655 p.

12. http://psystat.at.ua/ - Statistică în psihologie și pedagogie. Articolul Testul chi-pătrat.

Aplicație

Puncte critice de distribuție h2

tabelul 1

Postat pe Allbest.ru

...

Documente similare

    Modelul probabilistic și axiomatica lui A.N. Kolmogorov. Variabile aleatoare și vectori, problema limită clasică a teoriei probabilităților. Prelucrarea primară a datelor statistice. Estimări punctuale ale caracteristicilor numerice. Testarea statistică a ipotezelor.

    manual de instruire, adăugat la 03/02/2010

    Reguli de implementare și înregistrare teste Pentru departamentul de corespondență. Teme și exemple de rezolvare a problemelor de statistică matematică și teoria probabilităților. Tabele de date de referință ale distribuțiilor, densitatea distribuției normale standard.

    manual de instruire, adăugat 29.11.2009

    Metode de bază de descriere formalizată și analiză a fenomenelor aleatorii, prelucrarea și analiza rezultatelor fizice și experimente numerice teoria probabilității. Concepte de bază și axiome ale teoriei probabilităților. Concepte de bază ale statisticii matematice.

    curs de prelegeri, adăugat 04.08.2011

    Determinarea legii distribuției de probabilitate a rezultatelor măsurătorilor în statistica matematică. Verificarea conformităţii distribuţiei empirice cu cea teoretică. Determinarea intervalului de încredere în care se află valoarea mărimii măsurate.

    lucrare curs, adăugată 02.11.2012

    Convergența secvențelor de variabile aleatoare și a distribuțiilor de probabilitate. Metoda funcţiilor caracteristice. Testarea ipotezelor statistice și efectuarea centrală teorema limitei pentru secvențe date de variabile aleatoare independente.

    lucrare de curs, adăugată 13.11.2012

    Principalele etape ale procesării datelor din observații naturale folosind metoda statisticii matematice. Evaluarea rezultatelor obținute, utilizarea acestora în luarea deciziilor de management în domeniul conservării naturii și managementului mediului. Testarea ipotezelor statistice.

    lucrare practica, adaugata 24.05.2013

    Esența legii distribuției și a acesteia uz practic pentru rezolvarea problemelor statistice. Determinarea varianței unei variabile aleatoare, așteptarea matematică și abaterea standard. Caracteristicile analizei unidirecționale a varianței.

    test, adaugat 12.07.2013

    Probabilitatea și ea definiție generală. Teoreme de adunare și înmulțire a probabilității. Variabile aleatoare discrete și caracteristicile lor numerice. Legea numerelor mari. Distribuția statistică a eșantionului. Elemente de analiză de corelare și regresie.

    curs de prelegeri, adăugat 13.06.2015

    Programul cursului, concepte și formule de bază ale teoriei probabilităților, rațiunea și semnificația acestora. Locul și rolul statisticii matematice în disciplină. Exemple și explicații pentru rezolvarea celor mai frecvente probleme software diverse subiecte dintre aceste discipline academice.

    manual de instruire, adăugat 15.01.2010

    Teoria probabilității și statistica matematică sunt științe ale metodelor analiza cantitativa fenomene aleatorii de masă. Setul de valori ale unei variabile aleatoare se numește eșantion, iar elementele setului sunt numite valori ale eșantionului unei variabile aleatoare.



Acțiune