Sono applicabili metodi probabilistici e statistici. Metodi probabilistici e statistici

In accordo con le tre principali possibilità - processo decisionale in condizioni di completa certezza, rischio e incertezza - i metodi e gli algoritmi decisionali possono essere suddivisi in tre tipi principali: analitici, statistici e basati sulla formalizzazione fuzzy. In ogni caso specifico, il metodo decisionale viene selezionato in base al compito, ai dati iniziali disponibili, ai modelli problematici disponibili, all'ambiente decisionale, al processo decisionale, all'accuratezza della soluzione richiesta e alle preferenze personali dell'analista.

In alcuni sistemi informativi, il processo di selezione dell'algoritmo può essere automatizzato:

Il corrispondente sistema automatizzato ha la capacità di utilizzare una varietà di diversi tipi di algoritmi (libreria di algoritmi);

Il sistema chiede in modo interattivo all'utente di rispondere ad una serie di domande sulle principali caratteristiche del problema in esame;

Sulla base dei risultati delle risposte dell'utente, il sistema offre l'algoritmo più appropriato (secondo i criteri in esso specificati) dalla libreria.

2.3.1 Metodi probabilistico-statistici del processo decisionale

I metodi decisionali probabilistico-statistici (MPD) vengono utilizzati quando l'efficacia delle decisioni prese dipende da fattori che sono variabili casuali per le quali sono note leggi di distribuzione di probabilità e altre caratteristiche statistiche. Inoltre, ogni decisione può portare a uno dei tanti esiti possibili, e ogni risultato ha una certa probabilità di accadimento, che può essere calcolata. Con l'ausilio di caratteristiche probabilistiche vengono descritti anche gli indicatori che caratterizzano la situazione problematica: con tale DPR, il decisore corre sempre il rischio di ottenere il risultato sbagliato, dal quale è guidato, scegliendo la soluzione ottimale in base alle caratteristiche statistiche medie di fattori casuali, ovvero la decisione viene presa in condizioni di rischio.

In pratica, i metodi probabilistici e statistici vengono spesso utilizzati quando le conclusioni tratte dai dati del campione vengono trasferite all'intera popolazione (ad esempio, da un campione a un intero lotto di prodotti). Tuttavia, in questo caso, in ogni specifica situazione, si dovrebbe prima valutare la possibilità fondamentale di ottenere dati probabilistici e statistici sufficientemente affidabili.

Quando si utilizzano le idee e i risultati della teoria della probabilità e della statistica matematica quando si prendono decisioni, la base è modello matematico, in cui le relazioni oggettive sono espresse in termini di teoria della probabilità. Le probabilità sono utilizzate principalmente per descrivere la casualità che deve essere presa in considerazione quando si prendono decisioni. Ciò si riferisce sia alle opportunità indesiderabili (rischi) sia a quelle attraenti ("occasione fortunata").

L'essenza dei metodi decisionali probabilistico-statistici è l'uso di modelli probabilistici basati sulla stima e sulla verifica di ipotesi utilizzando le caratteristiche del campione.

Sottolineiamo che la logica dell'utilizzo delle caratteristiche campionarie per il processo decisionale basato su modelli teorici implica l'uso simultaneo di due serie parallele di concetti– relativi alla teoria (modello probabilistico) e relativi alla pratica (campione di risultati osservativi). Ad esempio, la probabilità teorica corrisponde alla frequenza rilevata dal campione. L'aspettativa matematica (serie teorica) corrisponde alla media aritmetica campionaria (serie pratica). Di norma, le caratteristiche del campione sono stime delle caratteristiche teoriche.

I vantaggi dell'utilizzo di questi metodi includono la capacità di prendere in considerazione vari scenari per lo sviluppo di eventi e le loro probabilità. Lo svantaggio di questi metodi è che le probabilità dello scenario utilizzate nei calcoli sono generalmente molto difficili da ottenere nella pratica.

L'applicazione di uno specifico metodo decisionale probabilistico-statistico si compone di tre fasi:

Il passaggio dalla realtà economica, gestionale, tecnologica ad uno schema matematico e statistico astratto, cioè costruire un modello probabilistico di un sistema di controllo, di un processo tecnologico, di un processo decisionale, in particolare basato sui risultati del controllo statistico, ecc.

Effettuare calcoli e ottenere conclusioni con mezzi puramente matematici nell'ambito di un modello probabilistico;

Interpretazione di conclusioni matematiche e statistiche in relazione a una situazione reale e presa di una decisione appropriata (ad esempio, sulla conformità o non conformità della qualità del prodotto ai requisiti stabiliti, sulla necessità di adeguare il processo tecnologico, ecc.), in particolare, conclusioni (sulla proporzione di unità difettose di prodotti in un lotto, su una forma specifica di leggi di distribuzione dei parametri controllati del processo tecnologico, ecc.).

Un modello probabilistico di un fenomeno reale è da considerarsi costruito se le quantità in esame e le relazioni tra di esse sono espresse in termini di teoria della probabilità. L'adeguatezza del modello probabilistico è corroborata, in particolare, dall'utilizzo di metodi statistici per la verifica delle ipotesi.

La statistica matematica è solitamente suddivisa in tre sezioni a seconda del tipo di problemi da risolvere: descrizione dei dati, stima e verifica delle ipotesi. A seconda del tipo di dati statistici elaborati, la statistica matematica è suddivisa in quattro aree:

Statistica unidimensionale (statistica di variabili casuali), in cui il risultato di un'osservazione è descritto da un numero reale;

Multidimensionale analisi statistica, dove il risultato dell'osservazione sull'oggetto è descritto da più numeri (vettore);

Statistiche di processi casuali e serie temporali, dove il risultato dell'osservazione è una funzione;

Statistiche di oggetti di natura non numerica, in cui il risultato di un'osservazione è di natura non numerica, ad esempio, è un insieme (una figura geometrica), un ordinamento, o ottenuto come risultato di una misura di un attributo qualitativo.

Un esempio di quando è consigliabile utilizzare modelli probabilistico-statistici.

Quando si controlla la qualità di qualsiasi prodotto, ne viene prelevato un campione per decidere se il lotto di prodotti prodotti soddisfa i requisiti stabiliti. Sulla base dei risultati del controllo del campione, si trae una conclusione sull'intero lotto. In questo caso è molto importante evitare la soggettività nella formazione del campione, cioè è necessario che ogni unità di prodotto del lotto controllato abbia la stessa probabilità di essere selezionata nel campione. La scelta in base al lotto in una situazione del genere non è sufficientemente obiettiva. Pertanto, in condizioni di produzione, la selezione delle unità di produzione nel campione viene solitamente effettuata non per lotto, ma da apposite tabelle di numeri casuali o con l'ausilio di generatori di numeri casuali computerizzati.

Nella regolamentazione statistica dei processi tecnologici, sulla base dei metodi della statistica matematica, vengono sviluppate regole e piani per il controllo statistico dei processi, volti a rilevare tempestivamente il disordine dei processi tecnologici e ad adottare misure per adeguarli e prevenire il rilascio di prodotti che non soddisfano i requisiti stabiliti. Queste misure mirano a ridurre i costi di produzione e le perdite derivanti dalla fornitura di prodotti di bassa qualità. Con il controllo statistico di accettazione, basato sui metodi della statistica matematica, vengono sviluppati piani di controllo della qualità analizzando campioni da lotti di prodotti. La difficoltà sta nel riuscire a costruire correttamente modelli decisionali probabilistico-statistici, sulla base dei quali è possibile rispondere alle domande sopra poste. Nella statistica matematica, a questo scopo sono stati sviluppati modelli probabilistici e metodi per verificare le ipotesi3.

Inoltre, in una serie di situazioni gestionali, industriali, economiche, economiche nazionali sorgono problemi di diverso tipo: problemi di stima delle caratteristiche e dei parametri delle distribuzioni di probabilità.

Oppure, in un'analisi statistica dell'accuratezza e della stabilità dei processi tecnologici, è necessario valutare indicatori di qualità come il valore medio del parametro controllato e il grado della sua diffusione nel processo in esame. Secondo la teoria della probabilità, come valore medio variabile casualeè consigliabile utilizzare la sua aspettativa matematica e come caratteristica statistica dello scatter - varianza, deviazione standard o coefficiente di variazione. Ciò solleva la domanda: come stimare queste caratteristiche statistiche dai dati del campione e con quale accuratezza è possibile farlo? Ci sono molti esempi simili in letteratura. Tutti mostrano come la teoria della probabilità e la statistica matematica possono essere utilizzate nella gestione della produzione quando si prendono decisioni nel campo della gestione statistica della qualità dei prodotti.

In specifici ambiti di applicazione vengono utilizzati sia metodi probabilistico-statistici di ampia applicazione che metodi specifici. Ad esempio, nella sezione della gestione della produzione dedicata ai metodi statistici di gestione della qualità del prodotto, vengono utilizzate statistiche matematiche applicate (compresa la progettazione di esperimenti). Con l'aiuto dei suoi metodi, viene effettuata un'analisi statistica dell'accuratezza e della stabilità dei processi tecnologici e una valutazione statistica della qualità. I metodi specifici includono metodi di controllo statistico dell'accettazione della qualità del prodotto, regolamentazione statistica dei processi tecnologici, valutazione e controllo dell'affidabilità, ecc.

Nella gestione della produzione, in particolare, quando si ottimizza la qualità del prodotto e si garantisce il rispetto degli standard, è particolarmente importante applicare metodi statistici nella fase iniziale del ciclo di vita del prodotto, ad es. nella fase di preparazione della ricerca degli sviluppi del progetto sperimentale (sviluppo di requisiti promettenti per i prodotti, progettazione preliminare, termini di riferimento per lo sviluppo del progetto sperimentale). Ciò è dovuto alle limitate informazioni disponibili nella fase iniziale del ciclo di vita del prodotto e alla necessità di prevedere le possibilità tecniche e la situazione economica per il futuro.

I metodi probabilistico-statistici più comuni sono l'analisi di regressione, l'analisi fattoriale, l'analisi della varianza, i metodi statistici per la valutazione del rischio, il metodo degli scenari, ecc. Diventa sempre più importante il campo dei metodi statistici, dedicati all'analisi di dati statistici di natura non numerica, ossia risultati di misura su caratteristiche qualitative ed eterogenee. Una delle principali applicazioni della statistica degli oggetti di natura non numerica è la teoria e la pratica delle valutazioni di esperti relative alla teoria delle decisioni statistiche e dei problemi di voto.

Il ruolo di una persona nella risoluzione dei problemi utilizzando i metodi della teoria delle decisioni statistiche è quello di formulare il problema, cioè di portare il problema reale al corrispondente modello, di determinare le probabilità di eventi sulla base di dati statistici, e anche di approvare la soluzione ottimale risultante.

Parte 1. Il fondamento della statistica applicata

1.2.3. L'essenza dei metodi decisionali probabilistico-statistici

Come vengono utilizzati approcci, idee e risultati della teoria della probabilità e della statistica matematica nel processo decisionale?

La base è un modello probabilistico di un fenomeno o processo reale, ad es. un modello matematico in cui le relazioni oggettive sono espresse in termini di teoria della probabilità. Le probabilità vengono utilizzate principalmente per descrivere le incertezze che devono essere prese in considerazione quando si prendono decisioni. Ciò si riferisce sia alle opportunità indesiderabili (rischi) sia a quelle attraenti ("occasione fortunata"). A volte la casualità viene introdotta deliberatamente nella situazione, ad esempio durante l'estrazione a sorte, la selezione casuale di unità per il controllo, lo svolgimento di lotterie o sondaggi sui consumatori.

La teoria delle probabilità consente di calcolare altre probabilità che interessano il ricercatore. Ad esempio, con la probabilità che uno stemma cada, puoi calcolare la probabilità che almeno 3 stemmi cadano in 10 lanci di monete. Tale calcolo si basa su un modello probabilistico, secondo il quale i lanci delle monete sono descritti da uno schema di prove indipendenti, inoltre, lo stemma e il reticolo sono ugualmente probabili, e quindi la probabilità di ciascuno di questi eventi è ½. Più complesso è il modello, che considera il controllo della qualità di un'unità di output invece del lancio di una moneta. Il corrispondente modello probabilistico si basa sul presupposto che il controllo di qualità delle varie unità di produzione sia descritto da uno schema di test indipendenti. In contrasto con il modello del lancio della moneta, è necessario introdurre un nuovo parametro: la probabilità R che il prodotto è difettoso. Il modello sarà completamente descritto se si presume che tutte le unità di produzione abbiano la stessa probabilità di essere difettose. Se l'ultima ipotesi è falsa, il numero di parametri del modello aumenta. Ad esempio, possiamo supporre che ogni unità di produzione abbia la propria probabilità di essere difettosa.

Discutiamo un modello di controllo della qualità con una probabilità di difetto comune per tutte le unità di prodotto R. Per “raggiungere il numero” quando si analizza il modello, è necessario sostituire R ad un certo valore specifico. Per fare ciò, è necessario andare oltre la struttura di un modello probabilistico e rivolgersi ai dati ottenuti durante il controllo di qualità. La statistica matematica risolve il problema inverso rispetto alla teoria della probabilità. Il suo scopo è trarre conclusioni sulle probabilità alla base del modello probabilistico basato sui risultati delle osservazioni (misure, analisi, test, esperimenti). Ad esempio, in base alla frequenza in cui si verificano prodotti difettosi durante il controllo, si possono trarre conclusioni sulla probabilità di difettosità (vedi sopra il teorema di Bernoulli). Sulla base della disuguaglianza di Chebyshev, sono state tratte conclusioni sulla corrispondenza della frequenza di occorrenza di prodotti difettosi all'ipotesi che la probabilità di difettosità assuma un certo valore.

Pertanto, l'applicazione della statistica matematica si basa su un modello probabilistico di un fenomeno o processo. Vengono utilizzate due serie parallele di concetti: quelli relativi alla teoria (un modello probabilistico) e quelli relativi alla pratica (un campione di risultati osservativi). Ad esempio, la probabilità teorica corrisponde alla frequenza rilevata dal campione. L'aspettativa matematica (serie teorica) corrisponde alla media aritmetica campionaria (serie pratica). Di norma, le caratteristiche del campione sono stime di quelle teoriche. Allo stesso tempo, le grandezze relative alle serie teoriche “sono nella mente dei ricercatori”, si riferiscono al mondo delle idee (secondo l'antico filosofo greco Platone) e non sono disponibili per la misurazione diretta. I ricercatori hanno solo dati selettivi, con l'aiuto dei quali cercano di stabilire le proprietà di un modello probabilistico teorico che sono di loro interesse.

Perché abbiamo bisogno di un modello probabilistico? Il fatto è che solo con il suo aiuto è possibile trasferire le proprietà stabilite dai risultati dell'analisi di un particolare campione ad altri campioni, nonché all'intera cosiddetta popolazione generale. Il termine "popolazione" è usato per riferirsi a una popolazione ampia ma limitata di unità oggetto di studio. Ad esempio, sulla totalità di tutti i residenti della Russia o sulla totalità di tutti i consumatori di caffè istantaneo a Mosca. Lo scopo delle indagini di marketing o sociologiche è trasferire le affermazioni ricevute da un campione di centinaia o migliaia di persone a popolazioni generali di diversi milioni di persone. Nel controllo qualità, un lotto di prodotti funge da popolazione generale.

Per trasferire le inferenze da un campione a una popolazione più ampia, sono necessarie alcune ipotesi sulla relazione delle caratteristiche del campione con le caratteristiche di questa popolazione più ampia. Queste ipotesi si basano su un appropriato modello probabilistico.

Naturalmente, è possibile elaborare dati campione senza utilizzare l'uno o l'altro modello probabilistico. Ad esempio, puoi calcolare la media aritmetica del campione, calcolare la frequenza di adempimento di determinate condizioni, ecc. Tuttavia, i risultati dei calcoli si applicheranno solo a un campione specifico; trasferire le conclusioni ottenute con il loro aiuto su qualsiasi altro insieme non è corretto. Questa attività viene talvolta definita "analisi dei dati". Rispetto ai metodi probabilistico-statistici, l'analisi dei dati ha un valore cognitivo limitato.

Quindi, l'uso di modelli probabilistici basati sulla stima e sulla verifica di ipotesi con l'aiuto di caratteristiche campionarie è l'essenza dei metodi decisionali probabilistico-statistici.

Sottolineiamo che la logica dell'utilizzo delle caratteristiche campionarie per il processo decisionale basato su modelli teorici implica l'uso simultaneo di due serie parallele di concetti, una delle quali corrisponde a modelli probabilistici, e la seconda a dati campionari. Purtroppo, in un certo numero di fonti letterarie, generalmente superate o scritte secondo uno spirito di prescrizione, non viene fatta alcuna distinzione tra caratteristiche selettive e teoriche, il che porta i lettori a smarrimento ed errori nell'uso pratico dei metodi statistici.

Precedente

I fenomeni della vita, come tutti i fenomeni del mondo materiale in generale, hanno due lati indissolubilmente legati: qualitativo, percepito direttamente dai sensi, e quantitativo, espresso dai numeri con l'aiuto del conteggio e della misura.

Nello studio di vari fenomeni naturali, vengono utilizzati contemporaneamente indicatori sia qualitativi che quantitativi. Indubbiamente, solo nell'unità dei lati qualitativo e quantitativo si rivela più pienamente l'essenza dei fenomeni studiati. Tuttavia, in realtà, è necessario utilizzare l'uno o l'altro indicatore.

Indubbiamente, i metodi quantitativi, essendo più obiettivi e accurati, hanno un vantaggio rispetto alle caratteristiche qualitative degli oggetti.

Gli stessi risultati delle misurazioni, sebbene abbiano un valore noto, sono ancora insufficienti per trarre da essi le necessarie conclusioni. I dati digitali raccolti nel processo di test di massa sono solo materiale fattuale grezzo che necessita di un'adeguata elaborazione matematica. Senza elaborazione - ordinamento e sistematizzazione dei dati digitali, non è possibile estrarre le informazioni in essi contenute, valutare l'attendibilità dei singoli indicatori di sintesi e verificare l'attendibilità delle differenze osservate tra di loro. Questo lavoro richiede che gli specialisti abbiano determinate conoscenze, la capacità di generalizzare e analizzare correttamente i dati raccolti nell'esperimento. Il sistema di questa conoscenza è il contenuto della statistica, una scienza che si occupa principalmente dell'analisi dei risultati della ricerca nei campi teorici e applicati della scienza.

Va tenuto presente che la statistica matematica e la teoria della probabilità sono scienze puramente teoriche, astratte; studiano gli aggregati statistici senza tener conto delle specificità dei loro elementi costitutivi. I metodi della statistica matematica e la teoria della probabilità alla base di essa sono applicabili ai più diversi campi del sapere, compreso quello umanistico.

Lo studio dei fenomeni viene effettuato non su singole osservazioni, che possono risultare casuali, atipiche, esprimendo in modo incompleto l'essenza di questo fenomeno, ma su un insieme di osservazioni omogenee, che danno più informazioni complete sull'oggetto in studio. Un certo insieme di soggetti relativamente omogenei, combinati secondo l'una o l'altra caratteristica per lo studio congiunto, è chiamato statistico

aggregato. L'insieme combina un certo numero di osservazioni o registrazioni omogenee.

Gli elementi che compongono un insieme sono detti membri o varianti. . Opzioni sono osservazioni individuali o valori numerici di una caratteristica. Quindi, se designiamo una caratteristica come X (grande), i suoi valori o varianti saranno indicati con x (piccolo), cioè x 1, x 2, ecc.

Il numero totale di opzioni che compongono questo set è chiamato volume ed è indicato dalla lettera n (piccola).

Quando l'intero insieme di oggetti omogenei nel suo insieme è sottoposto all'indagine, si parla di insieme generale generale.Un esempio di tale descrizione continua dell'insieme può essere il censimento nazionale della popolazione, il record statistico totale degli animali in Paese. Naturalmente, un'indagine completa sulla popolazione generale fornisce le informazioni più complete sulle sue condizioni e proprietà. Pertanto, è naturale che i ricercatori si sforzino di combinare quante più osservazioni possibili nell'aggregato.

Tuttavia, in realtà, raramente è necessario ricorrere a un'indagine su tutti i membri della popolazione generale. In primo luogo, perché questo lavoro richiede molto tempo e lavoro e, in secondo luogo, non è sempre fattibile per una serie di motivi e varie circostanze. Quindi, invece di un'indagine continua sulla popolazione generale, di solito una parte di essa, chiamata popolazione campionaria, o campione, viene sottoposta a studio. È il modello con cui viene giudicata l'intera popolazione generale nel suo insieme. Ad esempio, per conoscere la crescita media della popolazione alla leva di una determinata regione o distretto, non è affatto necessario misurare tutte le reclute che vivono in una determinata area, ma è sufficiente misurarne una parte.

1. Il campione deve essere abbastanza rappresentativo, o tipico, cioè in modo che sia costituito principalmente da quelle opzioni che più pienamente rispecchiano la popolazione generale. Pertanto, al fine di avviare l'elaborazione dei dati campione, questi vengono esaminati attentamente e vengono rimosse le opzioni chiaramente atipiche. Ad esempio, quando si analizza il costo dei prodotti fabbricati da un'impresa, dovrebbe essere escluso il costo in quei periodi in cui l'impresa non era completamente fornita di componenti o materie prime.

2. Il campione deve essere obiettivo. Quando si forma un campione, non si dovrebbe agire in modo arbitrario, includere nella sua composizione solo quelle opzioni che sembrano tipiche e rifiutare tutto il resto. Un campione benigno è fatto senza pregiudizio, con il metodo della lotteria o della lotteria, quando nessuna delle opzioni nella popolazione generale presenta vantaggi rispetto alle altre: cadere o non rientrare nella popolazione campione. In altre parole, il campione dovrebbe essere realizzato secondo il principio della selezione casuale, senza intaccarne la composizione.

3. Il campione deve essere qualitativamente omogeneo. Non è possibile includere nello stesso campione dati ottenuti in condizioni diverse, ad esempio il costo di prodotti ottenuti con un numero diverso di dipendenti.

6.2. Raggruppamento dei risultati dell'osservazione

Di solito i risultati di esperimenti e osservazioni vengono inseriti sotto forma di numeri nelle schede di registrazione o in un diario e talvolta semplicemente su fogli di carta: si ottiene una dichiarazione o un registro. Tali documenti iniziali, di regola, contengono informazioni non su uno, ma su diversi segni, secondo i quali sono state fatte osservazioni. Questi documenti servono come la principale fonte di formazione del campione. Questo di solito viene fatto in questo modo: su un foglio di carta separato dal documento principale, ad es. scheda, giornale o estratto conto, vengono scritti i valori numerici dell'attributo su cui è formata la popolazione. Le varianti in un tale insieme sono solitamente presentate sotto forma di una massa casuale di numeri. Pertanto, il primo passo verso la lavorazione di tale materiale è razionalizzarlo, sistematizzarlo - raggruppando la variante in tabelle statistiche o righe.

Una delle forme più comuni di raggruppamento dei dati campione sono le tabelle statistiche. Hanno valore illustrativo, mostrano alcuni risultati generali, la posizione dei singoli elementi nella serie complessiva di osservazioni.

Un'altra forma di raggruppamento primario dei dati del campione è il metodo di classificazione, ad es. la posizione dell'opzione in un certo ordine, aumentando o diminuendo i valori dell'attributo. Di conseguenza, si ottiene una cosiddetta serie classificata, che mostra in quale misura e in che modo una determinata caratteristica varia. Ad esempio, c'è un campione della seguente composizione:

5,2,1,5,7,9,3,5,4,10,4,5,7,3,5, 9,4,12,7,7

Si può notare che il segno cambia da 1 a 12 di alcune unità. Elencati in ordine crescente:

1,2,3,3,4,4,4,5,5,5,5,7,7,7,7,9,9,10,12.,

Di conseguenza, è stata ottenuta una serie a intervalli di valori della caratteristica variabile.

È chiaro che il metodo di graduatoria qui illustrato è applicabile solo a piccoli campioni. In grandi numeri osservazioni, la classifica è difficile, perché la serie è così lunga da perdere il suo significato.

Con un gran numero di osservazioni, è consuetudine classificare il campione sotto forma di doppia riga, ad es. indicando la frequenza o la frequenza delle singole varianti della serie classificata. Tale doppia serie di valori classificati di una caratteristica è chiamata serie di variazioni o serie di distribuzione. L'esempio più semplice di una serie variazionale può essere rappresentato dai dati classificati sopra, se sono disposti come segue:

Valori delle caratteristiche

(opzioni) 1 2 3 4 5 7 9 10 12

ripetibilità

(opzione) frequenze 1 1 2 3 5 4 2 1 1

La serie di variazioni mostra la frequenza con cui le singole varianti si verificano in una data popolazione, come sono distribuite, che è di grande importanza, consentendo di giudicare i modelli di variazione e l'intervallo di variazione dei tratti quantitativi. La costruzione di serie variazionali facilita il calcolo degli indicatori totali - la media aritmetica e la varianza o dispersione attorno al loro valore medio - indicatori che caratterizzano qualsiasi popolazione statistica.

Le serie variazionali sono di due tipi: intermittenti e continue. Una serie variazionale discontinua si ottiene distribuendo quantità discrete, che includono segni di conteggio. Se il segno varia continuamente, ad es. può assumere qualsiasi valore che va dalla variante minima alla massima della popolazione, poi quest'ultima viene distribuita in una serie di variazioni continue.

Per costruire una serie di variazioni di una caratteristica discretamente variabile, è sufficiente collocare l'intero insieme di osservazioni sotto forma di serie classificata, indicando le frequenze delle singole varianti. A titolo di esempio, diamo i dati che mostrano la distribuzione dimensionale di 267 parti (Tabella 5.4)

Tabella 6.1. La distribuzione delle parti per dimensione.

Per costruire una serie di variazioni di caratteristiche in continua variazione, è necessario dividere l'intera variazione dalla variante minima alla variante massima in gruppi o intervalli separati (da-a), chiamati classi, e quindi distribuire tutte le varianti della popolazione tra queste classi . Si otterrà così una doppia serie di variazioni, in cui le frequenze non si riferiscono più a singole opzioni specifiche, ma all'intero intervallo, cioè Le frequenze risultano non essere una variante, ma delle classi.

La scomposizione della variazione generale in classi viene effettuata sulla scala dell'intervallo di classi, che dovrebbe essere la stessa per tutte le classi della serie di variazioni. Il valore dell'intervallo di classe è indicato con i (dalla parola intervalum - intervallo, distanza); è determinato da seguente formula

, (6.1)

dove: i – intervallo di classe, che viene preso come intero;

- opzioni campione massimo e minimo;

lg.n è il logaritmo del numero di classi in cui è suddiviso il campione.

Il numero di classi è impostato arbitrariamente, ma tenendo conto del fatto che il numero di classi dipende in qualche modo dalla dimensione del campione: maggiore è la dimensione del campione, più classi dovrebbero essere e viceversa - con dimensioni del campione più piccole, un numero di classi dovrebbe essere preso. L'esperienza ha dimostrato che anche in piccoli campioni, quando devi raggruppare le opzioni sotto forma di serie variazionali, non dovresti impostare meno di 5-6 classi. Se ci sono 100-150 opzioni, il numero di classi può essere aumentato a 12-15. Se la popolazione è composta da 200-300 opzioni, è divisa in 15-18 classi, ecc. Naturalmente, queste raccomandazioni sono molto condizionate e non possono essere accettate come regola stabilita.

Quando si divide in classi, in ogni caso specifico, si deve tenere conto di una serie di circostanze diverse per garantire che l'elaborazione del materiale statistico dia i risultati più accurati.

Dopo aver impostato l'intervallo di classi e aver suddiviso il campione in classi, la variante viene suddivisa in classi e viene determinato il numero di variazioni (frequenze) di ciascuna classe. Si ottiene così una serie di variazioni, in cui le frequenze non si riferiscono a singole opzioni, ma a determinate classi. La somma di tutte le frequenze della serie variazionale dovrebbe essere uguale alla dimensione del campione, cioè

(6.2)

dove:
- segno di sommatoria;

p è la frequenza.

n è la dimensione del campione.

Se non esiste tale uguaglianza, è stato commesso un errore durante la pubblicazione della variante per classe, che deve essere eliminata.

Solitamente, per pubblicare una variante per classe, viene compilata una tabella ausiliaria, in cui sono presenti quattro colonne: 1) classi per questo attributo (da - a); 2) - il valore medio delle classi, 3) iscrizione dell'opzione per classe, 4) la frequenza delle classi (vedi Tabella 6.2.)

La pubblicazione di un'opzione per classe richiede molta attenzione. La stessa opzione non deve essere contrassegnata due volte o le stesse opzioni rientrano in classi diverse. Per evitare errori nella distribuzione delle opzioni per classe, si raccomanda di non cercare le stesse opzioni nell'aggregato, ma di distribuirle tra le classi, il che non è la stessa cosa. Ignorare questa regola, che si verifica nel lavoro di ricercatori inesperti, richiede molto tempo quando si pubblica una variante e, soprattutto, porta a errori.

Tabella 6.2. Opzione di pubblicazione per classe

Confini di classe

Classe significa (x)

Frequenze delle classi (p), %

assoluto

parente

Dopo aver pubblicato l'opzione e contato il loro numero per ogni classe, otteniamo una serie di variazioni continue. Deve essere trasformato in una serie variazionale discontinua. Per fare ciò, come già notato, prendiamo mezze somme dei valori estremi delle classi. Quindi, ad esempio, il valore mediano della prima classe, pari a 8,8, si ottiene come segue:

(8,6+9,0):2=8,8.

Il secondo valore (9,3) di questa colonna è calcolato in modo simile:

(9.01+9.59):2=9.3 ecc.

Il risultato è una serie di variazioni discontinue che mostra la distribuzione secondo il tratto in studio (Tabella 6.3.)

Tabella 6.3. Serie di variazioni

Il raggruppamento di dati campionari sotto forma di serie variazionale ha un duplice scopo: in primo luogo, come operazione ausiliaria, è necessario per il calcolo degli indicatori totali e, in secondo luogo, le serie di distribuzione mostrano il modello di variazione delle caratteristiche, che è molto importante . Per esprimere più chiaramente questo modello, è consuetudine rappresentare graficamente la serie di variazioni sotto forma di un istogramma (Fig. 6.1.)


Figura 6.1 Distribuzione delle imprese per numero di dipendenti

istogramma descrive la distribuzione di una variante con una variazione continua di una caratteristica. I rettangoli corrispondono alle classi e la loro altezza è il numero di opzioni contenute in ciascuna classe. Se abbassiamo le perpendicolari all'asse delle ascisse dai punti medi dei vertici dei rettangoli dell'istogramma e quindi colleghiamo questi punti insieme, otteniamo un grafico di variazione continua, chiamato poligono o densità di distribuzione.

Metodi probabilistico-statistici per la modellizzazione di sistemi economici


introduzione


Di norma, il compito di identificare la legge di distribuzione di una variabile casuale osservata (identificazione strutturale-parametrica) è solitamente inteso come il problema della scelta di un tale modello parametrico della legge di distribuzione di probabilità che meglio corrisponda ai risultati delle osservazioni sperimentali. Gli errori casuali degli strumenti di misura non sono così spesso soggetti alla legge normale, più precisamente, non sono così spesso ben descritti dal modello legge normale. I dispositivi e i sistemi di misurazione si basano su principi fisici diversi, metodi di misurazione diversi e conversioni diverse dei segnali di misurazione. Gli errori di misura come quantità sono il risultato dell'influenza di molti fattori, casuali e non, che agiscono in modo costante o episodico. Pertanto, è chiaro che solo quando sono soddisfatti determinati prerequisiti (teorici e tecnici), gli errori di misurazione sono sufficientemente ben descritti dal modello di diritto normale.

In generale, si dovrebbe capire che la vera legge di distribuzione (se esiste, ovviamente), che descrive gli errori di un particolare sistema di misura, rimane (rimane) sconosciuta, nonostante tutti i nostri tentativi di identificarla. Sulla base dei dati di misurazione e delle considerazioni teoriche, possiamo solo scegliere un modello probabilistico che in un certo senso si avvicini meglio a questa vera legge. Se il modello costruito è adeguato, cioè i criteri applicati non danno motivo di rigetto, allora sulla base di tale modello è possibile calcolare tutte le caratteristiche probabilistiche della componente casuale dell'errore dello strumento di misura che interessano a noi, che differiranno dai valori reali solo per la componente sistematica (non osservata o non registrata) non esclusa dell'errore di misurazione. La sua piccolezza caratterizza la correttezza delle misurazioni. L'insieme delle possibili leggi di distribuzione di probabilità che possono essere utilizzate per descrivere le variabili casuali osservate non è limitato. Non ha senso porre il compito di identificazione come obiettivo di trovare la vera legge di distribuzione della quantità osservata. Possiamo solo risolvere il problema della scelta del modello migliore da un determinato set. Ad esempio, da quell'insieme di leggi parametriche e insiemi di distribuzione utilizzati in applicazioni e riferimenti ai quali si possono trovare in letteratura.

Approccio classico all'identificazione strutturale-parametrica della legge di distribuzione. Per approccio classico si intende l'algoritmo per la scelta della legge di distribuzione, che è interamente basato sull'apparato della statistica matematica.


1. Concetti elementari su eventi casuali, quantità e funzioni


Abbiamo già visto che per molti esperimenti non ci sono differenze nel calcolo delle probabilità degli eventi, mentre i risultati elementari in questi esperimenti sono molto diversi. Ma sono proprio le probabilità degli eventi che dovrebbero interessarci, e non la struttura dello spazio degli esiti elementari. Pertanto, è tempo di utilizzare, ad esempio, i numeri invece dei risultati elementari più diversi in tutti questi esperimenti "simili". In altre parole, ogni risultato elementare deve essere associato ad alcuni numero reale e funziona solo con i numeri.

Sia dato lo spazio delle probabilità.

Definizione 26.Funzione chiamata variabile casuale, se per qualsiasi set Borel molti è un evento, cioè appartiene - algebra .

Molti , costituito da tali risultati elementari , per cui appartiene , è chiamata l'immagine inversa completa dell'insieme.

Nota 9 . In generale, lascia che la funzione opera da molti nella moltitudine , e sono dati -algebre e sottoinsiemi e rispettivamente. Funzione chiamata misurabile, se per qualsiasi set il suo prototipo completo appartiene .

Nota 10. Il lettore che non vuole preoccuparsi di astrazioni relative a -algebre di eventi e con misurabilità, può tranquillamente presumere che qualsiasi insieme di risultati elementari sia un evento, e, quindi, una variabile casuale è arbitrariofunzione da in . Questo non causa problemi nella pratica, quindi puoi saltare tutto ulteriormente in questo paragrafo.

Ora, dopo aver eliminato i lettori curiosi, proviamo a capire perché una variabile casuale ha bisogno di misurabilità.

Se viene data una variabile casuale , potrebbe essere necessario calcolare le probabilità del modulo , , , (e in generale una varietà di probabilità di cadere negli insiemi Borel sulla linea). Questo è possibile solo se gli insiemi sotto il segno di probabilità sono eventi, perché probabilitàesiste una funzione definita solo su -algebra degli eventi. Il requisito di misurabilità è equivalente al fatto che per qualsiasi set Borel la probabilità è determinata.

Si può pretendere qualcos'altro nella Definizione 26. Ad esempio, affinché un evento sia un successo in qualsiasi intervallo: , o in qualsiasi mezzo intervallo: .

Verifichiamo, ad esempio, che le definizioni 26 e 27 siano equivalenti:

Definizione 27. Funzione è chiamata variabile casuale se per qualsiasi reale molti appartiene a -algebra .

Prova equivalenza delle definizioni 26, 27.

Se - una variabile casuale nel senso della Definizione 26, quindi sarà una variabile casuale nel senso della Definizione 27, poiché qualsiasi intervallo è un set Borel.

Proviamo che vale anche il contrario. Lascia per qualsiasi intervallo fatto . Dobbiamo dimostrare che lo stesso vale per qualsiasi set Borel.

Raccogli in abbondanza tutti i sottoinsiemi della linea reale le cui preimmagini sono eventi. Molti contiene già tutti gli intervalli . Mostriamo ora che l'insieme è un -algebra. Per definizione, se e solo se il set appartiene .

1. Assicuriamoci che . Ma e quindi .

2. Assicuriamoci che per chiunque . Lascia stare . Quindi , perché - -algebra.

3. Assicuriamoci che per ogni . Lascia stare per tutti . Ma - -algebra, quindi

Lo abbiamo dimostrato - -algebra e contiene tutti gli intervalli sulla linea. Ma - il più piccolo di -algebre contenenti tutti gli intervalli sulla retta. Di conseguenza, contiene: .

Diamo esempi di funzioni misurabili e non misurabili.

Esempio 25. Lanciamo il cubo. Lascia stare e due funzioni da in impostato in questo modo: , . Non ancora impostato -algebra , non si può parlare di misurabilità. Una funzione misurabile rispetto ad alcuni -algebre , potrebbe non essere lo stesso per un altro .

Se esiste un insieme di tutti i sottoinsiemi , poi e sono variabili casuali, dal momento che qualsiasi insieme di risultati elementari appartiene , Compreso o . Puoi scrivere una corrispondenza tra i valori di variabili casuali e e le probabilità di assumere questi valori nella forma "tabelle di distribuzione delle probabilità"o, in sintesi, "tabelle di distribuzione":

Qui .


2. Lascia - algebra degli eventi è composto da quattro set:



quelli. un evento è, salvo eventi certi e impossibili, la perdita di un numero pari o dispari di punti. Assicuriamoci che con un tale relativamente povero -algebra , né non sono variabili casuali perché non misurabili. Prendiamo, diciamo . Lo vediamo e


2. Caratteristiche numeriche di variabili casuali


Valore atteso.L'aspettativa matematica di una variabile casuale discreta X, che assume un numero finito di valori xi con probabilità pi, è la somma:


(6 bis)


L'aspettativa matematica di una variabile casuale continua X è l'integrale del prodotto dei suoi valori x e della densità di distribuzione di probabilità f(x):


(6b)


Si assume che l'integrale improprio (6b) sia assolutamente convergente (in caso contrario si dice che il valore atteso M(X) non esiste). L'aspettativa matematica caratterizza il valore medio della variabile casuale X. La sua dimensione coincide con la dimensione della variabile casuale. Proprietà aspettativa matematica:



Dispersione.La varianza di una variabile casuale X è il numero:



La dispersione è una caratteristica della dispersione dei valori di una variabile casuale X rispetto al suo valore medio M (X). La dimensione della varianza è uguale alla dimensione della variabile casuale al quadrato. Sulla base delle definizioni di varianza (8) e aspettativa matematica (5) per una variabile casuale discreta e (6) per una variabile casuale continua, otteniamo espressioni simili per la varianza:



Qui m = M(X).

Proprietà di dispersione:


(10)


Deviazione standard:


(11)


Poiché la dimensione della deviazione standard è la stessa di una variabile casuale, è più spesso della varianza utilizzata come misura della dispersione.

momenti di distribuzione.I concetti di aspettativa matematica e varianza sono casi speciali di più concetto generale per le caratteristiche numeriche di variabili casuali - momenti di distribuzione. I momenti di distribuzione di una variabile casuale vengono introdotti come aspettative matematiche di alcune semplici funzioni di una variabile casuale. Pertanto, il momento dell'ordine k relativo al punto x0 è l'aspettativa matematica M (X - x0) k. I momenti relativi all'origine x = 0 sono detti momenti iniziali e sono indicati:


(12)


Il momento iniziale del primo ordine è il centro di distribuzione della variabile casuale considerata:


(13)


I momenti intorno al centro di distribuzione x = m sono detti momenti centrali e sono indicati:


(14)


Dalla (7) segue che il momento centrale del primo ordine è sempre uguale a zero:


(15)


I momenti centrali non dipendono dall'origine dei valori della variabile casuale, poiché con uno spostamento di un valore costante C, il suo centro di distribuzione si sposta dello stesso valore C e la deviazione dal centro non cambia:


X - m \u003d (X - C) - (m - C).


Ora è ovvio che la varianza è un momento centrale del secondo ordine:


(16)


Asimmetria.momento centrale terzo ordine:


(17)


serve per stimare l'asimmetria della distribuzione. Se la distribuzione è simmetrica rispetto al punto x = m, allora il momento centrale del terzo ordine sarà uguale a zero (così come tutti i momenti centrali degli ordini dispari). Pertanto, se il momento centrale del terzo ordine è diverso da zero, la distribuzione non può essere simmetrica. La quantità di asimmetria viene stimata utilizzando un coefficiente di asimmetria adimensionale:


(18)


Il segno del coefficiente di asimmetria (18) indica l'asimmetria destra o sinistra (Fig. 2).


Riso. 1. Tipi di asimmetria della distribuzione


Eccesso.momento centrale quarto ordine:


(19)


serve a stimare la cosiddetta curtosi, che determina il grado di pendenza (puntualità) della curva di distribuzione in prossimità del centro della distribuzione rispetto alla curva di distribuzione normale. Poiché per una distribuzione normale , allora viene preso come curtosi il seguente valore:


(20)


Sulla fig. 3 mostra esempi di curve di distribuzione con diversi valori di curtosi. Per una distribuzione normale, E = 0. Le curve che hanno un picco più alto del normale hanno una curtosi positiva e quelle più piatte hanno una curtosi negativa.


Riso. 2. Curve di distribuzione con diversi gradi di pendenza (curtosi)


I momenti di ordine superiore nelle applicazioni ingegneristiche della statistica matematica di solito non vengono utilizzati.

Modala variabile casuale discreta è il suo valore più probabile. La moda di una variabile casuale continua è il suo valore al quale la densità di probabilità è massima (Fig. 2). Se la curva di distribuzione ha un massimo, la distribuzione è chiamata unimodale. Se la curva di distribuzione ha più di un massimo, la distribuzione è chiamata polimodale. A volte ci sono distribuzioni le cui curve non hanno un massimo, ma un minimo. Tali distribuzioni sono dette antimodali. Nel caso generale, la modalità e l'aspettativa matematica di una variabile casuale non coincidono. In un caso speciale, per un modale, ad es. avendo un modo, una distribuzione simmetrica, e purché vi sia un'aspettativa matematica, quest'ultimo coincide con il modo e il centro di simmetria della distribuzione.

Medianola variabile casuale X è il suo valore Me, per il quale avviene l'uguaglianza: quelli. è altrettanto probabile che la variabile casuale X sia minore o maggiore di Me. Geometricamente, la mediana è l'ascissa del punto in cui l'area sotto la curva di distribuzione è divisa in due. Nel caso di una distribuzione modale simmetrica, la mediana, la moda e la media sono le stesse.


. Valutazione statistica delle leggi di distribuzione di variabili casuali


La popolazione generale è la totalità di tutti gli oggetti da studiare o i possibili risultati di tutte le osservazioni effettuate stesse condizioni su un oggetto.

insieme di campionamento oppure un campione è un insieme di oggetti o risultati dell'osservazione di un oggetto, selezionati casualmente dalla popolazione generale.

Misura di provaè il numero di oggetti o osservazioni nel campione.

I valori specifici del campione sono chiamati valori osservati della variabile casuale X. I valori osservati sono registrati nel protocollo. Il protocollo è una tabella. Il protocollo compilato è la forma principale di registrazione dell'elaborazione del materiale ricevuto. Per ottenere conclusioni affidabili e affidabili, il campione deve essere sufficientemente rappresentativo in termini di volume. Un grande campione è un insieme di numeri non ordinato. Per lo studio, il campione viene portato in una forma ordinata visiva. Per fare ciò, il protocollo trova i valori più grandi e più piccoli di una variabile casuale. Il campione, ordinato in ordine crescente, è mostrato nella Tabella 1.

Tabella 1. Protocollo

8,66-5,49-4,11-3,48-2,9-2,32-1,82-1,09-0,440,64-8,31-4,71-3,92-3,41-2,85-2,31-1,82-1,01-0,430,71-8,23-4,68-3,85-3,33-2,83-2,29-1,8-0,99-0,430,73-7,67-4,6-3,85-3,25-2,77-2,27-1,77-0,95-0,310,99-6,64-4,43-3,81-3,08-2,72-2,25-1,73-0,89-0,31,03-6,6-4,38-3,8-3,07-2,67-2,19-1,38-0,70,041,05-6,22-4,38-3,77-3,01-2,6-2,15-1,32-0,560,081,13-5,87-4,25-3,73-3,01-2,49-2,09-1,3-0,510,151,76-5,74-4,18-3,59-2,99-2,37-2,01-1,28-0,490,262,95-5,68-4,14-3,49-2,98-2,33-1,91-1,24-0,480,534,42

Intervallo di campionamentoè la differenza tra il più grande e il valore più piccolo variabile casuale X:

L'intervallo del campione è diviso in k intervalli - cifre. Il numero di cifre è impostato in base alla dimensione dell'intervallo di campionamento da 8 a 25, in questo tesina prendiamo k = 10.

Quindi la lunghezza dell'intervallo sarà uguale a:

Nel protocollo, contiamo il numero di valori osservati che rientrano in ciascun intervallo, li indichiamo m1, m2, ..., m10. .

Chiamiamo mi tasso di successovariabile casuale nell'intervallo i. Se un valore osservato di una variabile casuale coincide con la fine dell'intervallo, allora questo valore della variabile casuale, di comune accordo, viene assegnato a uno degli intervalli.

Dopo aver determinato le frequenze mi, definiamo frequenzevariabile casuale, cioè troviamo il rapporto tra le frequenze mi e il numero totale di valori osservati n.

Frequenza, condizione di completezza -

Trova il centro di ogni intervallo: .

Facciamo una tabella 2

Tabella dei valori dei limiti di intervallo e frequenze corrispondenti , dove i = 1, 2, 3, …, k, è chiamata serie statistica. Una rappresentazione grafica di una serie statistica è chiamata istogramma. È costruito come segue: gli intervalli sono tracciati lungo l'ascissa e su ciascuno di questi intervalli, come sulla base, viene costruito un rettangolo, la cui area è uguale alla frequenza corrispondente.

, - l'altezza del rettangolo, .


Tavolo 2

Numero intervalloBordo sinistro dell'intervalloBordo destro dell'intervalloIntervalloMedio dell'intervalloFrequenza dell'intervalloFrequenza dell'intervalloAltezza del rettangolo .030.02293-6.044-4.736(-6.044; -4.736)-5.3940.040.03064-4.736-3.428(-4.736; -3.428) -4.082200.20.15295-3.428-2.12 (- 3.428; -2.12) -2.774260.260.19886-2.12-0.812 (-2.12; -0.812) -1.466180.180.496 (-0.812; 0,496) -0.158140.140.107080.4961.804 (0.496; 1.804)1.1590.090.068891.8043.112(1.804; 3.112)2.45810.010.0076103.1124.42(3.112; 4.42 )3.76610.010.0076Somma1001

Figura 3


La funzione di distribuzione statistica è la frequenza di una variabile casuale che non supera un dato valore X:

Per una variabile casuale discreta X, la funzione di distribuzione statistica è trovata dalla formula:

Scriviamo la funzione di distribuzione statistica in forma espansa:

dove è la metà dell'intervallo i, e sono le frequenze corrispondenti, dove i=1, 2,…, k.

Il grafico della funzione di distribuzione statistica è una linea a gradini, i cui punti di interruzione sono i punti medi degli intervalli e i salti finali sono uguali alle frequenze corrispondenti.


Figura 3


Calcolo delle caratteristiche numeriche di una serie statistica

Aspettativa matematica statistica,

varianza statistica,

Deviazione standard statistica.

Aspettativa statisticao statistico medioè chiamata media aritmetica dei valori osservati della variabile casuale X.

Dispersione statisticaè chiamato valore medio aritmetico o

Con una grande dimensione del campione, i calcoli con le formule portano a calcoli ingombranti. Per semplificare i calcoli, viene utilizzata una serie statistica con limiti e frequenze , dove i = 1, 2, 3, …, k, trova i punti medi degli intervalli , quindi tutti gli elementi della selezione , che cadeva nell'intervallo , viene sostituito da un valore singolo , allora ci saranno tali valori in ogni intervallo.

dove - valore medio dell'intervallo corrispondente ;- frequenza di intervallo

Tabella 4. Caratteristiche numeriche

FREQUENZA PIXIPI (XI-M) ^ 2 (XI-M) ^ 2 * PI1-8.004.48.04.04-0.215.48.084.3558 6.4.0484.3558 6.48.04.03-0.2004.04.04.3558 6.4.390.03-0.2004.04.04.3558 6.4.04.03-0.0.4.4.04.03-0.0.4.4.0484.355 6 6.4.04.04.3558 6.4.390. -2.7740.26-0.72120.143880.03746-1.4660.18-0.26390.862450.15527 Media statistica -2.3947 Varianza statistica 5.3822 Deviazione standard statistica2.3200

Determina la posizione del centro di raggruppamento dei valori osservati della variabile casuale.

, caratterizzare la dispersione dei valori osservati della variabile casuale intorno

In ogni distribuzione statistica, ci sono inevitabilmente elementi di casualità. Tuttavia, con un numero molto elevato di osservazioni, questi incidenti vengono appianati e i fenomeni casuali rivelano una regolarità intrinseca ad essi.

Quando si elabora materiale statistico, si deve decidere come scegliere una curva teorica per una data serie statistica. Questa curva di distribuzione teorica dovrebbe esprimere le caratteristiche essenziali della distribuzione statistica: questo compito è chiamato compito di smussare o livellare le serie statistiche.

A volte forma generale la distribuzione di una variabile casuale X deriva dalla natura stessa di questa variabile casuale.

Sia la variabile casuale X il risultato della misurazione di alcuni quantità fisica dispositivo.

X \u003d valore esatto di una grandezza fisica + errore dello strumento.

L'errore casuale del dispositivo durante la misurazione ha natura totale ed è distribuito secondo la legge normale. Pertanto, la variabile casuale X ha la stessa distribuzione, cioè distribuzione normale con densità di probabilità:


Dove , , .


Parametri e sono determinati in modo che le caratteristiche numeriche della distribuzione teorica siano uguali alle corrispondenti caratteristiche numeriche della distribuzione statistica. In una distribuzione normale, si presume che ,,, allora la funzione di distribuzione normale assumerà la forma:

Tabella 5. Curva di livellamento

Intervallo numeroIntervallo medio Xi funzione tabulata curva normale 1-8.0060-2.41870.02140.00922-6.6980-1.85490.07140.03083-5.3900-1.29110.17340.07474-4.0820-0.72730.30620.13205- 2.7740-0.16350.39360.1697M-2.394700.39890.17206-1.46600.40030.36820.15877-0.15800.96410.25070.108081.15001.52790.12420 .05802.4 09170.04480.0193103.76602.65550.01170.0051

Costruiamo una curva normale teorica da punti sullo stesso grafico con l'istogramma della serie statistica (Errore! Fonte di riferimento non trovata).


Figura 6


Appiattimento della funzione di distribuzione statistica

Funzione di distribuzione statistica allineare con la funzione di distribuzione della legge normale:



dove ,,è la funzione di Laplace.


Tabella 7 Funzione di distribuzione

Intervallo numeroIntervallo medio Xi Funzione Laplace funzione di distribuzione 1-8.0060-2.4187-0.4980-1.854-0.4689.034-4.0.470-1.034-4.0.470-0.123 5-0.0.4740.23 33 5-0.0470.435 3-0.0.470.435 3-0.0470.435 3-0.0470.435 3-0.0470.435 3-0.0.470.4354mos-1.0470.435 3-0.047000.5000 3-1.047000.50006-1.4947000.50006-1.4666.5000 6-1.46600.50006-1.46600. 40030.15550.65557-0.15800.96410.33250.832581.15001, 52790,43670,936792,45802,09170,48180,9818103,76602,65550,49600,9960

Costruiamo un grafico della funzione di distribuzione teorica per punti / insieme a un grafico della funzione di distribuzione statistica.


Figura 6


Sia studiata una variabile casuale X con aspettativa matematica e dispersione , entrambi i parametri sono sconosciuti.

Sia х1, х2, х3, …, хn un campione ottenuto come risultato di n osservazioni indipendenti di una variabile casuale X. Per enfatizzare la natura casuale dei valori х1, х2, х3, …, хn, li riscriviamo Nella forma:

Х1, Х2, Х3, …, Хn, dove Хi è il valore della variabile casuale Х nell'i-esimo esperimento.

Sulla base di questi dati sperimentali, è necessario stimare l'aspettativa matematica e la varianza di una variabile casuale. Tali stime sono chiamate stime puntuali e, come stima di m e D, possiamo prendere l'aspettativa statistica e varianza statistica, dove



Prima dell'esperimento, il campione X1, X2, X3, ..., Xn è un insieme di variabili casuali indipendenti che hanno un'aspettativa matematica e varianza, il che significa che la distribuzione di probabilità è la stessa della variabile casuale X stessa. Quindi:


Dove i = 1, 2, 3, …, n.


Sulla base di ciò, troviamo l'aspettativa matematica e la varianza della variabile casuale (usando le proprietà dell'aspettativa matematica).

Quindi, l'aspettativa matematica della media statistica è uguale al valore esatto dell'aspettativa matematica m del valore misurato e alla varianza della media statistica n volte inferiore alla dispersione dei singoli risultati di misurazione.


a


Ciò significa che con una grande dimensione del campione N, la media statistica è un valore quasi non casuale, devia solo leggermente dal valore esatto della variabile casuale m. Questa legge è chiamata legge grandi numeri Chebyshev.

Stime puntuali di valori sconosciuti di aspettativa matematica e varianza hanno Grande importanza nella fase iniziale del trattamento dei dati statici. Il loro svantaggio è che non si sa con quale accuratezza forniscano il parametro stimato.

Sia per il dato campione X1, X2, X3, …, Xn stime statistiche esatte e , allora le caratteristiche numeriche della variabile casuale X saranno approssimativamente uguali a . Per un campione di piccole dimensioni, il problema della stima dello streaming è essenziale, perché tra m e , D e le deviazioni non sono abbastanza grandi. Inoltre, quando si risolvono problemi pratici, è necessario non solo trovare valori approssimativi di m e D, ma anche valutarne l'accuratezza e l'affidabilità. Lascia stare , cioè. è una stima puntuale per m. È ovvio che più accuratamente determina m, minore è il modulo della differenza . Lascia stare , dove ?>0, poi meno ?, tanto più precisa è la stima di m. In questo modo, ?>0 caratterizza l'accuratezza della stima dei parametri. Tuttavia, i metodi statistici non consentono di affermare categoricamente che la stima del valore reale di m soddisfa , possiamo solo parlare di probabilità ?, con cui questa disuguaglianza è soddisfatta:

In questo modo, ?- questo livello di confidenzao affidabilità della stima, significato ? vengono scelti in anticipo a seconda del problema da risolvere. Affidabilità ? è consuetudine scegliere 0.9; 0,95; 0,99; 0,999. Gli eventi con una tale probabilità sono praticamente certi. Per un dato livello di confidenza, puoi trovare il numero ?>0 da .

Quindi otteniamo l'intervallo , che copre con probabilità ? il vero valore dell'aspettativa m, la lunghezza di questo intervallo è 2 ?. Questo intervallo è chiamato intervallo di confidenza. E questo modo di stimare il parametro sconosciuto m - intervallo.



Sia dato un campione Х1, Х2, Х3, …, Хn, e che questo campione trovi , ,.

È necessario trovare l'intervallo di confidenza per aspettativa matematica m con probabilità di confidenza ?. Valore è una variabile casuale con aspettativa matematica, .

Valore casuale ha natura totale, con un'ampia ampiezza campionaria, è distribuito secondo una legge prossima alla normalità. Quindi la probabilità che una variabile casuale rientri nell'intervallo sarà uguale a:


Dove


Dove è la funzione di Laplace.

Dalla formula (3) e dalle tabelle della funzione di Laplace, troviamo il numero ?>0 e scrivi l'intervallo di confidenza per il valore esatto variabile casuale X con affidabilità ?.

In questo corso il lavoro, il valore ? sostituire , e quindi la formula (3) assumerà la forma:

Troviamo l'intervallo di confidenza , che contiene l'aspettativa matematica. In ? = 0,99, n = 100, ,.

secondo le tabelle di Laplace troviamo:

Da qui? = 0,5986.

Intervallo di confidenza in cui il valore esatto dell'aspettativa matematica giace con una probabilità del 99%.


Conclusione

distribuzione casuale economica

Risolvere i problemi di identificazione strutturale-parametrica con campioni di dimensioni limitate, che, di regola, hanno i metrologi, aggrava il problema. In questo caso, la correttezza dell'applicazione dei metodi statistici di analisi è ancora più importante. l'uso di stime con le migliori proprietà statistiche e criteri con la massima potenza.

Quando si risolvono problemi di identificazione, è preferibile affidarsi all'approccio classico. Durante l'identificazione, si raccomanda di considerare un insieme più ampio di leggi di distribuzione, compresi i modelli sotto forma di miscugli di leggi. In questo caso, per qualsiasi distribuzione empirica saremo sempre in grado di costruire un modello matematico adeguato, statisticamente significativamente più motivato.

Dovrebbe concentrarsi sull'uso e lo sviluppo sistemi software, fornendo una soluzione ai problemi di identificazione strutturale-parametrica delle leggi di distribuzione per qualsiasi forma di osservazione registrata (misure), comprese metodi moderni statis analisi analitica, concentrarsi su un uso ampio, ma corretto, dei metodi di modellazione al computer nella ricerca. Abbiamo già visto che per molti esperimenti non ci sono differenze nel calcolo delle probabilità degli eventi, mentre i risultati elementari in questi esperimenti sono molto diversi. Ma sono proprio le probabilità degli eventi che dovrebbero interessarci, e non la struttura dello spazio degli esiti elementari. Pertanto, è tempo di utilizzare, ad esempio, i numeri invece dei risultati elementari più diversi in tutti questi esperimenti "simili". In altre parole, a ogni risultato elementare dovrebbe essere assegnato un numero reale e funzionare solo con i numeri.

Inviare il tuo buon lavoro nella knowledge base è semplice. Usa il modulo sottostante

Gli studenti, i dottorandi, i giovani scienziati che utilizzano la base di conoscenze nei loro studi e nel loro lavoro ti saranno molto grati.

postato su http://www.allbest.ru/

postato su http://www.allbest.ru/

introduzione

1. Distribuzione del chi quadrato

Conclusione

Appendice

introduzione

Come vengono utilizzati nelle nostre vite gli approcci, le idee ei risultati della teoria della probabilità? teoria matematica dei quadrati

La base è un modello probabilistico di un fenomeno o processo reale, ad es. un modello matematico in cui le relazioni oggettive sono espresse in termini di teoria della probabilità. Le probabilità vengono utilizzate principalmente per descrivere le incertezze che devono essere prese in considerazione quando si prendono decisioni. Ciò si riferisce sia alle opportunità (rischi) indesiderabili che a quelle attraenti (" Caso fortunato"). A volte la casualità viene introdotta deliberatamente nella situazione, ad esempio durante l'estrazione a sorte, la selezione casuale di unità per il controllo, lo svolgimento di lotterie o sondaggi sui consumatori.

La teoria delle probabilità consente di calcolare altre probabilità che interessano il ricercatore.

Un modello probabilistico di un fenomeno o processo è alla base della statistica matematica. Vengono utilizzate due serie parallele di concetti: quelli relativi alla teoria (un modello probabilistico) e quelli relativi alla pratica (un campione di risultati osservativi). Ad esempio, la probabilità teorica corrisponde alla frequenza rilevata dal campione. L'aspettativa matematica (serie teorica) corrisponde alla media aritmetica campionaria (serie pratica). Di norma, le caratteristiche del campione sono stime di quelle teoriche. Allo stesso tempo, le quantità relative alle serie teoriche "sono nella mente dei ricercatori", riferite al mondo delle idee (secondo l'antico filosofo greco Platone), non sono disponibili per la misurazione diretta. I ricercatori hanno solo dati selettivi, con l'aiuto dei quali cercano di stabilire le proprietà del modello probabilistico teorico che sono di loro interesse.

Perché abbiamo bisogno di un modello probabilistico? Il fatto è che solo con il suo aiuto è possibile trasferire le proprietà stabilite dai risultati dell'analisi di un particolare campione ad altri campioni, nonché all'intera cosiddetta popolazione generale. Il termine "popolazione" è usato per riferirsi a una popolazione ampia ma limitata di unità oggetto di studio. Ad esempio, sulla totalità di tutti i residenti della Russia o sulla totalità di tutti i consumatori di caffè istantaneo a Mosca. Lo scopo delle indagini di marketing o sociologiche è trasferire le affermazioni ricevute da un campione di centinaia o migliaia di persone a popolazioni generali di diversi milioni di persone. Nel controllo qualità, un lotto di prodotti funge da popolazione generale.

Per trasferire le inferenze da un campione a una popolazione più ampia, sono necessarie alcune ipotesi sulla relazione delle caratteristiche del campione con le caratteristiche di questa popolazione più ampia. Queste ipotesi si basano su un appropriato modello probabilistico.

Naturalmente, è possibile elaborare dati campione senza utilizzare l'uno o l'altro modello probabilistico. Ad esempio, puoi calcolare la media aritmetica del campione, calcolare la frequenza di adempimento di determinate condizioni, ecc. Tuttavia, i risultati dei calcoli si applicheranno solo a un campione specifico; trasferire le conclusioni ottenute con il loro aiuto su qualsiasi altro insieme non è corretto. Questa attività viene talvolta definita "analisi dei dati". Rispetto ai metodi probabilistico-statistici, l'analisi dei dati ha un valore cognitivo limitato.

Quindi, l'uso di modelli probabilistici basati sulla stima e sulla verifica di ipotesi con l'aiuto di caratteristiche campionarie è l'essenza dei metodi decisionali probabilistico-statistici.

1. Distribuzione del chi quadrato

La distribuzione normale definisce tre distribuzioni che ora vengono spesso utilizzate elaborazione statistica dati. Queste sono le distribuzioni di Pearson ("chi - quadrato"), Student e Fisher.

Ci concentreremo sulla distribuzione ("chi - quadrato"). Questa distribuzione fu studiata per la prima volta dall'astronomo F. ​​Helmert nel 1876. In connessione con la teoria gaussiana degli errori, ha studiato la somma dei quadrati di n variabili casuali standard distribuite normalmente indipendenti. Successivamente, Karl Pearson chiamò questa funzione di distribuzione "chi-quadrato". E ora la distribuzione porta il suo nome.

Grazie a stretta connessione con una distribuzione normale, gioca la distribuzione h2 ruolo importante in teoria della probabilità e statistica matematica. La distribuzione h2 e molte altre distribuzioni definite dalla distribuzione h2 (ad esempio la distribuzione di Student), descrivono le distribuzioni campionarie di varie funzioni dalla normale risultati distribuiti osservazioni e sono usati per costruire intervalli di confidenza e test statistici.

Distribuzione di Pearson (chi - quadrato) - distribuzione di una variabile casuale in cui X1, X2, ..., Xn sono normali variabili casuali indipendenti e l'aspettativa matematica di ciascuna di esse è zero e la deviazione standard è uno.

Somma dei quadrati

distribuito secondo la legge ("chi - quadrato").

In questo caso, il numero di termini, ad es. n, è chiamato il "numero di gradi di libertà" della distribuzione chi quadrato. All'aumentare del numero di gradi di libertà, la distribuzione si avvicina lentamente alla normalità.

La densità di questa distribuzione

Quindi, la distribuzione di h2 dipende da un parametro n - il numero di gradi di libertà.

La funzione di distribuzione h2 ha la forma:

se h2?0. (2.7.)

La figura 1 mostra un grafico della densità di probabilità e della funzione di distribuzione χ2 per diversi gradi di libertà.

Figura 1 Dipendenza della densità di probabilità q (x) nella distribuzione di h2 (chi - quadrato) per un diverso numero di gradi di libertà

Momenti della distribuzione "chi-quadrato":

La distribuzione del chi quadrato viene utilizzata nella stima della varianza (utilizzando un intervallo di confidenza), nel verificare ipotesi di accordo, omogeneità, indipendenza, principalmente per variabili qualitative (classificate) che assumono un numero finito di valori e in molti altri compiti di dati statistici analisi.

2. Il "Chi-quadrato" nei problemi di analisi statistica dei dati

I metodi statistici di analisi dei dati sono utilizzati in quasi tutte le aree dell'attività umana. Vengono utilizzati ogni qualvolta sia necessario ottenere e motivare eventuali giudizi su un gruppo (oggetti o soggetti) con una qualche eterogeneità interna.

La moderna fase di sviluppo dei metodi statistici può essere contata dal 1900, quando l'inglese K. Pearson fondò la rivista "Biometrika". Primo terzo del 20° secolo passato sotto il segno della statistica parametrica. Sono stati studiati metodi basati sull'analisi di dati da famiglie parametriche di distribuzioni descritte dalle curve della famiglia di Pearson. La più popolare è stata la distribuzione normale. Per verificare le ipotesi sono stati utilizzati i criteri di Pearson, Student e Fisher. Sono stati proposti il ​​metodo della massima verosimiglianza, l'analisi della varianza e sono state formulate le idee principali per la pianificazione dell'esperimento.

La distribuzione del chi quadrato è una delle più utilizzate nelle statistiche per testare ipotesi statistiche. Sulla base della distribuzione del "chi quadrato", viene costruito uno dei più potenti test di bontà di adattamento, il test del "chi quadrato" di Pearson.

Il test di bontà di adattamento è un criterio per verificare l'ipotesi sulla proposta di legge della distribuzione incognita.

Il test p2 ("chi-quadrato") viene utilizzato per verificare l'ipotesi di diverse distribuzioni. Questo è il suo merito.

La formula di calcolo del criterio è uguale a

dove m e m" sono rispettivamente frequenze empiriche e teoriche

distribuzione in esame;

n è il numero di gradi di libertà.

Per la verifica, dobbiamo confrontare le frequenze empiriche (osservate) e teoriche (calcolate nell'ipotesi di una distribuzione normale).

Se le frequenze empiriche coincidono completamente con le frequenze calcolate o attese, S (E - T) = 0 e anche il criterio ch2 sarà uguale a zero. Se S (E - T) non è uguale a zero, ciò indicherà una discrepanza tra le frequenze calcolate e le frequenze empiriche della serie. In questi casi è necessario valutare la significatività del criterio p2, che teoricamente può variare da zero a infinito. Questo viene fatto confrontando il valore effettivamente ottenuto di ch2f con il suo valore critico (ch2st) (a) e il numero di gradi di libertà (n).

La distribuzione dei valori probabili della variabile casuale h2 è continua e asimmetrica. Dipende dal numero di gradi di libertà (n) e si avvicina a una distribuzione normale all'aumentare del numero di osservazioni. Pertanto, l'applicazione del criterio p2 alla valutazione distribuzioni discreteè associato ad alcuni errori che ne pregiudicano il valore, soprattutto per piccoli campioni. Per ottenere stime più accurate, il campione distribuito nelle serie di variazioni dovrebbe avere almeno 50 opzioni. La corretta applicazione del criterio p2 richiede inoltre che le frequenze delle varianti nelle classi estreme non siano inferiori a 5; se sono inferiori a 5, vengono combinate con le frequenze delle classi vicine in modo che l'importo totale sia maggiore o uguale a 5. In base alla combinazione di frequenze, diminuisce anche il numero di classi (N). Il numero dei gradi di libertà è fissato in base al numero secondario delle classi, tenendo conto del numero dei vincoli alla libertà di variazione.

Poiché l'accuratezza della determinazione del criterio p2 dipende in gran parte dall'accuratezza del calcolo delle frequenze teoriche (T), è necessario utilizzare frequenze teoriche non arrotondate per ottenere la differenza tra le frequenze empiriche e calcolate.

Prendiamo ad esempio uno studio pubblicato su un sito web dedicato all'applicazione dei metodi statistici nelle discipline umanistiche.

Il test del chi quadrato consente di confrontare le distribuzioni di frequenza, distribuite normalmente o meno.

La frequenza si riferisce al numero di occorrenze di un evento. Di solito, la frequenza di accadimento di un evento viene trattata quando le variabili sono misurate nella scala dei nomi e le loro altre caratteristiche, ad eccezione della frequenza, sono impossibili o problematiche da selezionare. In altre parole, quando una variabile ha caratteristiche di qualità. Inoltre, molti ricercatori tendono a tradurre i punteggi dei test in livelli (alto, medio, basso) e costruire tabelle di distribuzione dei punteggi per scoprire il numero di persone a questi livelli. Per dimostrare che in uno dei livelli (in una delle categorie) il numero di persone è davvero maggiore (minore), viene utilizzato anche il coefficiente Chi quadrato.

Diamo un'occhiata all'esempio più semplice.

Un test di autostima è stato condotto tra gli adolescenti più giovani. I punteggi dei test sono stati tradotti in tre livelli: alto, medio, basso. Le frequenze sono state così distribuite:

Alto (H) 27 pers.

Medio (C) 12 persone

Basso (H) 11 pers.

È ovvio che la maggior parte dei bambini con alta autostima, tuttavia, questo deve essere dimostrato statisticamente. Per fare ciò, utilizziamo il test del chi quadrato.

Il nostro compito è verificare se i dati empirici ottenuti differiscono da quelli teoricamente ugualmente probabili. Per fare ciò, è necessario trovare le frequenze teoriche. Nel nostro caso, le frequenze teoriche sono frequenze equiprobabili che si trovano sommando tutte le frequenze e dividendo per il numero di categorie.

Nel nostro caso:

(B + C + H) / 3 \u003d (27 + 12 + 11) / 3 \u003d 16,6

La formula per calcolare il test del chi quadrato è:

h2 \u003d? (E - T) I/T

Costruiamo una tabella:

Empirico (Uh)

Teorico (T)

(E - T)І / T

Trova la somma dell'ultima colonna:

Ora è necessario trovare il valore critico del criterio secondo la tabella dei valori critici (Tabella 1 in Appendice). Per fare ciò, abbiamo bisogno del numero di gradi di libertà (n).

n = (R - 1) * (C - 1)

dove R è il numero di righe nella tabella, C è il numero di colonne.

Nel nostro caso, c'è solo una colonna (che significa le frequenze empiriche originali) e tre righe (categorie), quindi la formula cambia: escludiamo le colonne.

n = (R - 1) = 3-1 = 2

Per la probabilità di errore p?0,05 e n ​​= 2, il valore critico è h2 = 5,99.

Il valore empirico ottenuto è maggiore del valore critico - le differenze di frequenza sono significative (n2= 9,64; p≤0,05).

Come puoi vedere, il calcolo del criterio è molto semplice e non richiede molto tempo. Il valore pratico del test del chi quadrato è enorme. Questo metodo è molto utile nell'analisi delle risposte ai questionari.

Facciamo un esempio più complesso.

Ad esempio, uno psicologo vuole sapere se è vero che gli insegnanti sono più prevenuti verso i ragazzi che verso le ragazze. Quelli. più propensi a lodare le ragazze. Per fare ciò, lo psicologo ha analizzato le caratteristiche degli studenti scritte dai docenti, riguardo alla frequenza di occorrenza di tre parole: "attivo", "diligente", "disciplinato", sono stati contati anche i sinonimi di parole.

I dati sulla frequenza di occorrenza delle parole sono stati inseriti nella tabella:

Per elaborare i dati ottenuti, utilizziamo il test del chi quadrato.

Per fare ciò, costruiamo una tabella di distribuzione delle frequenze empiriche, ad es. le frequenze che osserviamo:

Teoricamente, ci aspettiamo che le frequenze siano distribuite equamente, cioè la frequenza sarà distribuita proporzionalmente tra maschi e femmine. Costruiamo una tabella di frequenze teoriche. Per fare ciò, moltiplica la somma della riga per la somma della colonna e dividi il numero risultante per la somma totale (s).

La tabella risultante per i calcoli sarà simile a questa:

Empirico (Uh)

Teorico (T)

(E - T)І / T

ragazzi

"Attivo"

"Diligente"

"Disciplinato"

"Attivo"

"Diligente"

"Disciplinato"

Importo: 4,21

h2 \u003d? (E - T) I/T

dove R è il numero di righe nella tabella.

Nel nostro caso, chi quadrato = 4,21; n = 2.

Secondo la tabella dei valori critici del criterio, troviamo: con n = 2 e un livello di errore di 0,05, il valore critico h2 = 5,99.

Il valore risultante è inferiore al valore critico, il che significa che l'ipotesi nulla è accettata.

Conclusione: gli insegnanti non attribuiscono importanza al genere del bambino quando scrivono le sue caratteristiche.

Conclusione

Gli studenti di quasi tutte le specialità studiano alla fine del corso matematica superiore sezione "teoria della probabilità e statistica matematica", in realtà vengono a conoscenza solo di alcuni concetti e risultati di base, che chiaramente non sono sufficienti per lavoro pratico. Gli studenti incontrano alcuni metodi di ricerca matematica in corsi speciali (ad esempio, "Previsione e pianificazione di fattibilità", "Analisi tecnica ed economica", "Controllo della qualità del prodotto", "Marketing", "Controllo", " Metodi matematici Previsioni", "Statistiche", ecc. - nel caso di studenti di specialità economiche), tuttavia, la presentazione nella maggior parte dei casi è molto abbreviata e di natura prescrittiva, di conseguenza, gli specialisti in statistica applicata non hanno conoscenze sufficienti.

Pertanto, il corso "Statistica applicata" in università tecniche, e nelle università economiche - il corso "Econometrics", poiché l'econometrics è, come sapete, un'analisi statistica di dati economici specifici.

La teoria della probabilità e la statistica matematica forniscono le conoscenze fondamentali per la statistica applicata e l'econometria.

Sono necessari per gli specialisti per il lavoro pratico.

Ho considerato un modello probabilistico continuo e ho cercato di mostrarne l'usabilità con esempi.

E alla fine del mio lavoro, sono giunto alla conclusione che l'implementazione competente delle procedure di base dell'analisi dei dati matematici e statici, la verifica statica delle ipotesi è impossibile senza la conoscenza del modello del chi quadrato, nonché la capacità di utilizzare la sua tavola.

Bibliografia

1. Orlov AI Statistiche applicate. M.: Casa editrice "Esame", 2004.

2. Gmurman VE Teoria della probabilità e statistica matematica. M.: Scuola superiore, 1999. - 479s.

3. Ayvozyan SA Teoria della probabilità e statistica applicata, v.1. M.: Unity, 2001. - 656s.

4. Khamitov GP, Vedernikova TI Probabilità e statistica. Irkutsk: BSUEP, 2006 - 272p.

5. Ezhova L.N. Econometria. Irkutsk: BSUEP, 2002. - 314p.

6. Mosteller F. Cinquanta divertenti problemi probabilistici con soluzioni. M.: Nauka, 1975. - 111 p.

7. Mosteller F. Probabilità. M.: Mir, 1969. - 428.

8. Yaglom AM Probabilità e informazione. M.: Nauka, 1973. - 511s.

9. Chistyakov V.P. Corso di probabilità. M.: Nauka, 1982. - 256s.

10. Kremer N.Sh. Teoria della probabilità e statistica matematica. M.: UNITI, 2000. - 543p.

11. Enciclopedia matematica, v.1. M.: Enciclopedia sovietica, 1976. - 655.

12. http://psystat.at.ua/ - Statistica in psicologia e pedagogia. Articolo Test del chi quadrato.

Appendice

Punti di distribuzione critici p2

Tabella 1

Ospitato su Allbest.ru

...

Documenti simili

    Modello probabilistico e assiomatica A.N. Kolmogorov. Variabili casuali e vettori, il classico problema limite della teoria della probabilità. Elaborazione primaria dei dati statistici. Stime puntuali di caratteristiche numeriche. Verifica statistica delle ipotesi.

    manuale di formazione, aggiunto il 03/02/2010

    Regole per l'esecuzione e la progettazione opere di controllo per reparto corrispondenza. Compiti ed esempi di risoluzione di problemi in statistica matematica e teoria della probabilità. Tabelle dei dati di riferimento della distribuzione, densità di distribuzione normale standard.

    manuale di formazione, aggiunto il 29/11/2009

    I principali metodi di descrizione formalizzata e analisi dei fenomeni casuali, elaborazione e analisi dei risultati di fisica e esperimenti numerici teoria della probabilità. Concetti e assiomi di base della teoria della probabilità. Concetti di base della statistica matematica.

    corso di lezioni, aggiunto il 04/08/2011

    La determinazione della legge di distribuzione di probabilità dei risultati di misurazione nella statistica matematica. Verifica della corrispondenza della distribuzione empirica a quella teorica. Determinazione dell'intervallo di confidenza in cui giace il valore della grandezza misurata.

    tesina, aggiunta il 02/11/2012

    Convergenza di successioni di variabili casuali e distribuzioni di probabilità. Metodo delle funzioni caratteristiche. Testare ipotesi statistiche e performare centralmente teorema limite per date sequenze di variabili casuali indipendenti.

    tesina, aggiunta il 13/11/2012

    Le fasi principali dell'elaborazione dei dati dalle osservazioni naturali con il metodo della statistica matematica. Valutazione dei risultati ottenuti, loro impiego nelle decisioni manageriali nel campo della protezione della natura e della gestione della natura. Verifica di ipotesi statistiche.

    lavoro pratico, aggiunto il 24/05/2013

    L'essenza della legge di distribuzione e la sua applicazione pratica per la risoluzione di problemi statistici. Determinazione della varianza di una variabile casuale, aspettativa matematica e deviazione standard. Caratteristiche dell'analisi della varianza unidirezionale.

    test, aggiunto il 12/07/2013

    Probabilità e sue definizione generale. Teoremi di addizione e moltiplicazione di probabilità. Variabili casuali discrete e loro caratteristiche numeriche. La legge dei grandi numeri. Distribuzione statistica del campione. Elementi di correlazione e analisi di regressione.

    corso di lezioni, aggiunto il 13/06/2015

    Programma del corso, concetti e formule di base della teoria della probabilità, loro giustificazione e significato. Luogo e ruolo della statistica matematica nella disciplina. Esempi e spiegazioni per risolvere i problemi più comuni in vari argomenti dati delle discipline accademiche.

    manuale di formazione, aggiunto il 15/01/2010

    La teoria della probabilità e la statistica matematica sono scienze sui metodi di analisi quantitativa dei fenomeni casuali di massa. Un insieme di valori di una variabile casuale è chiamato campione e gli elementi dell'insieme sono chiamati valori campione di una variabile casuale.

Condividere