elméleti anyag. Statisztikai modellek

Az azonos nevű modellezési típus módszertani alapját a statisztikai és valószínűségi módszerek képezik. A modell formalizálásának ezen a szintjén még nem arról beszélünk, hogy feltárjuk azt a törvényt, amely biztosítja a döntéshozatal során a bizonytalanság kiküszöbölését, de van egy bizonyos sor megfigyelés e rendszerrel vagy analógjával kapcsolatban, amelyek lehetővé teszik, hogy néhányat levonjunk. következtetések a rendszer múlt/jelenlegi/jövő állapotára vonatkozóan, a viselkedés változatlanságára vonatkozó hipotézis alapján.

Mint mindig, most is fogalmazzuk meg a definíciót... A statisztikai vagy valószínűségi modell (sztochasztikus modell) olyan modell, amely a rendszer működése során a véletlenszerű tényezők befolyását veszi figyelembe, statisztikai vagy valószínűségi módszertan alkalmazásán alapul az ismétlődő jelenségek vonatkozásában.. Ez a modell kvantitatív kritériumokkal működik az ismétlődő jelenségek értékelésében, és lehetővé teszi azok nemlinearitásának, dinamikájának és véletlenszerű perturbációinak figyelembevételét azáltal, hogy hipotéziseket állít fel néhány, a rendszer viselkedését befolyásoló valószínűségi változó eloszlásának természetéről a megfigyelések elemzése alapján. eredmények.

Lényegében a valószínűségi és a statisztikai modellek különböznek a modellezett rendszerrel kapcsolatos tudás bizonytalansági szintjében, amely a modell szintézisének időpontjában létezik. Abban az esetben, ha a rendszerrel kapcsolatos elképzelések inkább elméleti jellegűek, és kizárólag a rendszer természetére és a zavaró hatásokra vonatkozó hipotéziseken alapulnak, amelyeket a megfigyelések eredményei nem támasztanak alá, a valószínűségi modell az egyetlen lehetséges. Amikor a modellszintézis szakaszában már empirikusan nyert adatok állnak rendelkezésre, lehetőség nyílik a hipotézisek megerősítésére azok statisztikai feldolgozása révén. Ez nyilvánvalóvá válik, ha figyelembe vesszük a matematikai statisztika módszerei és a valószínűségelmélet közötti kapcsolatot. A matematikai statisztika olyan tudomány, amely a homogén objektumok vagy események nagy halmazaiban rejlő minták feltárásának módszereit vizsgálja azok mintavételezése (vagy ugyanazon objektum kellően hosszú időintervallumon keresztüli megfigyelése eredményeként kapott nagy adathalmazok) alapján. A valószínűségelmélet ezzel szemben a véletlenszerű jelenségek által követett mennyiségi mintázatokat vizsgálja, ha ezeket a jelenségeket ismert valószínűségű események határozzák meg. Ennek megfelelően a matematikai statisztika kapocs a valószínűségelmélet és a való világ jelenségei között, mivel lehetővé teszi, hogy statisztikai adatok elemzése alapján becsléseket fogalmazzunk meg bizonyos események valószínűségére.

Azt lehet állítani, hogy a statisztikai modellek a matematikai modellek egy speciális fajtája, amelyek kiindulási adatként nemcsak az objektum aktuális állapotára vonatkozó aktuális adatokat használnak, hanem akár az osztályba tartozó más objektumok, akár az objektum állapotát jellemző adatokat is. egy másik időpont. A statisztikai modellek bármilyen természetű tömegjelenség vizsgálatára alkalmazhatók, beleértve azokat is, amelyek nem tartoznak a valószínűségileg meghatározott kategóriába (determinisztikus problémák megoldására is alkalmas a matematikai statisztika). Ez utóbbi modellezésekor a statisztikai folyamatot mesterségesen bevezetjük a modellbe, hogy a numerikus megoldás statisztikai becsléseit (például egy determinisztikus folyamat paramétereinek mérési pontosságát) kapjuk.

A matematikai statisztika és a valószínűségszámítás módszerei bevezethetők többek között a logikai és logikai-nyelvi modellekbe, amint azt az előző alfejezetben jeleztük. Megfontolhatók például módszerek a statisztikai pontszámok szemantikai kapcsolati modellekbe való integrálására, hogy az egyes csúcsokat összekötő íveknek különböző súlyokat adjanak. A statisztikai kiértékelések bevezethetők a tezaurusz-prezentációs rendszerekbe is, hogy megoldják a poliszémiás helyzeteket anélkül, hogy kontextuselemzési eljárásokat kellene igénybe venniük. Más szóval, a statisztikai módszerek egyrészt egy modell alapját képezhetik, másrészt más típusú modellek módosítására is használhatók.

A megfigyelések eredményeinek feldolgozásához korrelációs, regressziós, faktoriális, klaszter- és egyéb elemzési módszereket alkalmaznak, statisztikai hipotézisekkel operálva. Itt egy különleges szerep van kijelölve statisztikai vizsgálati módszer (Monte Carlo módszer ). Ez egy olyan módszer matematikai problémák numerikus megoldására, amelyek valószínűségi változók vagy folyamatok többszörös valószínűségi és statisztikai modellezésén alapulnak, hogy statisztikai becsléseket készítsenek a kívánt mennyiségekre. A módszer lényege egy véletlenszerű jelenség többszöri szimulációjának megvalósítása egy bizonyos eljárás segítségével, amely véletlenszerű eredményt ad. Ehhez számítógép segítségével véletlenszerű folyamatok bizonyos implementációinak halmaza jön létre, amelyek a vizsgált objektumra vagy folyamatra gyakorolt ​​zavaró hatásokat szimulálják, majd ezt a folyamatot vagy objektumot a kapott véletlenszerű hatások által meghatározott feltételek mellett szimulálják. Az ilyen modellezés eredményeit matematikai statisztikai módszerekkel dolgozzák fel. Ebben az esetben egy valószínűségi változó eloszlásának típusa és paraméterei változhatnak.

A véletlenszerű folyamat Monte Carlo módszerrel való megvalósítása egy sorsolásból álló sorozat, közönséges számításokkal tarkítva, amelynek során meghatározzák egy objektumra vagy folyamatra gyakorolt ​​zavaró hatás eredményét egy művelet kimenetelére.

Mivel általános esetben nehéz megállapítani a modell alkalmasságát a véletlenszerű hatások eloszlására, a Monte Carlo módszerrel végzett modellezés feladata, hogy a kapott megoldások robusztussága (ellenállás a valószínűségi változók eloszlási törvényének paramétereiben és a modellezés kezdeti feltételeiben). Ha a szimuláció eredménye nem robusztus (lényegében az eloszlási törvény paramétereitől és a modell paramétereitől függ), akkor ez a szimulált rendszer ezen megvalósításában való döntéskor nagy kockázatot jelez.

A statisztikai modellekben fontos szerepet játszanak a modellezett rendszer állapotváltozási folyamatainak természetére vonatkozó hipotézisek. Például egy nagyon érdekes eset az a hipotézis, hogy " Markovian » folyamatok (az orosz tudós, A. A. Markov tiszteletére nevezték el - a XX. század eleje). A Markov-folyamatok olyan determinisztikus valószínűségű folyamatok esetei, amelyeknél a rendszer állapotainak valamely korábbi időintervallumban bekövetkezett változásának korai története nem elengedhetetlen a következő esemény valószínűségének megállapításához - a fő jelentőséget annak tulajdonítják. jelen állapot. Ha bízunk a folyamat markovi jellegében, az jelentősen megváltoztatja a rendszer koncepcióját (ez "tehetetlenségnek" tekinthető, nagymértékben függ aktuális állapotától és a zavaró hatás természetétől). A Markov-elvet a természetes nyelvű szövegek elemzésében fedezték fel, ahol egy adott nyelv szövegtömbeinek statisztikai elemzése alapján megjósolható a következő karakter előfordulásának valószínűsége.

A statisztikai modellezés szorosan összefügg a szimulációs modellezéssel , melynek során az objektummodellt gyakran „valószínűségi (statisztikai) környezetbe merítjük”, amelyben a modell / objektum különféle helyzetei és működési módjai játszódnak le. A szimulációs modellek azonban determinisztikus környezetben is megvalósíthatók.

A statisztikai modellezési módszereket széles körben alkalmazzák a stratégiai tervezés és menedzsment területén. A modellezési folyamat magas munkaintenzitása megakadályozza a statisztikai modellezési módszerek széles körű alkalmazását az operatív irányítás területén. Ez elsősorban a modellek mélyreható matematikai tanulmányozásának szükségességéből és a felhasználók matematikai tudásával szembeni magas követelményekből adódik.

A véletlenszerű választás ötlete. Mielőtt rátérnénk a statisztikai hipotézisek leírására, még egyszer tárgyaljuk a véletlen szelekció fogalmát.

A részletektől és néhány (bár fontos) kivételtől eltekintve elmondhatjuk, hogy minden statisztikai elemzés a véletlenszerű választás ötlete. Elfogadjuk azt a tézist, hogy a rendelkezésre álló adatok valamilyen általános populációból, gyakran képzeletbeli véletlenszerű kiválasztás eredményeként jelentek meg. Általában azt feltételezzük, hogy ezt a véletlenszerű választást a természet hozta létre. Azonban sok problémában ez a populáció teljesen valós, és aktív megfigyelő választja ki belőle.

A rövidség kedvéért azt mondjuk, hogy az összes adat, amelyet tanulmányozni fogunk, mint egész egy megfigyelés. Ennek a kollektív megfigyelésnek a természete nagyon változatos lehet. Ez lehet egyetlen szám, számsorozat, karaktersorozat, numerikus táblázat stb. Jelöljük átmenetileg ezt a kollektív megfigyelést úgy X. Mióta hisszük x véletlen szelekció eredményeként meg kell jelölnünk azt az általános sokaságot is, amelyből x ki lett választva. Ez azt jelenti, hogy meg kell adnunk azokat az értékeket, amelyek megjelenhetnek a valódi helyett. X. Jelöljük ezt a halmazt így x. Sok x más néven mintatér, vagy mintatér.

Feltételezzük továbbá, hogy a jelzett választás egy bizonyos valószínűségi eloszlásnak megfelelően történt a halmazon x, amely szerint az egyes elemek x van bizonyos esélye a kiválasztásra. Ha egy X - véges halmaz, majd minden eleme x; van pozitív esély R(x) kell kiválasztani. Egy ilyen valószínűségi törvény szerinti véletlenszerű kiválasztás szó szerint könnyen érthető. Bonyolultabb végtelen halmazokhoz x a valószínűséget nem egyes pontjaira, hanem részhalmazaira kell meghatározni. Nehezebb elképzelni, ha véletlenszerűen választunk egyet a végtelen számú lehetőség közül, olyan, mintha egy pontot választanánk x szegmensből vagy térbeli régióból x.

A megfigyelés közötti kapcsolat xés mintaterület x, Az elemek között, amelyeknek a valószínűsége megoszlik, pontosan ugyanaz, mint az elemi eredmények és az elemi eredmények tere között, amellyel a valószínűségszámítás foglalkozik. Ennek köszönhetően a valószínűségelmélet a matematikai statisztika alapjává válik, így különösen a valószínűségi szempontokat alkalmazhatjuk a statisztikai hipotézisek tesztelésének problémájában.

pragmatikus szabály. Nyilvánvaló, hogy mivel az adataink eredetét valószínűségi szempontból vizsgáltuk (vagyis úgy véljük, hogy véletlenszerű kiválasztással nyertük), így minden további, ezen adatokon alapuló ítélet valószínűségi jellegű lesz. Bármely állítás csak bizonyos valószínűséggel lesz igaz, bizonyos pozitív valószínűséggel pedig hamisnak bizonyulhat. Hasznosak lesznek az ilyen következtetések, és lehetséges-e ilyen módon megbízható eredményeket elérni?



Mindkét kérdésre igenlő választ kell adni. Először is, az események valószínűségeinek ismerete hasznos, mivel a kutatóban gyorsan kialakul egy valószínűségi intuíció, amely lehetővé teszi számára, hogy ebből hasznot húzva operáljon valószínűségekkel, eloszlással, matematikai elvárásokkal stb. Másodszor, a tisztán valószínűségi eredmények meglehetősen meggyőzőek lehetnek: egy következtetés akkor tekinthető gyakorlatilag megbízhatónak, ha annak valószínűsége megközelíti az egységet.

A következőket lehet mondani pragmatikus szabály, amely irányítja az embereket és amely összekapcsolja a valószínűségelméletet tevékenységeinkkel.

Gyakorlatilag biztosnak tartunk egy olyan eseményt, aminek a valószínűsége közel van 1;

Gyakorlatilag lehetetlennek tartunk egy olyan eseményt, aminek a valószínűsége közel van 0.

És nem csak így gondoljuk, hanem ennek megfelelően cselekszünk is!

A kimondott pragmatikai szabály szigorú értelemben természetesen helytelen, mivel nem véd teljes mértékben a hibák ellen. De a használat során előforduló hibák ritkák. A szabály azért hasznos, mert lehetővé teszi a valószínűségi következtetések gyakorlati alkalmazását.

Néha ugyanazt a szabályt kissé eltérően fejezik ki: egyetlen kísérletben a valószínűtlen esemény nem következik be(és fordítva - szükségszerűen bekövetkezik egy esemény, amelynek valószínűsége közel van egy). Az "egyetlen" szót az egyértelműség kedvéért szúrjuk be, mert a kísérlet kellően hosszú, egymástól független ismétlődési sorozatában szinte biztosan bekövetkezik az említett valószínűtlen (egy kísérletben!) esemény. De ez egy teljesen más helyzet.

Még mindig nem világos, hogy milyen valószínűséget kell kicsinek tekinteni. Erre a kérdésre nem lehet olyan mennyiségi választ adni, amely minden esetben megfelelő. A válasz attól függ, hogy a hiba milyen veszéllyel fenyeget bennünket. Elég gyakran - például statisztikai hipotézisek tesztelésekor, amint azt alább tárgyaljuk - a valószínűségeket kicsiknek tételezzük fel, 0,01 ¸ 0,05-től kezdve. Egy másik dolog a műszaki eszközök, például az autófékek megbízhatósága. Itt a meghibásodás valószínűsége, mondjuk, 0,001, elfogadhatatlanul magas lesz, mivel a fékek meghibásodása ezer fékezéskor nagyszámú balesettel jár. Ezért a megbízhatóság kiszámításakor gyakran szükséges, hogy a hibamentes működés valószínűsége 1-10 -6 nagyságrendű legyen. Arról itt nem térünk ki, hogy mennyire reálisak ezek a követelmények: vajon egy elkerülhetetlenül közelítő matematikai modell tud-e ilyen pontosságot adni a valószínűségszámításban, és hogyan lehet ezután összehasonlítani a számított és a valós eredményeket.

Figyelmeztetések. 1. Tanácsot kell adni a statisztikai modellek felépítéséhez, gyakran olyan problémák esetén, amelyek nem kifejezetten statisztikai jellegűek. Ehhez szükséges a tárgyalt problémában rejlő jellemzőket a mintatérrel és a valószínűségi eloszlással kifejezni. Sajnos ezt a folyamatot nem lehet általánosságban leírni. Ráadásul ez a folyamat kreatív és nem lehet az memorizálni mint mondjuk egy szorzótábla. De tud megtanulni, minták és példák tanulmányozásával és szellemük követésével. Több ilyen példát is megvizsgálunk. A jövőben a statisztikai kutatás ezen szakaszára is kiemelt figyelmet fordítunk.

2. A valós problémák formalizálása során igen változatos statisztikai modellek merülhetnek fel. A matematikai elmélet azonban csak korlátozott számú modell tanulmányozására készített eszközöket. Számos tipikus modell esetében az elméletet nagyon részletesen kidolgozták, és ott választ kaphat a kutatót érdeklő fő kérdésekre. Ebben a könyvben bemutatunk néhány ilyen szabványos modellt, amelyekkel a gyakorlatban leggyakrabban kell foglalkoznunk. Mások konkrétabb és részletesebb útmutatókban és referenciakönyvekben találhatók.

3. Érdemes megjegyezni a matematikai eszközök korlátait a kísérlet matematikai formalizálása során. Ha lehetséges, le kell redukálni a kérdést egy tipikus statisztikai problémára. Ezek a megfontolások különösen fontosak, amikor tervezés kísérlet vagy tanulmány; információgyűjtéskor, ha statisztikai felmérésről van szó; kísérletek felállításakor, ha aktív kísérletről beszélünk.

4.1.1. statisztikai modell. A statisztikai (sztochasztikus) modellezésben a modellezés fő tárgyai a véletlenszerű események, a valószínűségi változók és a véletlen függvények.

A kísérletek végzése során a kutató rögzíti az érdeklődésre számot tartó események megjelenését vagy elmaradását, és méri a véletlenszerű paraméterek értékeit is, amelyek lényegében valamilyen valószínűségi változó megvalósításának értékei.

A statisztikai modellezés lehetővé teszi, hogy a vizsgált objektumon valós kísérletek elvégzése nélkül (amely a legtöbb esetben nagy anyagi és pénzügyi költségeket igényel), releváns információk beszerzését a valós objektumban előforduló bizonyos események bekövetkezéséről vagy meg nem történtségéről. a valószínűségi változók mintaértékeiről a szimulált események és valószínűségi változók elérhető valószínűségi jellemzői alapján. Ez a fajta modellezés magában foglalja a szimulált mutatók előzetes információgyűjtését és a kapott eredmények további statisztikai feldolgozását annak érdekében, hogy a valószínűségi jellemzők modellezéséhez szükséges ésszerű statisztikai becsléseket kapjunk.

A sztochasztikus modelleket főleg két esetben alkalmazzák:

1) a modellezés tárgya rosszul érthető - nincsenek jól kidolgozott mennyiségi minták, amelyek leírják a vizsgált folyamatokat és jelenségeket, és nincs mód arra, hogy elfogadható analitikus megoldást találjunk erre a problémára;

2) a szimulált objektumot meglehetősen jól tanulmányozták determinisztikus módon, de anélkül, hogy figyelembe vették volna azokat a véletlenszerű tényezőket, amelyek befolyásolják a vizsgált folyamatokat és jelenségeket.

Az első esetben a vizsgált tárgy szóbeli leírása alapján a kvantitatív mutatókat fizikai méretük kiszámításával választják ki, két csoportból állva. Az egyik csoport a modell bemeneti értéke, a másik pedig a kimeneti érték. Továbbá az e területen más kutatók tudományelméleti eredményeit felhasználva, esetleg számos szükséges feltevést alkalmazva, valamint a bemeneti és kimeneti mennyiségekre vonatkozóan esetleg már rendelkezésre álló kísérleti adatokat (például azok eloszlási törvényszerűségeit) határozzák meg a determinisztikus ill. sztochasztikus kapcsolatok a modell bemeneti kimeneti mennyiségei között . A bemeneti és kimeneti mennyiségek közötti (általában egyenletek formájában felírt) összefüggések halmazát ún. statisztikai modell.

A statisztikai modell megvalósítása során a választott valószínűségi változók eloszlási törvényei és a szimulált események kiválasztott valószínűségei alapján a matematikai statisztika módszerei meghatározzák a valószínűségi változók szelektív kísérleti értékeit és a kvázi-empirikus sorozatokat. szimulált események előfordulása vagy elmaradása. Ezenkívül a modell egyenletei szerint meghatározzák a kimeneti értékeinek megfelelő mintaértékeit. A megszerkesztett modell többszörös megvalósítása pedig lehetővé teszi a kutató számára, hogy modellmintát állítson össze a kimeneti értékeiről, amelyet ismét statisztikai elemzésnek vetnek alá (korreláció, regresszió, diszperzió, spektrális), hogy becsléseket kapjon a kimeneti paraméterek jellemzőiről. a modellt, vagy tesztelje a feltett hipotéziseket. A kapott eredmények alapján következtetéseket vonunk le a vizsgálat tárgyára vonatkozóan, valamint indoklást adunk a megszerkesztett modell gyakorlati alkalmazásához.

A statisztikai modellezési módszereket széles körben alkalmazzák a sorbanállási problémák megoldásában, az optimalizálás elméletében, a vezérléselméletben, az elméleti fizikában stb.

A számítógépen végzett statisztikai modellezés módszerének elméleti alapja a valószínűségszámítás határtételei.

4.1.2. Csebisev egyenlőtlensége. A valószínűségi változó és az egyenlőtlenség nem negatív függvényére

.

4.1.3. Bernoulli tétele. Ha független kísérleteket végeznek, amelyek mindegyikében valamilyen esemény valószínûséggel következik be, akkor az esemény bekövetkezésének relatív tisztasága (a kedvezõ vizsgálati eredmények száma) valószínûséggel konvergál -hoz, azaz. nál nél

4.1.4. Poisson-tétel. Ha független kísérleteket végeznek, és egy esemény bekövetkezésének valószínűsége abban a kísérletben egyenlő nál nél

4.1.5. Csebisev tétele. Ha egy valószínűségi változó értékeit független tesztekben figyeljük meg, akkor -nál a valószínűségi változó értékeinek számtani átlaga valószínűséggel konvergál a matematikai várakozásához, azaz. nál nél

4.1.6. Általánosított Csebisev-tétel. Ha a független valószínűségi változók matematikai elvárásaival és szórásával felülről azonos számmal korlátozottak, akkor a valószínűségi változó értékeinek számtani átlaga valószínűség szerint konvergál a matematikai várakozásaik számtani átlagához.

4.1.7. Markov tétele.. A Csebisev-tétel a függő valószínűségi változókra is érvényes lesz, ha

4.1.8. Központi határérték tétel. Ha független azonos eloszlású valószínűségi változók matematikai elvárásokkal és varianciával, akkor az összeg eloszlási törvénye korlátlanul közelíti a normál eloszlási törvényt

hol van a Laplace-függvény

4.1.9. Laplace-tétel. Ha a független kísérletek mindegyikében valószínűséggel történik egy esemény, akkor

A statikus modellezés egy bizonyos jelenség vagy jelenségek közötti kapcsolatrendszer ábrázolása vagy leírása változók (indikátorok, jellemzők) halmazán és a köztük lévő statisztikai kapcsolatokon keresztül. A statikus modellezés (és minden más modellezés) célja a vizsgált jelenség legjelentősebb jellemzőinek vizuális és a tanulmányozás számára hozzáférhető formában történő bemutatása. Minden statisztikai modell végső soron két vagy több változó közötti kapcsolatok erősségének és irányának mérésére szolgál. A legösszetettebb modellek több változó közötti kapcsolatok szerkezetének megítélését is lehetővé teszik. A legtöbb statisztikai modell feltételesen felosztható korrelációs, strukturális és oksági modellekre. A korrelációs modellek a változók közötti páronkénti "nem irányú" kapcsolatok mérésére szolgálnak, pl. olyan kapcsolatok, amelyekben az ok-okozati komponens hiányzik vagy figyelmen kívül hagyják. Ilyen modellek például a Pearson-féle páronkénti lineáris korrelációs együttható, a páronkénti és többszörös korrelációk rangegyütthatói, a legtöbb kontingenciatáblázatokhoz kifejlesztett linkmérték (az információelméleti együtthatók és a log-lineáris elemzés kivételével).

A statikus modellezés strukturális modelljei bizonyos változók vagy objektumok szerkezetének tanulmányozására szolgálnak. A több változó közötti kapcsolatok szerkezetének vizsgálatához a kiindulási adat a köztük lévő összefüggések mátrixa. A korrelációs mátrix elemzése elvégezhető manuálisan vagy a többváltozós statisztikai elemzés módszereivel - faktoriális, klaszter, többváltozós skálázás. A változók közötti kapcsolatok szerkezetének vizsgálata sok esetben egy összetettebb probléma megoldásának – a jellemzőtér dimenziójának csökkentésének – előzetes lépése.

Az objektumok halmazának szerkezetének tanulmányozásához a klaszteranalízis és a többdimenziós skálázás módszereit alkalmazzák. Kiindulási adatként a köztük lévő távolságok mátrixát használjuk. Minél kisebb az objektumok közötti távolság, annál inkább "hasonlítanak" az objektumok egymáshoz a rajtuk mért változók értékét tekintve; ha két objektum minden változójának értéke megegyezik, akkor a köztük lévő távolság nulla. A vizsgálat céljaitól függően a strukturális modellek bemutathatók mátrixok (korrelációk, távolságok), faktorstruktúra vagy vizuális formában. A klaszteranalízis eredményeit leggyakrabban dendrogram formájában mutatjuk be; faktoranalízis és többdimenziós skálázás eredményei - szórásdiagram formájában. A korrelációs mátrix szerkezete grafikonként is ábrázolható, amely a változók közötti legjelentősebb összefüggéseket tükrözi. Az oksági modellek célja két vagy több változó közötti ok-okozati összefüggések feltárása. Az oksági jelenségeket mérő változókat a statisztikában független változóknak vagy prediktoroknak nevezik; a jelenségeket-következményeket mérő változókat függőnek nevezzük. A legtöbb oksági statisztikai oksági modell egy függő változót és egy vagy több előrejelzőt feltételez. Kivételt képeznek a lineáris-strukturális modellek, amelyekben több függő változó egyidejűleg is használható, és egyes változók egyidejűleg függőként működhetnek egy-egy mutatóhoz, illetve előrejelzőként másokhoz képest.

A statisztikai modellezési módszernek két alkalmazási területe van: a statikus szimulációs tervezés

  • - sztochasztikus rendszerek tanulmányozására;
  • - determinisztikus problémák megoldására.

A determinisztikus problémák statisztikai modellezéssel történő megoldásának fő gondolata egy determinisztikus probléma helyettesítése valamilyen sztochasztikus rendszer ekvivalens áramkörével, amely utóbbi kimeneti jellemzői egybeesnek egy determinisztikus probléma megoldásának eredményével. Egy ilyen csere esetén a hiba csökken a tesztek számának növekedésével (a modellezési algoritmus megvalósítása) N.

A rendszer statisztikai modellezésének eredményeként S a kívánt mennyiségek vagy függvények részértékeinek sorozatát kapjuk meg, amelyek statisztikai feldolgozása lehetővé teszi, hogy információt szerezzünk egy valós objektum vagy folyamat viselkedéséről tetszőleges időpontokban. Ha az eladások száma N elég nagy, akkor a rendszermodellezés során kapott eredmények statisztikai stabilitásra tesznek szert, és kellő pontossággal elfogadhatók a rendszer működési folyamatának kívánt jellemzőinek becsléseiként. S.

Küldje el a jó munkát a tudásbázis egyszerű. Használja az alábbi űrlapot

Diákok, végzős hallgatók, fiatal tudósok, akik a tudásbázist tanulmányaikban és munkájukban használják, nagyon hálásak lesznek Önnek.

közzétett http://www.allbest.ru/

OKTATÁSI ÉS TUDOMÁNYOS MINISZTÉRIUMOROSZORSZÁG

Szövetségi Állami Autonóm Oktatási
felsőoktatási intézmény
"Déli Szövetségi Egyetem"

Információs és Mérőberendezések és Technológia Tanszék

Különlegesség

230201 Információs rendszerek és technológiák

ESSZÉ

Tárgy: "Kutatás és fejlesztés szervezése"

A témában: "Matematikai modellezés módszerei a statisztikában"

Tanuló fejezte be: Strotsev Vaszilij Andrejevics

Előadó: Gusenko Tamara Grigorievna

1. A matematikai statisztika elemei

A matematikai statisztika a matematikának egy olyan ága, amely a statisztikai adatok rendszerezésének, feldolgozásának és tudományos és gyakorlati következtetések levonására szolgáló matematikai módszereinek szentelt. A statisztikai adatok alatt itt olyan információkat értünk, amelyek a többé-kevésbé kiterjedt gyűjteményben található, bizonyos jellemzőkkel rendelkező objektumok számáról szólnak.

A matematikai statisztika fő célja értelmes, tudományosan megalapozott következtetések levonása az adatokból a véletlen szórásig. Ugyanakkor a vizsgált jelenség, amely ezeket az adatokat generálja, gyakran túl összetett ahhoz, hogy teljes, minden részletet tükröző leírását össze lehessen állítani. Ezért a statisztikai következtetéseket egy valós véletlenszerű jelenség valamilyen matematikai valószínűségi modellje alapján vonjuk le, amelynek reprodukálnia kell lényeges jellemzőit, és kizárnia kell a jelentéktelennek vélteket. A matematikai statisztika módszerei lehetővé teszik a jelenséget leíró matematikai modellben résztvevő valószínűségi változók valószínűségi jellemzőinek meghatározását a vizsgált jelenség megfigyelésével.

A matematikai statisztika feladata - olyan minták felállítása, amelyeknek tömeges véletlenszerű jelenségek vannak kitéve, a statisztikai adatok, a megfigyelések eredményeinek valószínűségszámítási módszerekkel történő tanulmányozásán alapul. A statisztikai adatok nagyszámú tárgy vagy jelenség vizsgálata eredményeként nyert adatok; következésképpen a matematikai statisztika tömegjelenségekkel foglalkozik.

A matematikai statisztika első feladata a megfigyelések eredményeként vagy speciálisan kialakított kísérletek eredményeként nyert statisztikai információk gyűjtésének és csoportosításának módszereinek jelzése.

A matematikai statisztika második feladata a statisztikai adatok elemzésére szolgáló módszerek kidolgozása a vizsgálat céljaitól függően.

A modern matematikai statisztika módszereket fejleszt ki a szükséges tesztek számának meghatározására a vizsgálat megkezdése előtt, a vizsgálat során, és sok más problémát is megold. A modern matematikai statisztikát a bizonytalanság melletti döntéshozatal tudományaként határozzák meg.

A matematikai statisztika feladata a statisztikai adatok gyűjtésére és feldolgozására szolgáló módszerek megalkotása tudományos és gyakorlati következtetések levonására.

1.1 Statisztikai adatok általános és mintakészlete

Követeljük meg, hogy tanulmányozzuk a homogén objektumok halmazát valamely minőségi vagy mennyiségi jellemző tekintetében, amely ezeket az objektumokat jellemzi.

Egy objektum vagy rendelkezik minőségi jellemzőkkel, vagy nem. Közvetlenül nem mérhetők (például sportszakirány, végzettség, nemzetiség, területi hovatartozás stb.).

A mennyiségi jellemzők számlálás vagy mérés eredményei. Ennek megfelelően diszkrétre és folytonosra oszlanak.

Néha teljes körű vizsgálatot végeznek, pl. vizsgálja meg a populáció minden egyes tárgyát az őket érdeklő tulajdonság tekintetében. A gyakorlatban viszonylag ritkán alkalmaznak folyamatos felmérést. Például, ha a populáció nagyon sok objektumot tartalmaz, akkor fizikailag lehetetlen folyamatos felmérést végezni. Ilyen esetekben a teljes populációból véletlenszerűen választanak ki korlátozott számú objektumot, és vizsgálják őket. Tegyen különbséget az általános és a mintapopulációk között.

A mintakészlet (minta) véletlenszerűen kiválasztott objektumok halmaza.

Az általános (fő) halmaz azon objektumok halmaza, amelyekből a minta készül.

A sokaság mennyisége (minta vagy általános) az ebben a sokaságban lévő objektumok száma. Például, ha 1000 részből 100 részt választunk ki vizsgálatra, akkor az általános sokaság térfogata N = 1000, a minta mérete pedig n = 100. Az N általános sokaságban lévő objektumok száma jelentősen meghaladja az n mintaméretet.

1.2 Mintavételi módszerek

A minta összeállításakor kétféleképpen lehet eljárni: miután kiválasztottunk egy objektumot és megfigyelést végeztünk felette, azt vissza lehet adni vagy nem visszaadni az általános sokaságnak. A fentieknek megfelelően a mintákat ismételt és nem ismételt mintákra osztjuk.

Ismételt minta az, amelyben a kiválasztott objektum (a következő kiválasztása előtt) visszakerül az általános sokaságba.

A nem ismétlődő minta olyan minta, amelyben a kiválasztott objektum nem kerül vissza az általános sokaságba.

Ahhoz, hogy a minta adatai kellően megbízhatóak legyenek az általános sokaság érdeklődési körének megítélésében, szükséges, hogy a minta tárgyai azt helyesen reprezentálják (a mintának helyesen kell reprezentálnia az általános sokaság arányait) - a a mintának reprezentatívnak kell lennie (reprezentatív).

A minta akkor lesz reprezentatív, ha:

A minta minden egyes objektuma véletlenszerűen kerül kiválasztásra az általános sokaságból;

Minden objektum azonos valószínűséggel kerül be a mintába.

1.3 A statisztikák csoportosításának módjai

1.3.1 Diszkrét variációs sorozatok

A kapott megfigyelt adatok általában véletlenszerűen elrendezett számok halmaza. Ezt a számhalmazt végignézve nehéz megállapítani a változásuk (változásuk) szabályszerűségét. Egy valószínűségi változó értékeinek változási mintáinak tanulmányozásához a kísérleti adatokat feldolgozzák.

1. példa: Megfigyelések történtek a számon x az egyetemisták által vizsgákon kapott osztályzatok. Az egy órán belüli megfigyelések a következő eredményeket adták: 3; négy; 3; 5; négy; 2; 2; négy; négy; 3; 5; 2; négy; 5; négy; 3; négy; 3; 3; négy; négy; 2; 2; 5; 5; négy; 5; 2; 3; négy; négy; 3; négy; 5; 2; 5; 5; négy; 3; 3; négy; 2; négy; négy; 5; négy; 3; 5; 3; 5; négy; négy; 5; négy; négy; 5; négy; 5; 5; 5. Itt van egy szám x egy diszkrét valószínűségi változó, és a róla nyert információ statisztikai (megfigyelt) adat.

A fenti adatokat nem csökkenő sorrendbe rendezve és úgy csoportosítva, hogy minden egyes csoportban a valószínűségi változó értékei azonosak legyenek, a megfigyelési adatok rangsorolt ​​sorozatát kapjuk.

Az 1. példában négy csoportunk van a következő valószínűségi változókkal: 2; 3; négy; 5. A megfigyelt adatok csoportosított sorozatának külön csoportjának megfelelő valószínűségi változó értékét variánsnak nevezzük, ezen érték változását pedig variációnak nevezzük.

A változatokat a latin ábécé kis betűi jelölik, a csoport sorszámának megfelelő indexekkel - xi. Azt a számot, amely megmutatja, hogy a megfelelő változat hányszor fordul elő egy megfigyelési sorozatban, a változat gyakoriságának nevezzük, és ennek megfelelően jelöljük - ni.

A sorozat összes gyakoriságának összege a minta mérete. A változat gyakoriságának és a minta méretének aránya ni/n=wi relatív gyakoriságnak nevezzük.

A minta statisztikai megoszlása ​​az opciók listája és a hozzájuk tartozó gyakoriságok vagy relatív gyakoriságok (1. táblázat, 2. táblázat).

2. példa Adott a térfogatminta gyakorisági eloszlása n=20:

Asztal 1

Ellenőrzés: 0,15 + 0,50 + 0, 35 = 1.

A statisztikai eloszlás megadható intervallumok és a hozzájuk tartozó gyakoriságok sorozataként is (az intervallumnak megfelelő gyakoriságot az ezen intervallumon belüli gyakoriságok összegének tekintjük).

A diszkrét variációs eloszlási sorozat változatok tartományos halmaza xi a megfelelő frekvenciákkal ni vagy relatív gyakoriságok wi.

A fenti 1. példában a diszkrét variációs sorozat alakja a következő:

3. táblázat

Ellenőrzés: a variációs sorozat összes gyakoriságának összege (a 3. táblázat második sorának értékeinek összege) a minta mérete (az 1. példában n=60 ); a variációs sorozatok relatív gyakoriságainak összege 1 legyen (a 3. táblázat harmadik sorának értékeinek összege)

1.3.2 Intervallum variációs sorozatok

Ha a vizsgált valószínűségi változó folytonos, akkor a megfigyelt értékek rangsorolása és csoportosítása gyakran nem teszi lehetővé, hogy kiemeljük értékei változásának jellemző vonásait. Ez azzal magyarázható, hogy egy valószínűségi változó egyedi értékei tetszőlegesen eltérhetnek egymástól, ezért a megfigyelt adatok összességében ritkán fordulhatnak elő egy mennyiség azonos értékei, és a gyakoriságok változatai alig különböznek egymástól.

Szintén nem praktikus diszkrét sorozatot építeni egy diszkrét valószínűségi változóhoz, amelynek lehetséges értékeinek száma nagy. Ilyen esetekben szükség van az eloszlás intervallumvariációs sorozatának felépítésére.

Egy ilyen sorozat felépítéséhez egy valószínűségi változó megfigyelt értékeinek teljes változási intervallumát több részintervallumra osztják, és kiszámítják az egyes részintervallumokban a mennyiség értékeinek eltalálási gyakoriságát.

Az intervallumvariációs sorozat egy valószínűségi változó értékeinek változási intervallumainak rendezett halmaza, amelyek mindegyikébe esik a mennyiség értékeinek megfelelő gyakorisága vagy relatív gyakorisága.

Intervallumsorozat felépítéséhez a következőkre lesz szüksége:

1. határozza meg a részintervallumok értékét;

2. határozza meg az intervallumok szélességét;

3. állítsa be minden intervallum felső és alsó határát;

4. csoportosítsa a megfigyelés eredményeit!

1. A csoportosítási intervallumok számának és szélességének megválasztásának kérdését minden esetben a célok alapján kell eldönteni. vizsgálat, a minta mérete és a mintában lévő tulajdonság variációjának mértéke.

Az intervallumok hozzávetőleges száma k csak a minta nagyságából lehet megbecsülni n az alábbi módok egyikén:

· a képlet szerint Sturges: k = 1 + 3,32 log n;

az 1. táblázat segítségével.

Asztal 1

2. Általában az azonos szélességű intervallumokat részesítjük előnyben. Az intervallumok szélességének meghatározása h kiszámítja:

variációs tartomány R- mintaértékek: R = xmax - xmin, ahol xmaxés xmin- maximális és minimális minta lehetőségek;

az egyes intervallumok szélessége h a következő képlettel határozzuk meg: h = R/k.

3. Az első intervallum alsó határa xh1úgy van kiválasztva, hogy a minimális mintaváltozat xmin körülbelül ennek az intervallumnak a közepére esett: xh1 = xmin - 0,5 óra.

A köztes intervallumokat úgy kapjuk meg, hogy az előző intervallum végéhez hozzáadjuk a részintervallum hosszát h:

xhi = xhi-1 + h.

Az intervallum skála felépítése az intervallumok határainak kiszámítása alapján az értékig folytatódik. xhi kielégíti a kapcsolatot:

xhi< xmax + 0,5·h .

4. Az intervallumskálának megfelelően az attribútum értékei csoportosítva vannak - minden részintervallumra a gyakoriságok összegét számítják ki. ni bekapott változat én-edik intervallum. Ebben az esetben az intervallum egy valószínűségi változó értékeit tartalmazza, amelyek nagyobbak vagy egyenlőek az intervallum alsó határánál és kisebbek, mint az intervallum felső határa.

1.4 Sokszög és hisztogram

Az érthetőség kedvéért a statisztikai eloszlás különböző grafikonjait készítjük. A diszkrét variációs sorozat adatai alapján frekvenciák poligonja vagy relatív gyakorisága épül fel.

A frekvenciák sokszögét szaggatott vonalnak nevezzük, amelynek szakaszai összekötik a pontokat ( x1; n1), (x2; n2),..., (xk; nk). Frekvenciapoligon felépítéséhez az abszcissza tengelyen az opciók félre vannak állítva xi, és az y tengelyen - a megfelelő frekvenciák ni. Pontok ( xi; ni) egyenes vonalak szegmensei kötik össze, és frekvencia sokszöget kapunk (1. ábra).

A relatív gyakoriságú sokszöget szaggatott vonalnak nevezzük, amelynek szakaszai összekötik a pontokat ( x1; W1), (x2; W2),..., (xk; hét). Ha relatív frekvenciák sokszögét szeretné felépíteni az abszcisszán, engedje el az opciókat xi, az y tengelyen pedig a hozzájuk tartozó relatív gyakoriságok Wi. Pontok ( xi; Wi) egyenesek szakaszai kötik össze, és relatív gyakoriságú sokszöget kapunk. Folyamatos jellemző esetén célszerű hisztogramot építeni.

A gyakorisági hisztogram egy lépcsőzetes ábra, amely téglalapokból áll, amelyek alapjai részleges hosszúságú intervallumok h, és a magasságok megegyeznek az aránnyal NIH, Nemzeti Egészségügyi Intézet(frekvencia sűrűség).

A frekvenciák hisztogramjának felépítéséhez részintervallumokat ábrázolunk az abszcissza tengelyen, és föléjük az abszcissza tengellyel párhuzamos szegmenseket húzunk bizonyos távolságban. NIH, Nemzeti Egészségügyi Intézet.

Négyzet én hni/h=ni- frekvenciák összege opció én - th intervallum; ezért a frekvencia hisztogram területe egyenlő az összes frekvencia összegével, azaz. minta nagysága.

A relatív gyakoriságok hisztogramja egy lépcsőzetes ábra, amely téglalapokból áll, amelyek alapjai részleges hosszúságú intervallumok. h, és a magasságok megegyeznek az aránnyal Wi/h(relatív frekvencia sűrűség).

A relatív frekvenciák hisztogramjának felépítéséhez a részintervallumokat az abszcissza tengelyen ábrázoljuk, és föléjük az abszcissza tengellyel párhuzamos szegmenseket húzunk bizonyos távolságban. Wi/h(2. ábra).

Négyzet én -adik részleges téglalap egyenlő hWi / h = Wi- a bekapott változat relatív gyakorisága én-edik intervallum. Ezért a relatív gyakoriságok hisztogramjának területe egyenlő az összes relatív gyakoriság összegével, azaz. Mértékegység.

1.5 A populációs paraméterek becslése

Az általános sokaság fő paraméterei a matematikai elvárás (általános átlag) M(X) és a szórás s. Ezek a mintaadatokból becsülhető állandók. Az általános paraméter egyetlen számmal kifejezett becslését pontbecslésnek nevezzük.

Az általános átlag pontbecslése a mintaátlag.

A minta átlaga a minta jellemzőjének számtani átlaga.

Ha minden érték x1, x2,..., xn a minta jellemzői eltérőek (vagy ha az adatok nincsenek csoportosítva), akkor:

x1, x2,..., xn n1, n2,...,nk, és n1 + n2 +...+ nk = n(vagy ha a mintaátlagot egy variációs sorozatból számítjuk), akkor

Abban az esetben, ha a statisztikai adatokat intervallum variációs sorozat formájában adjuk meg, a mintaátlag kiszámításakor a variánsértékeket az intervallumok közepének tekintjük.

A mintaátlag a pozíció fő jellemzője, megmutatja a sokaság eloszlási központját, lehetővé teszi a vizsgált sokaság egy számmal történő jellemzését, a fejlődési tendencia nyomon követését, a különböző populációk összehasonlítását (a minta átlaga a pont, az összeg a megfigyelések eltérései közül, amelyektől 0).

Az árfolyamért Val vel valamely mutató szórásának mértéke (eltérése) az átlagos értékétől, a maximális és minimális értékekkel együtt a szórás és a szórás fogalmát alkalmazzuk.

A minta variancia vagy a minta variancia (az angol variance szóból) egy változó variabilitásának mértéke. A kifejezést először Fischer vezette be 1918-ban.

A Dv mintavariancia egy jellemző megfigyelt értékeinek átlagértékétől való eltérésének négyzeteinek számtani átlaga.

Ha minden érték x1, x2,..., xn kötet mintavételi funkció n akkor más:

Ha az attribútum összes értéke x1, x2,..., xn megfelelő frekvenciájuk van n1, n2,...,nk, és n1 + n2 +...+ nk = n, akkor

A diszperzió nullától a végtelenig változik. A 0 szélső érték azt jelenti, hogy nincs változékonyság, ha a változó értéke állandó.

A szórást (standard deviation) (az angol standard deviation-ből) a variancia négyzetgyökeként számítjuk ki.

Minél nagyobb a szórás vagy szórás, annál szórtabbak a változó értékei az átlaghoz képest.

A pozíció nem paraméteres jellemzői a módus és a medián.

Divat Mo a legmagasabb frekvenciával vagy relatív gyakorisággal rendelkező változatnak nevezzük.

középső Nekem olyan változatnak nevezzük, amely a variációs sorozatot két, a változattal egyenlő számú részre osztja.

Páratlan szám esetén az opció (n=2k+1)

Én = xk+1,

páros szám esetén pedig az (n=2k) opciót

Me = (xk + xk+1)/2.

2. Korrelációs és regressziós elemzés

2.1 Korrelációelemzés

matematikai statisztikai csoportosítási korreláció

A korrelációs elemzés magában foglalja a valószínűségi változók közötti statisztikai kapcsolat megállapítását. Használható a pedagógiai kutatásokban egyes tényezők másokra gyakorolt ​​hatásának felmérésére, és ezek közötti kapcsolat megállapítására más paraméterekkel - matematikai elvárásokkal és szórással - összefüggésben. A korrelációelemzés nem alkalmazható közvetlenül a véletlenszerű folyamatok közötti ok-okozati összefüggések azonosítására. Csak a kapcsolódó véletlenszerű folyamatok statisztikai jellemzői között hoz létre kapcsolatot.

Legyen két X és Y valószínűségi változó mx és my matematikai elvárásokkal. korrelációs momentum

Kxy =M((X-mx)(Y-my))

jellemezni fogja az X és Y értékei közötti kapcsolatot. A könnyebb használat érdekében a korrelációs momentumokat a képlet normalizálja

ahol yx és yy az X és Y értékek szórása A Kk értéket az X és Y értékek korrelációs együtthatójának nevezzük.

Azon diszkrét valószínűségi változók esetében, amelyekkel foglalkozunk, a korrelációs együttható becslését a képlet számítja ki

A korrelációs együttható kiszámításának képlete akkor érvényes, ha a valószínűségi változók közötti kapcsolat lineáris, és ezekre a változókra vonatkozik a normál törvény.

Értékelje a statisztikai összefüggést az iskolai felkészültség szintje és a „Számítástechnika” szak elsőéves hallgatóinak előrehaladása között Az iskolai felkészültséget az egyetemre való belépéskor teszteléssel értékelik (X érték). A tanulók teljesítményét az első félévet követő vizsgaeredmény alapján értékelik (Y érték). A tanulólétszám N-vel van jelölve.

A számítás kezdeti adatait a táblázat foglalja össze

A táblázat adatait az (1) kifejezésbe behelyettesítve Kk=0,78-at kapunk.

Látjuk, hogy X és Y statisztikai jellemzői közel állnak egymáshoz.

2.2 Regressziós elemzés

A regressziós elemzés célja a függő változó és a független változó (regresszor vagy prediktor) közötti kapcsolat statisztikai vizsgálata. A legegyszerűbb esetben ezt a függést lineárisnak tételezzük fel. Megoldás alatt áll az y=ax+b formájú lineáris függés megalkotásának problémája, ahol хi és yi független, illetve függő változók (i=1,2,3,…). A megoldást a legkisebb négyzetek módszerével találjuk meg. Az érték minimalizálva van

min az a és b együtthatók.

A számítási képletek a következők:

Lényegében a kísérletileg kapott pontok halmazát megközelítőleg helyettesítjük az y=ax+b analitikai függéssel. Egy ilyen helyettesítés nagymértékben leegyszerűsíti a matematikai transzformációkat, és felhasználható analitikai modellek felépítésében. Általános esetben nem csak lineáris, hanem bármilyen más függvény is választható a regressziós függés felépítéséhez. Természetesen a szükséges paraméterek kiszámítására szolgáló képletek bonyolultabbá válnak.

3. Matematikai módszerek a kísérletek optimalizálására

3.1 Szimplex optimalizálási módszer

A szimplex egy szabályos poliéder, amely rendelkezik n+1 tetején, hol P - a folyamatot befolyásoló tényezők száma. Tehát például, ha két tényező van, akkor egy szabályos háromszög szimplex.

Rizs. 1 Optimalizálás szimplex módszerrel

A kezdeti kísérletsorozat megfelel az eredeti szimplex csúcsainak (pontok 1., 2. és 3.). Ezen első kísérletek feltételeit az optimalizálandó folyamat ismert módjai közül a legkedvezőbbnek megfelelő tényezők értéktartományából vettük. Az 1., 2. és pontban végzett kísérletek eredményeinek összehasonlítása 3, megtalálni közöttük a „legrosszabb”-t, a választott optimalitási kritérium szempontjából. Legyen például a kísérlet a ponton 1. Ezt a tapasztalatot kihagyjuk a mérlegelésből, és helyette a szimplexbe kerül be a ponton lévő tapasztalat 4, amely szimmetrikus az 1-es pontra a pontokat összekötő háromszög szemközti oldalához képest 2 és 3.

Ezután az új szimplex csúcsaiban végzett kísérletek eredményeit összehasonlítjuk egymással, a legsikeresebbet eldobjuk, és a szimplex megfelelő csúcsát átvisszük a pontba. 5. Ezután a vizsgált eljárás megismétlődik a teljes optimalizálási folyamat során.

Ha az optimalitási kritérium extrémumát elérjük, akkor a szimplex további mozgása leáll. Ez azt jelenti, hogy az új lépés visszaviszi a kutatót a faktortér előző pontjára.

Ha az optimalitási feltételnek több szélsősége van, akkor ez a módszer lehetővé teszi, hogy megtaláljuk azt, amelyik közelebb van az eredeti szimplex pontjaihoz. Ezért, ha felmerül a gyanú, hogy az optimalitási feltétel több szélsősége is létezik, akkor ezeket meg kell keresni, minden alkalommal a faktortér egy új régiójából indítva az optimalizálást. Ezután össze kell hasonlítani a megtalált optimális feltételeket egymással, és az összes lehetőség közül kiválasztani a legjobbat.

Az optimalizálás során figyelembe kell venni a befolyásoló tényezőkre és válaszfüggvényekre rótt korlátokat.

Fontos megjegyezni, hogy a szimplex módszer használatakor nem szükséges párhuzamos kísérletek. Az a tény, hogy egyetlen kísérlet hibája csak kis mértékben lassíthatja az optimalizálást. Ha a következő kísérletek hibátlanul lezajlanak, akkor az optimum felé haladva folytatódik.

Az eredeti szimplex kódolt változókban végzett kísérleteinek mátrixát a 11. táblázat tartalmazza.

A táblázatban szereplő értékeket a következő képletekkel számítjuk ki:

Itt az i a faktorszám a tervezési mátrixban. A 0 szimbólum a terv középpontjának, azaz a fő szintjének koordinátáit jelöli.

11. táblázat

Az eredeti szimplex mátrixa

Tapasztalat száma

x2

Válasz funkció

K2

K2

táblázatban bemutatott kísérletek. A 11 egy szimplex csúcsainak felel meg, amelynek oldala eggyel egyenlő, és középpontja egybeesik az origóval (kódolt változókban).

táblázat alapján végzett számítások eredményei. 11. képleteket és (*) képleteket a táblázat tartalmazza. 12.

12. táblázat

A kezdeti kísérletsorozat feltételei

Tapasztalat száma

Nyilvánvaló, hogy a legtöbb kísérletet a kísérlet elején kell elvégezni. Ezután minden optimalizálási lépésben csak egy kísérletet hajtanak végre.

Az optimalizálás megkezdéséhez a táblázatot kell használni. 11 vagy 12 számítsa ki a kezdeti kísérletsorozat mátrixát fizikai változókban a képlet segítségével

A jövőben minden műveletet csak a fizikai1-el hajtanak végre. változók.

Az egyes új élmények feltételeit a következő képlet számítja ki:

ahol P-- a tervezési mátrixban szereplő tényezők száma;

j -- tapasztalati szám;

i-faktorszám;

Az i-edik tényező értéke az előző szimplex leg"sikertelenebb" tapasztalatában.

Megjegyzendő, hogy a szimplex módszerrel végrehajtott optimalizálás bármely lépésében a kutatási programba egy új tényező , amit addig nem vettek figyelembe, hanem állandó szinten maradt.

Ebben az esetben az összes korábban figyelembe vett tényező értékét a következő képlettel számítják ki:

ahol 1 = 1, 2,..., P, vagyis az előző szimplex megfelelő koordinátáinak számtani középértékei.

Az újonnan bevezetett tényező értékét a következő képlet határozza meg:

ahol x0(n+1) ennek a tényezőnek a fő szintje;

Dxn+1 – kiválasztott variációs lépés ehhez a tényezőhöz;

Rn+1, kn+1 - képletekkel számított értékek (*).

Megjegyzendő, hogy a teljes „faktoriális kísérlethez” egy új tényező hozzáadása a kísérletek számának megduplázódásával jár együtt. . Ebben az értelemben a szimplex módszernek nyilvánvaló előnye van. .

Példa 3.2. Legyen szükség szimplex módszerrel a céltermék hozamának optimalizálására nál nél(%), amelyet két x1 és x2 () koncentrációjú reagens kölcsönhatásával kapunk x3 (°С) hőmérsékleten.

Kiválasztjuk a tényezők variációjának fő szintjeit és lépéseit, és ezeket a táblázatban foglaljuk össze. 13.

13. táblázat

Tényezőszintek és variációs lépések értékei

Fő szint

Variációs lépés

A (3.5) képlet és a tabulátor segítségével. 12. ábra, számítsa ki az első négy kísérlet körülményeit, és foglalja össze az eredményeket a táblázatban. 14. Így például a harmadik élményhez

x31=1+0,1*0==1; x32== 1,50 +0,2 (-0,578) == 1,38; x33=60+5*0,204==61.

14. táblázat

Optimalizálás szimplex módszerrel

Tapasztalat száma

Válasz funkció

Az első négy kísérlet eredményeit összevetve azt látjuk, hogy a céltermék legalacsonyabb hozamát a harmadik kísérletben kaptuk. Ezt a tapasztalatot ki kell zárni a további vizsgálatból.

Helyettesítsük az 5-ös tapasztalattal, amelynek feltételeit a (**) képlet alapján számítjuk ki:

Az 1., 2., 4. és 5. kísérlet által alkotott új szimplexben a 4. kísérlet a leg"sikertelenebb". Helyettesítsük a 6. kísérlettel, melynek feltételeit ugyanazzal a (**) képlettel fogjuk megtalálni.

Vizsgáljuk meg most azt a kérdést, hogyan vegyünk be egy másik tényezőt a kutatási programba, például a keverő forgási sebességét. Eddig legyen állandó és egyenlő 500-zal fordulat Most ezt az értéket x4 tényezőnek tekintjük, és a Dx4 == 100 ford./perc változás lépését vesszük.

A három faktorra vonatkozó előző szimplex (lásd 14. táblázat) az 1., 2., 5. és 6. kísérletből áll. Ahhoz, hogy ebből négy faktorra új szimplexet kapjunk, bevezetjük a 7. kísérletet (15. táblázat).

15. táblázat

Új tényező hozzáadása az optimalizáló programhoz

Tapasztalat száma

Válasz funkció

Megtaláljuk a 7. kísérlet elvégzésének feltételeit a (3.7) és (3.8) képletekkel:

Az Allbest.ru oldalon található

...

Hasonló dokumentumok

    A statisztikai adatok rendszerezésének és felhasználásának matematikai módszerei tudományos és gyakorlati következtetésekhez. Egy diszkrét valószínűségi változó eloszlásának törvénye. Az általános populáció fogalma. Statisztikai megfigyelések feladatai. Szelektív elosztás.

    absztrakt, hozzáadva: 2010.12.10

    A matematikai statisztika fogalma, mint a statisztikai adatok rendszerezésének és felhasználásának matematikai módszereinek tudománya tudományos és gyakorlati következtetések levonására. Pontbecslések a statisztikai eloszlások paramétereire. Átlagok számításának elemzése.

    szakdolgozat, hozzáadva 2014.12.13

    A matematikai statisztika mint a statisztikai adatok rendszerezésének matematikai módszereinek tudománya, mutatói. A minta sokaság integrál statisztikai eloszlásának összeállítása, hisztogramok készítése. A paraméterek pontbecslésének számítása.

    szakdolgozat, hozzáadva 2011.10.04

    A statisztikai adatok elsődleges elemzése és főbb jellemzői. Az eloszlási paraméterek pontbecslései. Konfidencia intervallumok az ismeretlen matematikai elvárásokhoz és a szóráshoz. Statisztikai hipotézisek tesztelése.

    szakdolgozat, hozzáadva: 2016.01.18

    A statisztika a természet és a társadalom tömegjelenségeinek tudománya; adatok beszerzése, feldolgozása, elemzése. Demográfiai statisztikák, népesség-előrejelzés Oroszországban. Statisztikai adatfeldolgozási módszerek: logika elemei, kombinatorika, valószínűségszámítás.

    bemutató, hozzáadva 2012.12.19

    Konkrét módszerek alkalmazása a statisztikában feladatoktól függően. A tömeges megfigyelések módszerei, csoportosítások, összesítő mutatók, idősorok, index módszer. Korreláció- és diszperzióanalízis. Átlagos statisztikai értékek számítása.

    teszt, hozzáadva: 2009.09.21

    Statisztikai adatok beszerzése a jelenség állapotának és fejlődésének általános leírásához. A statisztikai megfigyelés típusai, módszerei és szervezeti formái. Statisztikai forma, adatok összesítése, csoportosítása. Statisztikai táblázatok és grafikonok.

    absztrakt, hozzáadva: 2009.11.12

    A matematikai elvárás és szórás meghatározása a járműelemek meghibásodásaira vonatkozó statisztikai adatok mintájára vonatkozó eloszlási törvény kiválasztásához. Az események számának meghatározása egy adott intervallumban; a Pearson-kritérium értékének kiszámítása.

    teszt, hozzáadva 2014.04.01

    A jogstatisztikai adatok táblázatos bemutatásának módja. Abszolút és általános mutatók. Relatív értékek, főbb típusaik és alkalmazása. Geometriai átlag, módus és medián. Szelektív megfigyelési módszer. A dinamika sorozatok osztályozása.

    teszt, hozzáadva 2013.03.29

    A regisztrált mobil előfizetői terminálok számáról szóló statisztikai adatok elsődleges feldolgozása 2008-ban 1000 lakosra számítva Oroszország régióiban. A paraméterek intervallumbecslése. Hipotézis az eloszlás típusáról. Regresszió analízis.

Részvény