A valószínűségi változók közötti kapcsolatot a segítségével határozzuk meg. A valószínűségi változók mennyiségi jellemzőinek számítására szolgáló műveletek tulajdonságai

A korrelációelemzés célja célja, hogy meghatározza a valós folyamatot jellemző valószínűségi változók (jellemzők) közötti kapcsolat erősségének becslését.
A korrelációelemzés problémái:
a) Két vagy több jelenség koherenciájának (zártság, erősség, súlyosság, intenzitás) mérése.
b) Az eredményül kapott attribútumra legjelentősebb hatást gyakorló tényezők kiválasztása a jelenségek közötti kapcsolódás mértékének mérése alapján. Az ebből a szempontból szignifikáns tényezőket a továbbiakban a regressziós elemzésben alkalmazzuk.
c) Ismeretlen ok-okozati összefüggések felderítése.

A kapcsolatok megnyilvánulási formái nagyon változatosak. A leggyakoribb típusok a funkcionális (teljes) és korrelációs (hiányos) kapcsolat.
Korrelációátlagosan tömeges megfigyeléseknél jelentkezik, amikor a függő változó adott értékei megfelelnek a független változó valószínűségi értékeinek bizonyos sorozatának. A kapcsolatot korrelációnak nevezik, ha a faktorkarakterisztika minden értéke megfelel az eredő jellemző egy jól meghatározott nem véletlenszerű értékének.
A korrelációs táblázat vizuális ábrázolása a korrelációs mező. Ez egy grafikon, ahol az X értékeket az abszcissza tengelyen, az Y értékeket az ordináta tengelyen, az X és Y kombinációit pedig pontok jelzik. A pontok elhelyezkedése alapján lehet megítélni a jelenlétet egy kapcsolatról.
A kapcsolat szorosságának mutatói lehetővé teszik az eredményül kapott tulajdonság variációjának a faktorjellemző változásától való függésének jellemzését.
A zsúfoltság mértékének fejlettebb mutatója korrelációs kapcsolat van lineáris korrelációs együttható. Ennek a mutatónak a kiszámításakor nemcsak egy jellemző egyedi értékeinek átlagtól való eltérését veszik figyelembe, hanem ezen eltérések nagyságát is.

A témakör kulcskérdései az effektív jellemző és a magyarázó változó közötti regressziós kapcsolat egyenletei, a legkisebb négyzetek módszere a regressziós modell paramétereinek becslésére, a kapott regressziós egyenlet minőségének elemzése, konfidenciaintervallumok felépítése a regressziós modell előrejelzésére. az effektív jellemző értékeit a regressziós egyenlet segítségével.

2. példa


Normálegyenletrendszer.
a n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
Adataink esetében az egyenletrendszernek van formája
30a + 5763 b = 21460
5763 a + 1200261 b = 3800360
Az első egyenletből fejezzük ki Aés behelyettesítjük a második egyenletbe:
Azt kapjuk, hogy b = -3,46, a = 1379,33
Regressziós egyenlet:
y = -3,46 x + 1379,33

2. A regressziós egyenlet paramétereinek kiszámítása.
A minta azt jelenti.



Minta eltérések:


Szórás


1.1. Korrelációs együttható
Kovariancia.

Kiszámoljuk a kapcsolat szorosságának mutatóját. Ez a mutató a minta lineáris korrelációs együtthatója, amelyet a következő képlettel számítanak ki:

A lineáris korrelációs együttható –1 és +1 közötti értékeket vesz fel.
A jellemzők közötti kapcsolatok lehetnek gyengeek és erősek (szorosak). Kritériumaik értékelése a Chaddock-skálán történik:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
Példánkban az Y tulajdonság és az X faktor közötti kapcsolat magas és inverz.
Ezenkívül a lineáris pár korrelációs együttható a b regressziós együtthatóval határozható meg:

1.2. Regressziós egyenlet(regressziós egyenlet becslése).

A lineáris regressziós egyenlet: y = -3,46 x + 1379,33

A b = -3,46 együttható az effektív mutató átlagos változását mutatja (y mértékegységben) az x tényező mérési egységenkénti értékének növekedésével vagy csökkenésével. Ebben a példában 1 egységnyi növekedéssel y átlagosan -3,46-kal csökken.
Az a = 1379,33 együttható formálisan mutatja y előrejelzett szintjét, de csak akkor, ha x = 0 közel van a mintaértékekhez.
De ha x=0 messze van x mintaértékeitől, akkor a szó szerinti értelmezés hibás eredményekhez vezethet, és még ha a regressziós egyenes is elég pontosan írja le a megfigyelt mintaértékeket, nincs garancia arra, hogy ez is balra vagy jobbra extrapolálásakor.
A megfelelő x értékeket a regressziós egyenletbe behelyettesítve meghatározhatjuk az y(x) teljesítménymutató egymáshoz igazított (előre jelzett) értékeit minden megfigyeléshez.
Az y és x közötti kapcsolat határozza meg a b regressziós együttható előjelét (ha > 0 - közvetlen kapcsolat, egyébként - inverz). Példánkban a kapcsolat fordított.
1.3. Rugalmassági együttható.
Nem célszerű regressziós együtthatókat használni (a b példában) a tényezők eredő jellemzőre gyakorolt ​​hatásának közvetlen értékelésére, ha az y eredő mutató és az x faktorkarakterisztika mértékegységei eltérnek.
Ebből a célból kiszámítják a rugalmassági együtthatókat és a béta együtthatókat.
Az E átlagos rugalmassági együttható azt mutatja meg, hogy az eredmény átlagosan hány százalékkal változik az aggregátumban nál nélátlagértékétől a faktor változásakor xátlagos értékének 1%-ával.
A rugalmassági együtthatót a következő képlet határozza meg:


A rugalmassági együttható kisebb, mint 1. Ezért ha X 1%-kal változik, Y 1%-nál kisebb mértékben változik. Más szóval, X hatása Y-ra nem szignifikáns.
Béta együttható megmutatja, hogy a szórása értékének mekkora részével változik az eredményül kapott jellemző átlagértéke, ha a faktorkarakterisztika szórásának értékével változik a fennmaradó független változók állandó szinten rögzített értékével:

Azok. x-nek az S x szórással való növekedése Y átlagértékének 0,74 S y szórással való csökkenéséhez vezet.
1.4. Közelítési hiba.
Értékeljük a regressziós egyenlet minőségét az abszolút közelítés hibájával. Átlagos közelítési hiba - a számított értékek átlagos eltérése a tényleges értékektől:


Mivel a hiba kisebb, mint 15%, ez az egyenlet regresszióként használható.
Varianciaanalízis.
A varianciaanalízis célja a függő változó varianciájának elemzése:
∑(y i - y cp) 2 = ∑(y(x) - y cp) 2 + ∑(y - y(x)) 2
Ahol
∑(y i - y cp) 2 - az eltérések négyzetes összege;
∑(y(x) - y cp) 2 - a regresszióból eredő eltérések négyzetes összege ("magyarázott" vagy "tényező");
∑(y - y(x)) 2 - az eltérések négyzetes maradék összege.
Elméleti korrelációs kapcsolat lineáris kapcsolat esetén egyenlő az r xy korrelációs együtthatóval.
A függőség bármely formája esetén a csatlakozás szorosságát a segítségével határozzuk meg többszörös korrelációs együttható:

Ez az együttható univerzális, mivel tükrözi a kapcsolat szorosságát és a modell pontosságát, és a változók közötti bármilyen kapcsolatra is használható. Egytényezős korrelációs modell felépítésénél a többszörös korrelációs együttható egyenlő az r xy párkorrelációs együtthatóval.
1.6. Meghatározási együttható.
A (többszörös) korrelációs együttható négyzetét determinációs együtthatónak nevezzük, amely megmutatja, hogy az eredő attribútum mekkora hányadát magyarázza a faktorattribútum változása.
Leggyakrabban a determinációs együttható értelmezésekor százalékban fejezik ki.
R2 = -0,742 = 0,5413
azok. az esetek 54,13%-ában x változása y változásához vezet. Más szóval, a regressziós egyenlet kiválasztásának pontossága átlagos. Az Y változás fennmaradó 45,87%-át a modellben figyelmen kívül hagyott tényezők magyarázzák.

Bibliográfia

  1. Ökonometria: Tankönyv / Szerk. I.I. Eliseeva. – M.: Pénzügy és Statisztika, 2001, p. 34..89.
  2. Magnus Y.R., Katyshev P.K., Peresetsky A.A. Ökonometria. Kezdő tanfolyam. Oktatóanyag. – 2. kiadás, rev. – M.: Delo, 1998, p. 17..42.
  3. Workshop az ökonometriáról: Proc. pótlék / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko és mások; Szerk. I.I. Eliseeva. – M.: Pénzügy és Statisztika, 2001, p. 5..48.

A valószínűségi változók közötti kapcsolat jellemzői

A regressziós függvény mellett az ökonometria két valószínűségi változó közötti kapcsolat kvantitatív jellemzőit is használja. Ide tartozik a kovariancia és a korrelációs együttható.

Valószínűségi változók kovarianciájax Ésy ezen mennyiségek matematikai elvárásaiktól való eltéréseinek szorzatának matematikai elvárása, és a következő szabály szerint számítják ki:

ahol és a változók matematikai elvárásai, ill xÉs u.

A kovariancia egy olyan konstans, amely két valószínűségi változó közötti függőség mértékét tükrözi, és így jelöljük

Független valószínűségi változók esetén a kovariancia nulla, ha a változók között statisztikai összefüggés van, akkor a megfelelő kovariancia nullától eltérő. A kovariancia jele alapján ítéljük meg a kapcsolat jellegét: egyirányú () vagy többirányú ().

Vegye figyelembe, hogy abban az esetben, ha a változók xÉs nál nél egybeesik, a (3.12) definíció egy valószínűségi változó varianciájának definíciójává válik:

A kovariancia egy dimenziós érték. Dimenziója a változók dimenzióinak szorzata. A dimenzió jelenléte a kovarianciában megnehezíti annak használatát a valószínűségi változók függésének mértékének felmérésére.

A kovariancia mellett a korrelációs együtthatót használjuk a valószínűségi változók közötti kapcsolat értékelésére.

Két valószínűségi változó korrelációs együtthatójakovarianciájuk és ezeknek a mennyiségeknek a standard hibáinak szorzatához való arányát nevezzük:

A korrelációs együttható egy dimenzió nélküli mennyiség, amelynek lehetséges értékeinek tartománya a [+1; -1]. Független valószínűségi változók esetén a korrelációs együttható nulla, de ha igen, akkor ez lineáris funkcionális kapcsolat meglétét jelzi a változók között.

A valószínűségi változókkal analóg módon kvantitatív jellemzőket is bevezetünk egy véletlenvektorra. Két ilyen jellemző van:

1) a várható komponensértékek vektora

itt van egy véletlen vektor, egy véletlen vektor összetevőinek matematikai elvárásai;

2) kovariancia mátrix

(3.15)

A kovariancia mátrix egyszerre tartalmaz információt a véletlen vektorkomponensek bizonytalansági fokáról és az egyes vektorkomponenspárok egymás közötti kapcsolatának mértékéről.

A közgazdaságtanban a véletlen vektor fogalma és jellemzői különösen a tőzsdei tranzakciók elemzésében találtak alkalmazásra. A híres amerikai közgazdász, Harry Markowitz a következő megközelítést javasolta. Legyen n kockázatos eszköz a tőzsdén. Az egyes eszközök hozama egy bizonyos időn belül egy valószínűségi változó. Bemutatjuk a hozamok vektorát és a várható hozamok megfelelő vektorát. Markovets azt javasolta, hogy a várható hozam vektorát vegyék figyelembe egy adott eszköz vonzerejének mutatójaként, és a kovarianciamátrix főátlójának elemeit az egyes eszközök kockázatának mértékeként. Az átlós elemek a vektorban szereplő megfelelő hozampárok kapcsolatértékeit tükrözik. A tőzsde parametrikus Markowitz modellje öltött formát

Ez a modell képezi az optimális értékpapír-portfólió elméletének alapját.

A valószínűségi változók mennyiségi jellemzőinek számítására szolgáló műveletek tulajdonságai

Tekintsük a valószínűségi változók mennyiségi jellemzőinek számítási műveleteinek alapvető tulajdonságait és a véletlen vektort.

Műveletek a matematikai elvárás kiszámításához:

1) ha egy valószínűségi változó x = Val vel, Ahol Val vel akkor konstans

2) ha x és y – valószínűségi változók, az ai tetszőleges állandók, akkor

3) ha xÉs nál nél független valószínűségi változók, akkor

Varianciaszámítási műveletek:

1) ha egy valószínűségi változó x = c, ahol c tetszőleges állandó, akkor

2) ha x

3) ha x akkor egy valószínűségi változó, és c egy tetszőleges állandó

4) ha xÉs y akkor valószínűségi változók, az ai tetszőleges állandók

A cég 10 főt foglalkoztat. A 2. táblázat a munkatapasztalataik adatait és

havi fizetés.

Számítsa ki ezen adatok felhasználásával

  • - a minta kovarianciabecslésének értéke;
  • - a minta Pearson korrelációs együtthatójának értéke;
  • - a kapott értékekből megbecsülni a kapcsolat irányát és erősségét;
  • - határozza meg, mennyire jogos az a mondás, hogy ez a cég a japán irányítási modellt használja, amely feltételezi, hogy minél több időt tölt egy alkalmazott egy adott cégnél, annál magasabb fizetést kell kapnia.

A korrelációs mező alapján feltételezhetjük (a sokaságra), hogy az X és Y összes lehetséges értéke között lineáris a kapcsolat.

A regressziós paraméterek kiszámításához számítási táblázatot készítünk.

A minta azt jelenti.

Minta eltérések:

A becsült regressziós egyenlet a következő lesz

y = bx + a + e,

ahol ei az ei, a és b hibák megfigyelt értékei (becslései), a b paraméterek becslései és a keresendő regressziós modellben.

A b és c paraméterek becsléséhez a legkisebb négyzetek módszerét (a legkisebb négyzetek módszerét) használjuk.

Normálegyenletrendszer.

a?x + b?x2 = ?y*x

Adataink esetében az egyenletrendszernek van formája

  • 10a + 307 b = 33300
  • 307 a + 10857 b = 1127700

Szorozzuk meg a rendszer (1) egyenletét (-30,7)-el, kapunk egy rendszert, amit az algebrai összeadás módszerével oldunk meg.

  • -307a -9424,9 b = -1022310
  • 307 a + 10857 b = 1127700

Kapunk:

1432,1 b = 105390

Honnan származik a b = 73.5912?

Most keressük meg az „a” együtthatót az (1) egyenletből:

  • 10a + 307 b = 33300
  • 10a + 307 * 73,5912 = 33300
  • 10a = 10707,49

Empirikus regressziós együtthatókat kapunk: b = 73,5912, a = 1070,7492

Regressziós egyenlet (empirikus regressziós egyenlet):

y = 73,5912 x + 1070,7492

Kovariancia.

Példánkban az Y tulajdonság és az X faktor közötti kapcsolat magas és közvetlen.

Ezért nyugodtan kijelenthetjük, hogy minél több időt dolgozik egy alkalmazott egy adott cégnél, annál magasabb a fizetése.

4. Statisztikai hipotézisek tesztelése. A probléma megoldása során az első lépés egy tesztelhető hipotézis és egy alternatív hipotézis megfogalmazása.

Az általános részvények egyenlőségének ellenőrzése.

Tanulmányt készítettek a hallgatók teljesítményéről két karon. Az opciók eredményeit a 3. táblázat tartalmazza. Mondhatjuk-e, hogy mindkét karon ugyanannyi a kiváló hallgatók aránya?

Egyszerű számtani átlag

Teszteljük az általános részvények egyenlőségére vonatkozó hipotézist:

Keressük meg a Student-kritérium kísérleti értékét:

A szabadságfokok száma

f = nх + nу - 2 = 2 + 2 - 2 = 2

Határozza meg a tkp értéket a Student eloszlási táblázat segítségével

A Student táblázatot használva a következőket kapjuk:

Ttábla(f;b/2) = Ttábla(2;0,025) = 4,303

A Student-eloszlás kritikus pontjainak táblázatát használva b = 0,05 szignifikanciaszinten és adott számú szabadsági fokon tcr = 4,303

Mert tob > tcr, akkor a nullhipotézist elvetjük, a két minta általános részaránya nem egyenlő.

Az általános eloszlás egységességének ellenőrzése.

Az egyetem illetékesei azt szeretnék kideríteni, hogyan változott az idők során a bölcsészettudományi tanszék népszerűsége. Az erre a karra jelentkező jelentkezők számát az adott év összes jelentkezőinek számához viszonyítva elemeztük. (Az adatokat a 4. táblázat tartalmazza). Ha a jelentkezők számát tekintjük reprezentatív mintának az év végi összesített iskolai végzettségéből, akkor elmondható-e, hogy az iskolások érdeklődése e kar szakjai iránt idővel nem változik?

4. lehetőség

Megoldás: Táblázat a mutatók kiszámításához.

Az intervallum közepe, xi

Akkumulált frekvencia, S

Frekvencia, fi/n

Az eloszlási sorozat értékeléséhez a következő mutatókat találjuk:

Súlyozott átlag

A változási tartomány az elsődleges sorozatjellemző maximális és minimális értéke közötti különbség.

R = 2008 - 1988 = 20 Diszperzió - a szóródás mértékét az átlagértéke körül jellemzi (a diszperzió mértéke, azaz az átlagtól való eltérés).

Szórás (átlagos mintavételi hiba).

A sorozat minden értéke átlagosan 6,32-vel tér el a 2002,66-os átlagtól

A populáció egyenletes eloszlására vonatkozó hipotézis tesztelése.

Az X egyenletes eloszlására vonatkozó hipotézis tesztelése érdekében, i.e. törvény szerint: f(x) = 1/(b-a) az (a,b) intervallumban szükséges:

Becsülje meg az a és b paramétereket - annak az intervallumnak a végeit, amelyben az X lehetséges értékeit megfigyelték, a képletekkel (a * jel a paraméterbecsléseket jelöli):

Határozza meg a várható eloszlás valószínűségi sűrűségét f(x) = 1/(b* - a*)

Keresse meg az elméleti frekvenciákat:

n1 = nP1 = n = n*1/(b* - a*)*(x1 - a*)

n2 = n3 = ... = ns-1 = n*1/(b* - a*)*(xi - xi-1)

ns = n*1/(b* - a*)*(b* - xs-1)

Hasonlítsa össze az empirikus és elméleti gyakoriságokat a Pearson-kritérium segítségével, a szabadsági fokok számát k = s-3 felvéve, ahol s a kezdeti mintavételi intervallumok száma; ha kis frekvenciák és így maguk az intervallumok kombinációját hajtottuk végre, akkor s a kombináció után fennmaradó intervallumok száma. Keressünk becsléseket az egyenletes eloszlás a* és b* paramétereire a következő képletekkel:

Határozzuk meg a feltételezett egyenletes eloszlás sűrűségét:

f(x) = 1/(b* - a*) = 1/(2013,62 - 1991,71) = 0,0456

Keressük az elméleti frekvenciákat:

n1 = n*f(x)(x1 - a*) = 0,77 * 0,0456 (1992-1991,71) = 0,0102

n5 = n*f(x)(b* - x4) = 0,77 * 0,0456 (2013,62-2008) = 0,2

ns = n*f(x)(xi-xi-1)

Mivel a Pearson statisztika az empirikus és az elméleti eloszlás közötti különbséget méri, minél nagyobb a megfigyelt Kob értéke, annál erősebb az érv a fő hipotézis ellen.

Ezért ezeknek a statisztikáknak a kritikus tartománya mindig a jobbkezes :)

Ossza meg