Bayes tétele egy esemény valószínűségének elmélete. Teljes valószínűségi képlet

Ki az a Bayes? És mi köze ennek a menedzsmenthez? – következhet egy egészen jogos kérdés. Egyelőre fogadjon szót: ez nagyon fontos! .. és érdekes (legalábbis számomra).

Milyen paradigmában működik a legtöbb vezető: ha megfigyelek valamit, milyen következtetéseket vonhatok le belőle? Mit tanít Bayes: minek kell valójában lennie ahhoz, hogy megfigyelhessem ezt a valamit? Minden tudomány így fejlődik, és erről írja (emlékezetből idézek): akinek nincs a fejében elmélet, az egyik ötlettől a másikig ódzkodik a különféle események (megfigyelések) hatására. Nem hiába mondják: nincs gyakorlatiasabb egy jó elméletnél.

Példa a gyakorlatból. A beosztottam hibázik, a kolléganőm (egy másik osztály vezetője) azt mondja, hogy a hanyag alkalmazotton vezetői befolyást kellene gyakorolni (vagyis megbüntetni/szidni). És úgy tudom, hogy ez az alkalmazott havonta 4-5 ezret hajt végre azonos típusú műveleteket, és ezalatt legfeljebb 10 hibát követ el. Érzi a különbséget a paradigmában? A kollégám reagál a megfigyelésre, és eleve tudomásom van arról, hogy egy alkalmazott bizonyos számú hibát elkövet, így még egy nem befolyásolta ezt a tudást... Most, ha a hónap végén kiderül, hogy vannak, például 15 ilyen hiba! .. Ez már ok lesz a szabványok be nem tartása okainak vizsgálatára.

Meg van győződve a Bayes-féle megközelítés fontosságáról? Érdekelt? Remélem". És most egy légy a kenőcsben. Sajnos a Bayes-féle ötletek ritkán adják meg elsőre. Őszintén nem volt szerencsém, mert a népi irodalom révén ismerkedtem meg ezekkel a gondolatokkal, amelyek elolvasása után sok kérdés maradt. A jegyzetírás tervezésekor mindent összegyűjtöttem, amit Bayes szerint korábban felvázoltam, és azt is tanulmányoztam, amit az interneten írnak. Bemutatom a legjobb tippemet a témában. Bevezetés a Bayes-féle valószínűségbe.

Bayes tételének levezetése

Tekintsük a következő kísérletet: elnevezzük a szegmensen fekvő tetszőleges számot, és rögzítjük, ha ez a szám például 0,1 és 0,4 között van (1a. ábra). Ennek az eseménynek a valószínűsége egyenlő a szegmens hosszának a szegmens teljes hosszához viszonyított arányával, feltéve, hogy a számok előfordulása a szakaszon azonos valószínűségű. Matematikailag ez leírható p(0,1 <= x <= 0,4) = 0,3, или кратко R(x) = 0,3, ahol R- valószínűség, x egy valószínűségi változó a tartományban, x egy valószínűségi változó a tartományban. Vagyis a szegmens eltalálásának valószínűsége 30%.

Rizs. 1. Valószínűségek grafikus értelmezése

Most vegyük figyelembe az x négyzetet (1b. ábra). Tegyük fel, hogy meg kell neveznünk számpárokat ( x, y), amelyek mindegyike nagyobb nullánál és kisebb egynél. Annak a valószínűsége x(első szám) a szegmensen belül lesz (kék terület 1), egyenlő a kék terület területének és a teljes négyzet területének arányával, azaz (0,4 - 0,1) ) * (1 - 0) / (1 * 1) \u003d 0, 3, azaz ugyanaz a 30%. Annak a valószínűsége y a szegmensen belül van (2. zöld terület) egyenlő a zöldterület területének és a teljes négyzet területének arányával p(0,5 <= y <= 0,7) = 0,2, или кратко R(Y) = 0,2.

Mit lehet egyszerre megtudni az értékekről xÉs y. Például mennyi a valószínűsége annak, hogy mindkettő xÉs y a megfelelő adott szegmensekben vannak? Ehhez ki kell számítania a 3. tartomány területének (a zöld és kék csíkok metszéspontja) és a teljes négyzet területének arányát: p(x, Y) = (0,4 – 0,1) * (0,7 – 0,5) / (1 * 1) = 0,06.

Most tegyük fel, hogy tudni akarjuk, mi ennek a valószínűsége y az if intervallumban van x már a tartományban van. Azaz valójában van egy szűrőnk, és amikor párokat hívunk ( x, y), akkor azonnal eldobjuk azokat a párokat, amelyek nem felelnek meg a megtalálás feltételének x adott intervallumban, majd a szűrt párokból azokat számoljuk, amelyekre y kielégíti a feltételünket, és a valószínűséget tekintsük azon párok számának hányadosának, amelyekhez y a fenti szegmensben található a szűrt párok teljes számához (vagyis amelyhez x szegmensben fekszik). Ezt a valószínűséget így írhatjuk fel p(Y|x nál nél x lőtt a tartományban." Nyilvánvaló, hogy ez a valószínűség egyenlő a 3. terület és az 1. kék terület területének arányával. A 3. terület területe (0,4 - 0,1) * (0,7 - 0,5) = 0,06, és a kék terület 1 ( 0,4 - 0,1) * (1 - 0) = 0,3, akkor ezek aránya 0,06 / 0,3 = 0,2. Más szóval, a megtalálás valószínűsége y a szegmensen, feltéve, hogy x szegmenshez tartozik p(Y|x) = 0,2.

Az előző bekezdésben tulajdonképpen megfogalmaztuk az azonosságot: p(Y|x) = p(x, Y) /p( x). Ez így szól: "ütés valószínűsége nál nél tartományban, feltéve, hogy x tartományba eső találat egyenlő az egyidejű találat valószínűségének arányával x tartományban és nál nél tartományban, az elütés valószínűségére x a tartományba."

Analógia alapján vegyük figyelembe a valószínűséget p(x|Y). Párokat hívunk x, y), és szűrje ki azokat, amelyekre y 0,5 és 0,7 között van, akkor annak a valószínűsége x abban a szegmensben van, feltéve, hogy y szegmenshez tartozik egyenlő a 3. terület területének a 2. zöldterület területéhez viszonyított arányával: p(x|Y) = p(x, Y) / p(Y).

Vegye figyelembe, hogy a valószínűségek p(x, Y) És p(Y, X) egyenlőek, és mindkettő egyenlő a 3. zóna területének a teljes négyzet területéhez viszonyított arányával, de a valószínűségek p(Y|x) És p(x|Y) nem egyenlő; míg a valószínűség p(Y|x) egyenlő a 3. terület és az 1. terület területének arányával, és p(x|Y) – a 3. tartománytól a 2. tartományig. Vegye figyelembe azt is p(x, Y) gyakran így jelölik p(x&Y).

Tehát két definíciónk van: p(Y|x) = p(x, Y) /p( x) És p(x|Y) = p(x, Y) / p(Y)

Írjuk át ezeket az egyenlőségeket így: p(x, Y) = p(Y|x)*p( x) És p(x, Y) = p(x|Y) * p(Y)

Mivel a bal oldalak egyenlőek, a jobb oldalak is egyenlőek: p(Y|x)*p( x) = p(x|Y) * p(Y)

Vagy átírhatjuk az utolsó egyenlőséget a következőképpen:

Ez Bayes tétele!

Lehetséges, hogy ilyen egyszerű (majdnem tautologikus) transzformációkból nagyszerű tétel születik!? Ne siesse el a következtetéseket. Beszéljünk még egyszer arról, amit kaptunk. Volt némi kezdeti (a priori) valószínűség R(X) hogy a valószínűségi változó x a szegmensen egyenletesen eloszló tartományba esik x. Valami esemény történt Y, melynek eredményeként megkaptuk ugyanannak a valószínűségi változónak a posteriori valószínűségét x: R(X|Y), és ez a valószínűség eltér ettől R(X) együtthatóval . Esemény Y bizonyítéknak nevezett, többé-kevésbé megerősítő vagy cáfoló x. Ezt az együtthatót néha nevezik bizonyíték ereje. Minél erősebb a bizonyíték, annál inkább változtatja meg az Y megfigyelés ténye a priori valószínűséget, annál jobban eltér a posterior valószínűség a priortól. Ha a bizonyítékok gyengeek, a posterior közel azonos a korábbival.

Bayes-képlet diszkrét valószínűségi változókhoz

Az előző részben levezettük a Bayes-képletet az intervallumon definiált folytonos x és y valószínűségi változókra. Vegyünk egy példát diszkrét valószínűségi változókkal, amelyek mindegyike két lehetséges értéket vesz fel. A rutin orvosi vizsgálatok során kiderült, hogy negyven évesen a nők 1%-a szenved mellrákban. A rákos nők 80%-a pozitív mammográfiai eredményt kap. Az egészséges nők 9,6%-a pozitív mammográfiai eredményt is kap. A vizsgálat során egy ebbe a korosztályba tartozó nő kapott pozitív mammográfiás eredményt. Mennyi annak a valószínűsége, hogy valóban mellrákja van?

Az érvelés/számítás menete a következő. A rákos betegek 1%-a közül a mammográfia 80%-ban ad pozitív eredményt = 1% * 80% = 0,8%. Az egészséges nők 99%-ánál a mammográfia 9,6% pozitív eredményt ad = 99% * 9,6% = 9,504%. Összességében a pozitív mammográfiás eredménnyel rendelkezők 10,304%-a (9,504% + 0,8%) mindössze 0,8% beteg, a maradék 9,504% egészséges. Így annak a valószínűsége, hogy egy pozitív mammográfiás nő rákbeteg, 0,8% / 10,304% = 7,764%. 80%-ra gondoltál?

Példánkban a Bayes-képlet a következő formában jelenik meg:

Beszéljünk még egyszer ennek a képletnek a „fizikai” jelentéséről. x egy valószínűségi változó (diagnózis), amely a következő értékeket veszi fel: X 1- beteg és X 2- egészséges; Y– valószínűségi változó (mérési eredmény - mammográfia), amely a következő értékeket veszi fel: I 1- pozitív eredmény és Y2- negatív eredmény; p(X 1)- a betegség valószínűsége a mammográfia előtt (a priori valószínűség), 1%; R(Y 1 |x 1 ) - a pozitív eredmény valószínűsége, ha a beteg beteg (feltételes valószínűség, mivel ezt a probléma körülményei között kell megadni), egyenlő 80%; R(Y 1 |x 2 ) – a pozitív eredmény valószínűsége, ha a beteg egészséges (feltételes valószínűség is), egyenlő 9,6%; p(X 2)- annak valószínűsége, hogy a beteg egészséges a mammográfia előtt (a priori valószínűség), 99%; p(X 1|Y 1 ) – annak a valószínűsége, hogy a beteg beteg, pozitív mammográfiai eredmény esetén (posterior valószínűség).

Látható, hogy az utólagos valószínűség (amit keresünk) arányos az előzetes valószínűséggel (kezdeti) egy kicsit összetettebb együtthatóval . ismét hangsúlyozom. Véleményem szerint ez a bayesi megközelítés alapvető aspektusa. Méret ( Y) hozzáadott egy bizonyos mennyiségű információt az eredetileg rendelkezésre állóhoz (a priori), ami tisztázta ismereteinket az objektumról.

Példák

A tárgyalt anyag összevonásához próbáljon meg több problémát megoldani.

1. példa 3 urna van; az első 3 fehér golyóban és 1 fekete; a másodikban - 2 fehér és 3 fekete golyó; a harmadikban - 3 fehér golyó. Valaki véletlenszerűen közeledik az egyik urnához, és húz belőle 1 labdát. Ez a labda fehér. Határozza meg annak utólagos valószínűségét, hogy a golyót az 1., 2., 3. urnából húzzák ki.

Megoldás. Három hipotézisünk van: H 1 = (első urna kiválasztva), H 2 = (második urna kiválasztva), H 3 = (harmadik urna kiválasztva). Mivel az urnát véletlenszerűen választják ki, a hipotézisek a priori valószínűségei: Р(Н 1) = Р(Н 2) = Р(Н 3) = 1/3.

A kísérlet eredményeként megjelent az A = esemény (a kiválasztott urnából egy fehér golyót vettek ki). Az A esemény feltételes valószínűségei a H 1, H 2, H 3 hipotézisek mellett: P(A|H 1) = 3/4, P(A|H 2) = 2/5, P(A|H 3) = 1. Például az első egyenlőség a következőképpen hangzik: "a valószínűsége annak, hogy az első urnát választva fehér golyót húzzunk, 3/4 (mivel az első urnában 4 golyó van, és ebből 3 fehér)".

A Bayes-képlet alkalmazásával megtaláljuk a hipotézisek utólagos valószínűségeit:

Így az A esemény bekövetkezésére vonatkozó információk tükrében a hipotézisek valószínűségei megváltoztak: a legvalószínűbb a H 3 hipotézis, a legkevésbé valószínű - a H 2 hipotézis.

2. példa Két lövő egymástól függetlenül lő ugyanarra a célpontra, mindegyik egy lövést ad le. Az első lövő célba találásának valószínűsége 0,8, a második esetében 0,4. Lövés után egy lyukat találtak a célban. Határozza meg annak valószínűségét, hogy ez a lyuk az első lövöldözőhöz tartozik (az eredményt (mindkét lyuk egybeesett) elvetjük, mint elhanyagolhatóan valószínűtlen).

Megoldás. A kísérlet előtt a következő hipotézisek lehetségesek: H 1 = (sem az első, sem a második nyíl nem fog eltalálni), H 2 = (mindkét nyíl eltalál), H 3 - (az első lövöldöző eltalál, a második pedig nem ), H 4 = (az első lövöldöző nem fog eltalálni, a második pedig eltalálja). A hipotézisek előzetes valószínűségei:

P (H 1) = 0,2 * 0,6 = 0,12; P (H 2) = 0,8 * 0,4 \u003d 0,32; P (H 3) = 0,8 * 0,6 \u003d 0,48; P (H 4) = 0,2 * 0,4 \u003d 0,08.

A megfigyelt esemény A = (egy lyuk van a célpontban) feltételes valószínűségei ezeknél a hipotéziseknél: P(A|H 1) = P(A|H 2) = 0; P(A|H3) = P(A|H4) = 1

A tapasztalatok után a H 1 és H 2 hipotézisek lehetetlenné válnak, és a H 3 és H 4 hipotézisek utólagos valószínűsége a Bayes-képlet szerint:

Bayes a spam ellen

Bayes formulája széles körben alkalmazható a spamszűrők fejlesztésében. Tegyük fel, hogy meg akar tanítani egy számítógépet annak meghatározására, hogy mely e-mailek minősülnek spamnek. A szótárból és a szóösszetételekből indulunk ki Bayesi becslések segítségével. Először hozzuk létre a hipotézisek terét. Legyen 2 hipotézisünk bármely betűvel kapcsolatban: H A spam, H B nem spam, hanem normális, szükséges betű.

Először is „tanítsuk be” jövőbeli levélszemét-elhárító rendszerünket. Vegyük az összes meglévő betűt, és osszuk két 10 betűs "kupacra". Az egyikbe spam leveleket teszünk és H A kupacnak hívjuk, a másikba pedig a szükséges levelezést és H B kupacnak hívjuk. Most pedig lássuk: milyen szavak és kifejezések találhatók a spamekben és a szükséges e-mailekben, és milyen gyakorisággal? Ezeket a szavakat és kifejezéseket bizonyítéknak nevezzük, és E 1 , E 2-vel jelöljük... Kiderült, hogy a gyakran használt szavak (például a „tetszik”, „tiéd”) a HA és HB halmokban körülbelül a ugyanaz a frekvencia. Így ezeknek a szavaknak a jelenléte egy levélben semmit sem árul el arról, hogy melyik kupachoz tartozik (gyenge bizonyíték). Rendeljünk ezekhez a szavakhoz a „spam” valószínűségének becslésének semleges értékét, mondjuk 0,5-öt.

Hagyja, hogy a „beszélgetési angol” kifejezés csak 10 betűben jelenjen meg, és gyakrabban a spam e-mailekben (például 7 spam e-mailben a 10-ből), mint a megfelelőekben (10-ből 3-ban). Adjunk erre a kifejezésre magasabb pontszámot, 7/10-et a spamre, és alacsonyabb pontszámot a normál e-mailekre: 3/10. Ezzel szemben kiderült, hogy a "haver" szó gyakoribb a normál betűkben (10-ből 6). Így kaptunk egy rövid levelet: „Barát! hogy beszélsz angolul?. Próbáljuk meg értékelni a „spam” jellegét. Az egyes kupacokhoz való tartozás általános P(H A), P(H B) becslését egy kissé leegyszerűsített Bayes-képlet és a hozzávetőleges becsléseink segítségével fogjuk feltenni:

P(H A) = A/(A+B), ahol A \u003d p a1 * p a2 * ... * pan, B \u003d p b1 * p b2 * ... * pbn \u003d (1 - p a1) * (1 - p a2) * ... * ( 1 - p an).

1. táblázat Az írás egyszerűsített (és hiányos) Bayes-féle értékelése

Így hipotetikus levelünkbe a „spam” irányába való tartozás valószínűségének értékelése érkezett. Dönthetünk úgy, hogy bedobjuk a levelet valamelyik kupacba? Állítsuk be a döntési küszöböket:

  • Feltételezzük, hogy a betű a H i kupachoz tartozik, ha P(H i) ≥ T.
  • A betű nem tartozik a kupacba, ha P(H i) ≤ L.
  • Ha L ≤ P(H i) ≤ T, akkor nem lehet döntést hozni.

Felveheti T = 0,95 és L = 0,05. Mivel a kérdéses levélre és 0,05< P(H A) < 0,95, и 0,05 < P(H В) < 0,95, то мы не сможем принять решение, куда отнести данное письмо: к спаму (H A) или к нужным письмам (H B). Можно ли улучшить оценку, используя больше информации?

Igen. Számítsuk ki minden egyes bizonyíték pontszámát más módon, ahogy Bayes javasolta. Legyen:

F a a spam e-mailek teljes száma;

F ai a tanúsítvánnyal rendelkező betűk száma én egy halom spamben;

F b a szükséges betűk teljes száma;

F bi a tanúsítvánnyal rendelkező betűk száma én a szükséges (releváns) levelek halomában.

Ekkor: p ai = F ai /F a, p bi = F bi /F b. P(H A) = A/(A+B), P(H B) = B/(A+B), aholА = p a1 *p a2 *…*p an, B = p b1 *p b2 *…*p b n

Felhívjuk figyelmét, hogy a p ai és p bi bizonyítékszavak pontszámai objektívekké váltak, és emberi beavatkozás nélkül is kiszámíthatók.

2. táblázat: Pontosabb (de nem teljes) Bayes-féle becslés az elérhető jellemzőkre egy levélből

Egészen határozott eredményt kaptunk - nagy valószínűségi határ mellett a betű a szükséges betűknek tulajdonítható, hiszen P(H B) = 0,997 > T = 0,95. Miért változott az eredmény? Mivel több információt használtunk fel - figyelembe vettük az egyes kupacokban lévő betűk számát, és mellesleg sokkal pontosabban határoztuk meg a p ai és p bi becsléseket. Ugyanúgy határozták meg őket, mint maga Bayes, a feltételes valószínűségek kiszámításával. Más szavakkal, p a3 annak a valószínűsége, hogy a "haver" szó megjelenik az e-mailben, mivel az e-mail már a H A spam kupachoz tartozik. Az eredmény nem váratott sokáig magára – úgy tűnik, nagyobb biztonsággal tudunk dönteni.

Bayes kontra vállalati csalás

A Bayes-féle megközelítés egy érdekes alkalmazását írta le MAGNUS8.

Jelenlegi projektem (gyártóvállalati csalások felderítésére szolgáló IS) a Bayes-képlet segítségével határozza meg a csalás (csalás) valószínűségét több tény megléte/hiánya esetén, közvetve a csalás lehetőségének hipotézise mellett. Az algoritmus öntanuló (visszajelzéssel), azaz. újraszámítja együtthatóit (feltételes valószínűségét) a csalás tényleges megerősítése vagy nem igazolása esetén a gazdaságbiztonsági szolgálat által végzett ellenőrzés során.

Valószínűleg érdemes azt mondani, hogy az algoritmusok tervezésénél az ilyen módszerek meglehetősen magas matematikai kultúrát igényelnek a fejlesztőtől, mert a legkisebb hiba a számítási képletek levezetésében és/vagy megvalósításában érvényteleníti és hiteltelenné teszi az egész módszert. Ebben különösen a valószínűségi módszerek a hibásak, mivel az emberi gondolkodás nem alkalmazkodik a valószínűségi kategóriákkal való munkavégzéshez, és ennek megfelelően a köztes és végső valószínűségi paraméterek „fizikai jelentésének” nincs „láthatósága” és megértése. Ilyen megértés csak a valószínűségszámítás alapfogalmai esetében létezik, és akkor csak nagyon óvatosan kell kombinálni és levezetni a bonyolult dolgokat a valószínűségszámítás törvényei szerint - a józan ész már nem segít az összetett objektumok esetében. Ez különösen komoly módszertani csatákkal jár, amelyek a valószínűségszámítás filozófiájáról szóló modern könyvek lapjain zajlanak, valamint számos szofizmus, paradoxon és érdekesség rejtvényei ebben a témában.

Még egy árnyalat, amellyel szembe kellett néznem - sajnos szinte minden, ami többé-kevésbé HASZNOS A GYAKORLATBAN ebben a témában, angolul van megírva. Az orosz nyelvű forrásokban alapvetően csak egy jól ismert elmélet található, csak a legprimitívebb esetekre demonstrációs példákkal.

Az utolsó hozzászólással teljesen egyetértek. Például a Google, amikor valami olyasmit próbált találni, mint a „Bayesian Probability” könyv, nem adott semmi érthetőt. Igaz, azt mondta, hogy Kínában betiltottak egy bayesi statisztikákat tartalmazó könyvet. (Andrew Gelman statisztikaprofesszor a Columbia Egyetem blogján arról számolt be, hogy az Adatelemzés regresszióval és többszintű/hierarchikus modellekkel című könyvét betiltották Kínában. szöveg.) Kíváncsi vagyok, vajon hasonló ok vezetett-e a Bayes-könyvek hiányához. valószínűsége Oroszországban?

Konzervativizmus az emberi információfeldolgozás folyamatában

A valószínűségek határozzák meg a bizonytalanság mértékét. A valószínűség, mind Bayes, mind a megérzéseink szerint, egyszerűen egy szám nulla és az, ami azt jelenti, hogy egy kissé idealizált személy milyen mértékben hiszi el, hogy az állítás igaz. Az ok, amiért az embert némileg idealizálják, az az, hogy a két egymást kölcsönösen kizáró esemény valószínűségeinek összegének meg kell egyeznie az események bekövetkezésének valószínűségével. Az additivitás tulajdonságának olyan következményei vannak, hogy kevés valós ember tudja mindegyiket összemérni.

Bayes tétele az additivitás tulajdonságának triviális következménye, tagadhatatlan, és minden valószínűségszámító egyetért vele, legyen az Bayes-féle és egyéb. Ennek egyik módja a következő. Ha P(H A |D) annak a későbbi valószínűsége, hogy az A hipotézis az adott D érték megfigyelése után volt, P(H A) a korábbi valószínűsége az adott D érték megfigyelése előtt, P(D|H A ) annak a valószínűsége, hogy a adott D értéket figyeljük meg, ha HA igaz, és P(D) egy adott D érték feltétlen valószínűsége, akkor

(1) P(H A |D) = P(D|H A) * P(H A) / P(D)

A P(D) legjobban normalizáló állandónak tekinthető, ami azt eredményezi, hogy az utólagos valószínűségek összeadódnak a vizsgált, egymást kölcsönösen kizáró hipotézisek teljes halmazához képest. Ha ki kell számolni, ez így lehet:

De gyakrabban a P(D) ki van küszöbölve, nem pedig számolva. Kényelmes módja ennek kiküszöbölésére, ha Bayes tételét egy valószínűség-esély relációvá alakítjuk.

Tekintsünk egy másik hipotézist, a H B , amely kölcsönösen kizárja H A-t, és gondolja meg ugyanazt a megadott mennyiséget, amely megváltoztatta a véleményét H A-val kapcsolatban. Bayes tétele azt mondja, hogy

(2) P(H B |D) = P(D|H B) * P(H B) / P(D)

Most elosztjuk az 1. egyenletet a 2. egyenlettel; így lesz az eredmény:

ahol Ω 1 a H A javára H B utólagos esélye, Ω 0 az előzetes esély, és L a statisztikusok számára ismert szám a valószínűségek arányaként. A 3. egyenlet Bayes tételének ugyanaz a releváns változata, mint az 1. egyenlet, és gyakran sokkal hasznosabb, különösen a hipotéziseket tartalmazó kísérleteknél. A Bayes-párti képviselők azzal érvelnek, hogy Bayes-tétel formálisan optimális szabály arra vonatkozóan, hogy miként lehet felülvizsgálni a véleményeket az új adatok fényében.

Arra vagyunk kíváncsiak, hogy összehasonlítsuk a Bayes-tétel által meghatározott ideális viselkedést az emberek tényleges viselkedésével. Hogy némi fogalmat adjunk arról, hogy ez mit jelent, próbáljunk meg egy kísérletet Önnel, mint alanyal. Ez a táska 1000 póker zsetont tartalmaz. Két ilyen táskám van, az egyikben 700 piros és 300 blue chip van, a másikban 300 piros és 700 kék. Feldobtam egy érmét, hogy eldöntsem, melyiket használjam. Így, ha a véleményünk megegyezik, akkor az Ön jelenlegi valószínűsége, hogy több piros zsetont tartalmazó zacskót húz, 0,5. Most véletlenszerűen mintát vesz, minden token után visszatérve. 12 zsetonnal 8 pirosat és 4 kéket kapsz. Nos, mindazok alapján, amiket tud, mennyi a valószínűsége, hogy egy zacskó több pirosat tartalmaz? Nyilvánvaló, hogy magasabb, mint 0,5. Kérjük, ne folytassa az olvasást, amíg nem rögzítette értékelését.

Ha úgy nézel ki, mint egy tipikus alany, a pontszámod 0,7 és 0,8 közé esik. Ha azonban elvégeznénk a megfelelő számítást, akkor a válasz 0,97 lenne. Valójában nagyon ritka, hogy egy olyan személy, aki korábban nem mutatta be a konzervativizmus hatását, ilyen magas becsléssel álljon elő, még akkor is, ha ismerte Bayes tételét.

Ha a vörös chipek aránya a zacskóban az R, akkor a megszerzésének valószínűsége r piros chips és ( n-r) kék be n minták visszaküldéssel - p r (1–p)n-r. Így egy tipikus zacskó és pókerzseton kísérletben, ha HA azt jelenti, hogy a piros chipek aránya r AÉs HB azt jelenti, hogy a részesedés RB, akkor a valószínűségi arány:

Bayes képletének alkalmazásakor csak a tényleges megfigyelés valószínűségét kell figyelembe venni, nem pedig más megfigyelések valószínűségét, amelyeket esetleg végzett, de nem. Ennek az elvnek széles körű következményei vannak a Bayes-tétel minden statisztikai és nem statisztikai alkalmazására; a bayesi gondolkodás legfontosabb technikai eszköze.

Bayesi forradalom

Barátai és kollégái valamiről beszélnek, amit "Bayes-tételről" vagy "Bayes-szabályról" neveznek, vagy valamiről, amit Bayes-féle gondolkodásnak hívnak. Nagyon szeretik, ezért felmész az internetre, és találsz egy oldalt Bayes tételéről, és... Ez egy egyenlet. És ez minden... Miért vált ki egy matematikai fogalom ekkora lelkesedést a fejekben? Milyen "bayesi forradalom" zajlik a tudósok körében, és azt állítják, hogy még maga a kísérleti megközelítés is annak különleges eseteként írható le? Mi a titka, amit Bayes követői ismernek? Milyen fényt látnak?

A tudomány bayesi forradalma nem azért következett be, mert egyre több kognitív tudós kezdte észrevenni, hogy a mentális jelenségeknek bayesi szerkezetük van; nem azért, mert a tudósok minden területen elkezdték használni a Bayes-módszert; hanem azért, mert maga a tudomány Bayes tételének speciális esete; a kísérleti bizonyíték Bayes-féle bizonyíték. A bayesi forradalmárok azzal érvelnek, hogy amikor egy kísérletet végez, és olyan bizonyítékot kap, amely " alátámasztja" vagy "cáfolja" az elméletét, akkor a megerősítés vagy cáfolat a bayesi szabályok szerint történik. Például nemcsak azt kell figyelembe vennie, hogy elmélete megmagyarázhatja a jelenséget, hanem azt is, hogy más lehetséges magyarázatok is megjósolhatják ezt a jelenséget.

Korábban a legnépszerűbb tudományfilozófia a régi filozófia volt, amelyet a bayesi forradalom kiszorított. Karl Popper gondolata, hogy az elméleteket teljesen meg lehet hamisítani, de soha nem lehet teljesen megerősíteni, a bayesi szabályok másik speciális esete; ha p(X|A) ≈ 1 - ha az elmélet helyes előrejelzéseket ad, akkor ~X megfigyelése nagyon erősen meghamisítja A-t, másrészt, ha p(X|A) ≈ 1, és megfigyeljük X-et, akkor ez nem nagyon támogatják az elméletet; lehetséges más B feltétel is, úgy, hogy p(X|B) ≈ 1, és amely mellett X megfigyelése nem A-t, hanem B-t bizonyítja. Ahhoz, hogy X határozottan megerősítse A-t, nem kell tudnunk, hogy p( X|A) ≈ 1 és p(X|~A) ≈ 0, amit nem tudhatunk, mert nem tudunk minden lehetséges alternatív magyarázatot figyelembe venni. Például amikor Einstein általános relativitáselmélete felülmúlta Newton nagymértékben ellenőrizhető gravitációs elméletét, Newton elméletének összes előrejelzését Einstein sajátos esetévé tette.

Hasonlóképpen Popper azon állítása, miszerint egy eszmének meghamisíthatónak kell lennie, értelmezhető a valószínűség megőrzésére vonatkozó bayesi szabály megnyilvánulásaként; ha az X eredmény pozitív bizonyíték az elméletre, akkor az ~X eredménynek bizonyos mértékig meg kell hamisítania az elméletet. Ha az X-et és a ~X-et is úgy próbálod értelmezni, mint egy elmélet "támogatását", a Bayes-szabályok szerint ez lehetetlen! Egy elmélet valószínűségének növelése érdekében olyan teszteknek kell alávetni, amelyek potenciálisan csökkenthetik annak valószínűségét; ez nem csupán a sarlatánok tudományos felderítésének szabálya, hanem a Bayes-féle valószínűségi tétel következménye. Másrészt téves Popper azon elképzelése, hogy csak hamisításra van szükség, megerősítésre nincs szükség. Bayes tétele azt mutatja, hogy a hamisítás nagyon erős bizonyíték a megerősítéshez képest, de a hamisítás továbbra is valószínűségi jellegű; nem szabályozzák alapvetően más szabályok, és nem különbözik ebben a megerősítéstől, ahogy Popper állítja.

Így azt találjuk, hogy a kognitív tudományok számos jelensége, valamint a tudósok által használt statisztikai módszerek, plusz maga a tudományos módszer mind speciális esetei Bayes tételének. Erről szól a bayesi forradalom.

Üdvözöljük a Bayes-féle összeesküvésben!

A Bayes-féle valószínűségről szóló irodalom

2. Bayes számos különböző alkalmazását írja le a közgazdasági Nobel-díjas Kahneman (et al.) egy csodálatos könyvben. Csak ennek a nagy könyvnek az összefoglalójában 27 hivatkozást számoltam meg egy presbiteri lelkész nevére. Minimális képletek. (.. nagyon tetszett. Igaz, bonyolult, sok matematika (és hol nélküle), de külön fejezetek (pl. 4. fejezet Tájékoztató), egyértelműen a témáról. Tanácsolom mindenkinek. Még ha a matematika az nehéz számodra, olvasd végig a sort, kihagyod a matekot, és horgássz a hasznos gabonák után...

14. (2017. január 15-i kiegészítés), egy fejezet Tony Crilly könyvéből. 50 ötlet, amit tudnod kell. Matematika.

A Nobel-díjas fizikus, Richard Feynman, egy különösen egoista filozófusról beszélve, egyszer azt mondta: „Nem a filozófia mint tudomány irritál, hanem a körülötte teremtett pompa. Bárcsak a filozófusok tudnának magukon nevetni! Ha csak azt mondanák: "Azt mondom, hogy ez így van, de Von Leipzig másként gondolta, és ő is tud róla valamit." Ha eszébe jutna tisztázni, hogy ez csak az övék .

Szibériai Állami Távközlési és Informatikai Egyetem

Felső Matematika Tanszék

tudományág: "Valószínűségszámítás és matematikai statisztika"

"Teljes valószínűségi képlet és Bayes (Bayes) képlet és alkalmazásuk"

Elkészült:

Vezető: B. P. Zelentsov professzor

Novoszibirszk, 2010


Bevezetés 3

1. Teljes valószínűségi képlet 4-5

2. Bayes-képlet (Bayes) 5-6

3. Problémák a megoldásokkal 7-11

4. A Bayes-formula fő alkalmazási területei (Bayes) 11

12. következtetés

Irodalom 13


Bevezetés

A valószínűségszámítás a matematika egyik klasszikus ága. Hosszú története van. Ennek a tudományágnak az alapjait nagy matematikusok fektették le. Megnevezem például Fermat, Bernoullit, Pascalt.
Később sok tudós munkája meghatározta a valószínűségszámítás fejlődését.
Hazánk tudósai nagyban hozzájárultak a valószínűségelmélethez:
P. L. Csebisev, A. M. Ljapunov, A. A. Markov, A. N. Kolmogorov. A valószínűségi és statisztikai módszerek ma már mélyen beágyazódnak az alkalmazásokba. Használják a fizikában, a mérnöki tudományokban, a közgazdaságtanban, a biológiában és az orvostudományban. Szerepük különösen a számítástechnika fejlődése kapcsán nőtt meg.

Például fizikai jelenségek tanulmányozására megfigyeléseket vagy kísérleteket végeznek. Eredményeiket általában bizonyos megfigyelt mennyiségek értékeként rögzítik. A kísérletek megismétlésekor szóródást találunk az eredményeikben. Például, ha bizonyos feltételek (hőmérséklet, páratartalom stb.) betartása mellett ugyanazt a mennyiséget ismételjük meg ugyanazzal a készülékkel, akkor legalább kismértékben eltérő, de egymástól mégis eltérő eredményeket kapunk. Még többszöri mérés sem teszi lehetővé a következő mérés eredményének pontos előrejelzését. Ebben az értelemben a mérés eredményét véletlenszerű mennyiségnek mondjuk. A valószínűségi változó még világosabb példája a nyertes lottószelvény száma. Sok más példát is lehet adni a valószínűségi változókra. Ennek ellenére a balesetek világában fellelhetők bizonyos minták. Az ilyen törvényszerűségek tanulmányozására szolgáló matematikai apparátust a valószínűségelmélet adja.
Így a valószínűségelmélet véletlenszerű események és a hozzájuk kapcsolódó valószínűségi változók matematikai elemzésével foglalkozik.

1. Teljes valószínűségi képlet.

Legyen rendezvénycsoport H 1 ,H 2 ,..., H n, amely a következő tulajdonságokkal rendelkezik:

1) minden esemény páronként nem kompatibilis: Szia

Hj=Æ; én, j=1,2,...,n; én¹ j;

2) egyesülésük a W elemi eredmények terét alkotja:

.
8. ábra

Ebben az esetben azt fogjuk mondani H 1 , H 2 ,...,H n forma rendezvények teljes csoportja. Az ilyen eseményeket néha úgy hívják hipotéziseket.

Legyen DE- valami esemény: DEÌW (Venn diagram a 8. ábrán látható). Aztán van teljes valószínűségi képlet:

P(A) = P(A/H 1)P(H 1) + P(A/H 2)P(H 2) + ...+P(A/H n)P(H n) =

Bizonyíték. Magától értetődően: A=

, és minden esemény ( én = 1,2,...,n) páronként inkonzisztensek. Innen a valószínűségi összeadás tételével kapjuk

P(A) = P(

) + P( ) +...+ P(

Tekintettel arra, hogy a szorzási tétellel P(

) = P(A/Hén) P(Hén)( én= 1,2,...,n), akkor az utolsó képletből könnyen megkaphatjuk a fenti képletet a teljes valószínűségre.

Példa. Az üzlet három üzem által gyártott elektromos lámpákat árul, az első üzem részesedése 30%, a második 50%, a harmadik 20%. Termékeikben a házasság rendre 5%, 3% és 2%. Mennyi annak a valószínűsége, hogy az üzletben véletlenszerűen kiválasztott lámpa hibás?

Legyen az esemény H 1, hogy a kiválasztott lámpát az első gyárban gyártják, H 2 a másodikon H 3 - a harmadik üzemnél. Magától értetődően:

P(H 1) = 3/10, P(H 2) = 5/10, P(H 3) = 2/10.

Legyen az esemény DE abból áll, hogy a kiválasztott lámpa hibásnak bizonyult; A/H i olyan eseményt jelent, amely abból áll, hogy egy hibás lámpát választanak ki a gyártási helyen gyártott lámpák közül én gyár. A probléma állapotából ez következik:

P (A/ H 1) = 5/10; P(A/ H 2) = 3/10; P(A/ H 3) = 2/10

A teljes valószínűségi képlet szerint megkapjuk

2. Bayes-képlet (Bayes)

Legyen H 1 ,H 2 ,...,H n- teljes rendezvénycsoport és DEÌ W valami esemény. Majd a feltételes valószínűség képlete szerint

(1)

Itt P(Hk/A) az esemény feltételes valószínűsége (hipotézis) Hk vagy annak a valószínűsége Hk megvalósul, feltéve, hogy az esemény DE történt.

A valószínűségi szorzási tétel szerint az (1) képlet számlálója így ábrázolható

P = P = P(A/Hk)P(Hk)

Az (1) képlet nevezőjének ábrázolásához használhatjuk a teljes valószínűségi képletet

P(A)

Most az (1)-ből kaphatunk egy ún Bayes képlet:

A Bayes-képlet alapján kiszámítjuk a hipotézis megvalósulásának valószínűségét Hk feltéve, hogy az esemény DE történt. Bayes képletnek is nevezik hipotézis valószínűségi képlet. Valószínűség P(Hk) a hipotézis előzetes valószínűségének nevezzük Hk, és a valószínűség P(Hk/A) a posterior valószínűség.

Tétel. Egy hipotézis valószínűsége a tesztelés után egyenlő a tesztelés előtti hipotézis valószínűségének a teszt során bekövetkezett esemény megfelelő feltételes valószínűségével, osztva az esemény teljes valószínűségével.

Példa. Fontolja meg a fenti problémát az elektromos lámpákkal kapcsolatban, csak változtassa meg a probléma kérdését. Hagyja, hogy a vevő vásároljon elektromos lámpát ebben az üzletben, és kiderült, hogy hibás. Határozza meg annak valószínűségét, hogy ezt a lámpát a második gyárban gyártják. Érték P(H 2) = 0,5 ebben az esetben, ez annak az eseménynek a priori valószínűsége, hogy a megvásárolt lámpát a második gyárban gyártják. Miután megkaptuk az információt, hogy a vásárolt lámpa hibás, a lámpa második üzemben való gyártási lehetőségére vonatkozó becslésünket az esemény utólagos valószínűségének kiszámításával tudjuk korrigálni.

Írjuk fel erre az esetre a Bayes-képletet

Ebből a képletből a következőket kapjuk: P(H 2 /A) = 15/34. Amint látható, a megszerzett információk oda vezettek, hogy a számunkra érdekes esemény valószínűsége kisebb, mint az a priori valószínűség.

3. Problémák a megoldásokkal.

1. feladat. Három vállalkozástól érkezett új termék az üzletbe. Ezen termékek százalékos összetétele a következő: 20% - az első vállalkozás termékei, 30% - a második vállalkozás termékei, 50% - a harmadik vállalkozás termékei; továbbá az első vállalkozás termékeinek 10%-a a legmagasabb osztályú, a második vállalkozásnál - 5%, a harmadiknál ​​- a legmagasabb osztályú termékek 20%-a. Határozza meg annak valószínűségét, hogy egy véletlenszerűen vásárolt új termék a legjobb minőségű lesz.

Megoldás. Jelölje BAN BEN az az eset, amikor prémium terméket vásárolnak, keresztül

Jelöljük azokat az eseményeket, amelyek az első, a második és a harmadik vállalkozáshoz tartozó termékek vásárlásából állnak.

Alkalmazhatjuk a teljes valószínűségi képletet, és jelölésünkben:

Ha ezeket az értékeket behelyettesítjük a teljes valószínűségi képletbe, megkapjuk a szükséges valószínűséget:

2. feladat. A három lövész közül az egyiket a tűzvonalhoz hívják, és két lövést ad le. Annak valószínűsége, hogy az első lövöldözéssel eltalálja a célt, 0,3, a másodiknál ​​0,5; a harmadiknak - 0,8. A célt nem találják el. Határozza meg annak valószínűségét, hogy a lövéseket az első lövő adta le.

Lehet, hogy soha nem hallott Bayes tételéről, de mindig használta. Például eredetileg 50%-ra becsülte a fizetésemelés valószínűségét. Miután pozitív visszajelzést kapott a menedzsertől, jobbra módosította értékelését, és fordítva, csökkentette azt, ha munkahelyén eltörte a kávéfőzőt. Így finomodik a valószínűségi érték az információ halmozódása során.

Bayes tételének fő gondolata Az esemény valószínűségi becslésének pontosabb elérése további adatok figyelembevételével.

Az elv egyszerű: van egy kezdeti alapbecslés a valószínűségre vonatkozóan, amelyet további információkkal finomítanak.

Bayes képlet

Az intuitív cselekvéseket egy egyszerű, de hatékony egyenlet formalizálja ( Bayes valószínűségi képlet):

Az egyenlet bal oldala az A esemény valószínűségének utólagos becslése a B esemény bekövetkezésének feltétele mellett (úgynevezett feltételes valószínűség).

  • P(A)- az A esemény valószínűsége (alap, a priori becslés);
  • P(B|A) — annak a valószínűsége (szintén feltételes), hogy az adatainkból megkapjuk;
  • de P(B) egy normalizációs állandó, amely 1-re korlátozza a valószínűséget.

Ez a rövid egyenlet az alap Bayesi módszer.

Az A és B események absztrakt természete nem teszi lehetővé, hogy világosan megértsük ennek a képletnek a jelentését. Hogy megértsük Bayes tételének lényegét, vegyünk egy valós problémát.

Példa

Az egyik téma, amin dolgozom, az alvási szokások tanulmányozása. A Garmin Vivosmart órámmal két hónapnyi adatot rögzítettem, amely megmutatja, hogy mikor megyek elaludni és mikor kelek fel. Az utolsó modell látható legvalószínűbb Az alvás valószínűségi eloszlását az idő függvényében (MCMC egy közelítő módszer) az alábbiakban adjuk meg.

A grafikon csak az idő függvényében mutatja annak valószínűségét, hogy alszom. Hogyan fog változni, ha figyelembe vesszük, hogy mennyi ideig ég a lámpa a hálószobában? A becslés finomításához Bayes-tételre van szükség. A finomított becslés az a priori becslésen alapul, és a következő formájú:

A bal oldali kifejezés annak a valószínűsége, hogy alszom, mivel a hálószobámban a lámpa világít. A korábbi becslés egy adott időpontban (a fenti grafikonon látható) a következővel van jelölve P (alvás). Például 22:00-kor 27,34% az előzetes valószínűsége annak, hogy alszom.

Adjon hozzá további információkat a valószínűség segítségével P(hálószoba fény|alvás) a megfigyelt adatokból származik.

Saját megfigyeléseimből a következőket tudom: 1% annak a valószínűsége, hogy aludjak, ha ég a lámpa.

1-0,01 = 0,99 annak a valószínűsége, hogy a világítást alvás közben lekapcsolják (a képletben a "-" jel az ellenkező eseményt jelenti), mert az ellenkező események valószínűségeinek összege 1. Amikor alszom, a fény a hálószobában engedélyezve vagy letiltva.

Végül az egyenlet tartalmazza a normalizációs állandót is P (fény) annak a valószínűsége, hogy a lámpa világít. A lámpa akkor is ég, amikor alszom és amikor ébren vagyok. Ezért az alvás a priori valószínűségének ismeretében a következőképpen számítjuk ki a normalizációs állandót:

A lámpa bekapcsolásának valószínűségét mindkét lehetőség figyelembe veszi: vagy alszom, vagy nem ( P(-alvás) = 1 — P (alvás) annak a valószínűsége, hogy ébren vagyok.)

Annak a valószínűsége, hogy a lámpa ég, amikor ébren vagyok P(könnyű|-alvás),és a megfigyelés határozza meg. Tudom, hogy 80% esély van arra, hogy a lámpa világít, amikor ébren vagyok (azaz 20% az esélye annak, hogy nem ég, ha ébren vagyok).

A végső Bayes-egyenlet a következő:

Lehetővé teszi, hogy kiszámítsa annak valószínűségét, hogy alszom, mivel a lámpa világít. Ha arra vagyunk kíváncsiak, hogy mekkora a valószínűsége annak, hogy a lámpa nem világít, akkor minden konstrukcióra szükségünk van P(light|… kicserélve P(-light|….

Nézzük meg, hogyan használják a kapott szimbolikus egyenleteket a gyakorlatban.

Alkalmazzuk a képletet a 22:30 időre, és vegyük figyelembe, hogy világít a lámpa. Tudjuk, hogy 73,90% az esélye annak, hogy aludtam. Ez a szám az értékelésünk kiindulópontja.

Finomítsuk, figyelembe véve a világítással kapcsolatos információkat. Tudva, hogy a lámpa világít, behelyettesítjük a számokat Bayes képletébe:

A további adatok drámaian megváltoztatták a valószínűségi becslést, több mint 70%-ról 3,42%-ra. Ez mutatja Bayes tételének erejét: több információ felvételével finomítani tudtuk kezdeti helyzetértékelésünket. Lehet, hogy ezt korábban is intuitív módon megtettük, de most, ha formális egyenletekben gondolkodtunk, meg tudtuk erősíteni jóslatainkat.

Nézzünk még egy példát. Mi van, ha az óra 21:45-öt mutat és a lámpák ki vannak kapcsolva? Próbálja meg saját maga kiszámítani a valószínűséget, feltételezve, hogy az előzetes becslés 0,1206.

Ahelyett, hogy minden alkalommal manuálisan számoltam volna, egy egyszerű Python-kódot írtam a számításokhoz, amelyet a Jupyter Notebookban kipróbálhat. A következő választ fogod kapni:

Idő: 21:45:00 A lámpa ki van kapcsolva.

Az elalvás előzetes valószínűsége: 12,06%
Az elalvás frissített valószínűsége: 40,44%

A további információk ismét megváltoztatják becslésünket. Nos, ha a nővérem fel akar hívni 21:45-kor, tudván, hogy ég a lámpám, ennek az egyenletnek a segítségével megállapíthatja, hogy felvehetem-e a telefont (feltételezve, hogy csak ébren veszem fel)! Ki mondja, hogy a statisztikák nem alkalmazhatók a mindennapi életben?

Valószínűségi vizualizáció

A számítások megfigyelése hasznos, de a vizualizáció segít az eredmény mélyebb megértésében. Mindig igyekszem grafikonokat használni ötletek generálására, ha azok nem az egyenletek tanulmányozásából származnak. További adatok segítségével vizualizálhatjuk az alvás korábbi és utólagos valószínűségi eloszlását:

Ha világít a lámpa, a grafikon jobbra tolódik, jelezve, hogy kevésbé valószínű, hogy akkor alszom. Hasonlóképpen, a grafikon balra tolódik el, ha a lámpa ki van kapcsolva. Bayes-tétel jelentésének megértése nem könnyű, de ez az illusztráció világosan bemutatja, miért kell használni. A Bayes-képlet egy eszköz az előrejelzések további adatokkal történő finomításához.

Mi van, ha még több adat van?

Miért álljunk meg a hálószoba világításánál? Modellünkben még több adatot használhatunk fel a becslés további finomításához (amíg az adatok hasznosak maradnak a vizsgált eset szempontjából). Például tudom, hogy ha tölt a telefonom, akkor 95% esély van arra, hogy aludni fogok. Ezt a tényt modellünkben figyelembe vehetjük.

Tegyük fel, hogy annak a valószínűsége, hogy a telefonom töltődik, független a hálószoba világításától (az események függetlensége erős leegyszerűsítés, de nagyban megkönnyíti a feladatot). Készítsünk egy új, még pontosabb kifejezést a valószínűségre:

A kapott képlet nehézkesnek tűnik, de Python kóddal írhatunk egy függvényt, amely elvégzi a számítást. Bármilyen időpontban és a világítás/telefon töltés bármely kombinációja esetén ez a funkció azt a beállított valószínűséget adja vissza, hogy alszom.

Az idő 23:00:00 A lámpa világít A telefon NEM töltődik.

Az elalvás előzetes valószínűsége: 95,52%
Az elalvás frissített valószínűsége: 1,74%

23:00-kor további információ nélkül szinte biztosan kijelenthetnénk, hogy álmodom. Ha azonban további információink vannak arról, hogy a lámpa világít, és a telefon nem töltődik, arra a következtetésre jutunk, hogy annak valószínűsége, hogy alszom, gyakorlatilag nulla. Íme egy másik példa:

Az idő 22:15:00 A lámpa nem világít A telefon töltődik.

Az elalvás előzetes valószínűsége: 50,79%
Az elalvás frissített valószínűsége: 95,10%

A valószínűség az adott helyzettől függően lefelé vagy felfelé tolódik el. Ennek bemutatásához vegyen fontolóra négy további adatkonfigurációt, és azt, hogy ezek hogyan változtatják meg a valószínűségi eloszlást:

Ez a grafikon sok információval szolgál, de a lényeg az, hogy a valószínűségi görbe további tényezők függvényében változik. Ahogy több adatot adunk hozzá, pontosabb becslést kapunk.

Következtetés

Bayes tétele és más statisztikai fogalmak nehezen érthetőek lehetnek, ha absztrakt egyenletekkel ábrázolják őket, csak betűket vagy képzeletbeli helyzeteket használva. Az igazi tanulás akkor jön létre, ha absztrakt fogalmakat alkalmazunk valós problémákra.

Az adattudományban elért siker a folyamatos tanulásról, a készségkészlet új módszereinek kiegészítéséről és a problémák megoldásának legjobb módszerének megtalálásáról szól. Bayes tétele lehetővé teszi, hogy a valószínűségi becsléseinket további információkkal finomítsuk a valóság jobb modellezése érdekében. Az információ mennyiségének növelése pontosabb előrejelzéseket tesz lehetővé, a Bayes pedig hasznos eszköznek bizonyul ehhez a feladathoz.

Szívesen veszem a visszajelzéseket, vitákat és építő kritikákat. Felveheti velem a kapcsolatot a Twitteren.

Bayes képlet:

A H i hipotézisek P(H i) valószínűségeit a priori valószínűségeknek nevezzük – a kísérletek előtti valószínűségeknek.
A P(A/H i) valószínűségeket a posteriori valószínűségeknek nevezzük - a kísérlet eredményeként finomított H i hipotézisek valószínűségei.

1. példa. A készülék kiváló minőségű alkatrészekből és normál minőségű alkatrészekből is összeállítható. Az eszközök mintegy 40%-a kiváló minőségű alkatrészekből készül. Ha az eszközt jó minőségű alkatrészekből állítják össze, akkor a megbízhatósága (a hibamentes működés valószínűsége) t idő alatt 0,95; ha normál minőségű alkatrészekből - a megbízhatósága 0,7. A készüléket t időre tesztelték és hibátlanul működött. Határozza meg annak valószínűségét, hogy jó minőségű alkatrészekből állították össze.
Megoldás. Két hipotézis lehetséges: H 1 - a készüléket jó minőségű alkatrészekből állítják össze; H 2 - a készülék normál minőségű alkatrészekből van összeszerelve. E hipotézisek valószínűségei a kísérlet előtt: P(H 1) = 0,4, P(H 2) = 0,6. A kísérlet eredményeként az A eseményt figyelték meg - a készülék hibátlanul működött t ideig. Ennek az eseménynek a feltételes valószínűségei a H 1 és H 2 hipotézisek szerint: P(A|H 1) = 0,95; P(A|H2)=0,7. A (12) képlet segítségével megtaláljuk a H 1 hipotézis valószínűségét a kísérlet után:

2. példa. Két lövő egymástól függetlenül lő ugyanarra a célpontra, mindegyik egy lövést ad le. A cél eltalálásának valószínűsége az első lövésznél 0,8, a másodiknál ​​0,4. Lövés után egy lyukat találtak a célban. Feltételezve, hogy két lövő nem találja el ugyanazt a pontot, határozza meg annak valószínűségét, hogy az első lövő eltalálja a célt.
Megoldás. Legyen A esemény egy lyuk, amelyet a célban találtak a lövés után. A forgatás megkezdése előtt hipotézisek lehetségesek:
H 1 - sem az első, sem a második lövész nem talál, ennek a hipotézisnek a valószínűsége: P(H 1) = 0,2 0,6 = 0,12.
H 2 - mindkét lövő eltalál, P(H 2) = 0,8 0,4 = 0,32.
H 3 - az első lövöldöző eltalál, a második pedig nem, P(H 3) = 0,8 0,6 = 0,48.
H 4 - az első lövő nem talál, de a második eltalálja, P (H 4) = 0,2 0,4 = 0,08.
Az A esemény feltételes valószínűségei ezeknél a hipotéziseknél a következők:

A tapasztalatok után a H 1 és H 2 hipotézisek lehetetlenné válnak, a H 3 és H 4 hipotézisek valószínűségei
egyenlő lesz:


Tehát a legvalószínűbb, hogy a célt az első lövő találja el.

3. példa. Az összeszerelő műhelyben egy villanymotor csatlakozik a készülékhez. Az elektromos motorokat három gyártó szállítja. A nevezett üzemekből 19,6, illetve 11 db villanymotor található a raktárban, amelyek a szavatossági idő lejártáig 0,85, 0,76, illetve 0,71 valószínűséggel hiba nélkül működhetnek. A dolgozó véletlenszerűen vesz egy motort, és felszereli a készülékre. Határozza meg annak valószínűségét, hogy a felszerelt és a jótállási idő végéig hibátlanul működő villanymotort az első, második vagy harmadik gyártó szállította.
Megoldás. Az első teszt a villanymotor kiválasztása, a második a villanymotor működése a garanciális időszak alatt. Vegye figyelembe a következő eseményeket:
A - a villanymotor hibátlanul működik a jótállási idő végéig;
H 1 - a szerelő az első üzem termékeiből veszi a motort;
H 2 - a szerelő a motort a második üzem termékeiből veszi;
H 3 - a szerelő a harmadik üzem termékeiből veszi a motort.
Az A esemény valószínűségét a teljes valószínűségi képlettel számítjuk ki:

A feltételes valószínűségek a problémameghatározásban vannak megadva:

Keressük a valószínűségeket


A (12) Bayes-képletekkel kiszámítjuk a H i hipotézisek feltételes valószínűségeit:

4. példa. Annak valószínűsége, hogy a három elemből álló rendszer működése során az 1-es, 2-es és 3-as számú elemek meghibásodnak, 3: 2: 5 arányban állnak egymással. Ezen elemek hibáinak észlelési valószínűsége 0,95; 0,9 és 0,6.

b) A feladat feltételei között a rendszer működése során hiba történt. Melyik elem a legvalószínűbb, hogy meghibásodik?

Megoldás.
Legyen A kudarcos esemény. Vezessünk be egy hipotézisrendszert H1 - az első elem meghibásodása, H2 - a második elem meghibásodása, H3 - a harmadik elem meghibásodása.
Megtaláljuk a hipotézisek valószínűségét:
P(H1) = 3/(3+2+5) = 0,3
P(H2) = 2/(3+2+5) = 0,2
P(H3) = 5/(3+2+5) = 0,5

A probléma feltételének megfelelően az A esemény feltételes valószínűségei a következők:
P(A|H1) = 0,95, P(A|H2) = 0,9, P(A|H3) = 0,6

a) Határozza meg annak valószínűségét, hogy hiba észlelhető a rendszerben!
P(A) = P(H1)*P(A|H1) + P(H2)*P(A|H2) + P(H3)*P(A|H3) = 0,3*0,95 + 0,2*0,9 + 0,5 *0,6 = 0,765

b) A feladat feltételei között a rendszer működése során hiba történt. Melyik elem a legvalószínűbb, hogy meghibásodik?
P1 = P(H1)*P(A|H1)/ P(A) = 0,3*0,95 / 0,765 = 0,373
P2 = P(H2)*P(A|H2)/ P(A) = 0,2*0,9 / 0,765 = 0,235
P3 = P(H3)*P(A|H3)/ P(A) = 0,5*0,6 / 0,765 = 0,392

A harmadik elem maximális valószínűsége.

Bayes képlet

Bayes tétele- az elemi valószínűségszámítás egyik fő tétele, amely meghatározza egy esemény bekövetkezésének valószínűségét olyan körülmények között, amikor az eseményekről megfigyelések alapján csak részinformáció ismeretes. A Bayes-képlet szerint lehetséges a valószínűség pontosabb újraszámítása, figyelembe véve mind a korábban ismert információkat, mind az új megfigyelések adatait.

"Fizikai jelentés" és terminológia

Bayes képlete lehetővé teszi az ok és okozat átrendezését: egy esemény ismert ténye alapján számítsa ki annak valószínűségét, hogy azt egy adott ok okozta.

Az "okok" működését tükröző események ebben az esetben általában ún hipotéziseket, mert ők feltételezett az ahhoz vezető eseményeket. Egy hipotézis érvényességének feltétlen valószínűségét ún eleve(Mennyire valószínű az ok? egyáltalán), és feltételes - az esemény tényét figyelembe véve - a posteriori(Mennyire valószínű az ok? kiderült, hogy figyelembe veszi az esemény adatait).

Következmény

A Bayes-képlet fontos következménye egy esemény teljes valószínűségének képlete attól függően számos ellentmondó hipotézisek ( és csak tőlük!).

- az esemény bekövetkezésének valószínűsége B, számos hipotézistől függően A én ha ezeknek a hipotéziseknek a megbízhatósági foka ismert (például kísérletileg mérve);

Képlet levezetése

Ha egy esemény csak az okoktól függ A én, akkor ha megtörtént, az azt jelenti, hogy az okok egy része szükségszerűen megtörtént, pl.

Bayes képlet szerint

átruházás P(B) jobbra, megkapjuk a kívánt kifejezést.

Spam szűrési módszer

A Bayes-tételen alapuló módszert sikeresen alkalmazták a levélszemétszűrésben.

Leírás

A szűrő betanítása során minden betűben talált szó „súlya” kiszámításra és tárolásra kerül - annak a valószínűsége, hogy egy ilyen szót tartalmazó levél spam (a legegyszerűbb esetben a valószínűség klasszikus meghatározása szerint: „megjelenések a spamben / mindennek a látszata”).

Egy újonnan érkezett levél ellenőrzésekor a fenti képlet alapján számítják ki annak valószínűségét, hogy az spam. Ebben az esetben a "hipotézisek" szavak, és minden szónál "a hipotézis megbízhatósága" - a szó %-a a levélben, és "az esemény függése a hipotézistől". P(B | A én) - a szó korábban számított "súlya". Vagyis a betű "súlya" ebben az esetben nem más, mint minden szavának átlagos "súlya".

Egy levelet "spam" vagy "nem levélszemét" kategóriába sorolunk, ha a "súlya" meghaladja-e a felhasználó által beállított határértéket (általában 60-80%-ot vesznek el). A levélről szóló döntés meghozatala után a benne szereplő szavak „súlyozása” frissül az adatbázisban.

Jellegzetes

Ez a módszer egyszerű (az algoritmusok elemiek), kényelmes (lehetővé teszi a "fekete listák" és hasonló mesterséges trükkök nélkülözését), hatékony (a kellően nagy mintán történő edzés után a spam 95-97%-át levágja, ill. hiba esetén továbbtanítható). Általánosságban elmondható, hogy minden jel arra utal, hogy széles körben elterjedt, ami a gyakorlatban is megtörténik - szinte minden modern spamszűrő erre épül.

A módszernek azonban van egy alapvető hátránya is: az a feltételezés alapján, mit egyes szavak gyakoribbak a spamben, míg mások gyakrabban fordulnak elő a hagyományos e-mailekben, és nem hatékony, ha ez a feltevés hamis. A gyakorlat azonban azt mutatja, hogy még egy személy sem képes "szemmel" meghatározni az ilyen spamet - csak a levél elolvasása és jelentésének megértése után.

Egy másik, nem alapvető hátrány a megvalósítással kapcsolatban - a módszer csak szöveggel működik. Ennek a korlátozásnak a tudatában a spammerek rekláminformációkat kezdtek el a képbe helyezni, miközben a levél szövege vagy hiányzik, vagy nincs értelme. Ez ellen vagy szövegfelismerő eszközöket kell használni (egy "drága" eljárás, csak akkor használjuk, ha feltétlenül szükséges), vagy régi szűrési módszereket - "feketelistákat" és reguláris kifejezéseket (mivel az ilyen betűk gyakran sztereotip alakúak).

Lásd még

Megjegyzések

Linkek

Irodalom

  • Byrd Kiwi. Bayes tiszteletes tétele. // Computerra magazin, 2001. augusztus 24
  • Paul Graham. A spam terve. // Paul Graham személyes honlapja.

Wikimédia Alapítvány. 2010 .

Nézze meg, mi a "Bayes-képlet" más szótárakban:

    Egy képlet, amely így néz ki: ahol a1, A2, ..., An inkompatibilis események, Az F. alkalmazásának általános sémája in. pl.: ha a B esemény bekövetkezhet a dekomp. milyen feltételek mellett n hipotézis A1, A2, ..., An készül a kísérlet előtt ismert P (A1), ... valószínűséggel, ... ... Földtani Enciklopédia

    Lehetővé teszi egy érdekes esemény valószínűségének kiszámítását az esemény feltételes valószínűségein keresztül, bizonyos hipotéziseket feltételezve, valamint ezeknek a hipotéziseknek a valószínűségeit. Fogalmazás Legyen megadva egy valószínűségi tér, és egy teljes csoport párban ... ... Wikipédia

    Lehetővé teszi egy érdekes esemény valószínűségének kiszámítását az esemény feltételes valószínűségein keresztül, bizonyos hipotéziseket feltételezve, valamint ezeknek a hipotéziseknek a valószínűségeit. Fogalmazás Legyen megadva egy valószínűségi tér, és egy teljes eseménycsoport, például ... ... Wikipédia

    - (vagy Bayes képlete) a valószínűségszámítás egyik fő tétele, amely lehetővé teszi annak meghatározását, hogy egy esemény (hipotézis) mekkora valószínűséggel történt, csak közvetett bizonyítékok (adatok) jelenlétében, amelyek pontatlanok lehetnek ... Wikipédia

    Bayes tétele az elemi valószínűségszámítás egyik fő tétele, amely meghatározza egy esemény bekövetkezésének valószínűségét olyan körülmények között, amikor a megfigyelések alapján az eseményekről csak részinformáció ismeretes. A Bayes-képlet szerint... ... Wikipédia

    Bayes, Thomas Thomas Bayes tiszteletes Thomas Bayes Születési idő: 1702 (1702) Születési hely ... Wikipédia

    Thomas Bayes tiszteletes Thomas Bayes Születési idő: 1702 (1702) Születési hely: London ... Wikipédia

    A Bayes-következtetés a statisztikai következtetés egyik módszere, amelyben a Bayes-képletet a hipotézisek valósságának valószínűségi becsléseinek finomítására használják bizonyítékok megérkezésekor. A Bayes-frissítés használata különösen fontos a ... ... Wikipédiában

    Szeretné továbbfejleszteni ezt a cikket?: Keressen és biztosítson lábjegyzeteket a hiteles forrásokra való hivatkozásokhoz, amelyek megerősítik a leírtakat. Lábjegyzetek letételével pontosabban jelölje meg a forrásokat. Pere ... Wikipédia

    A foglyok elárulják-e egymást, saját önző érdekeiket követve, vagy hallgatnak, minimalizálva ezzel a teljes börtönbüntetést? Prisoner's dilemma (ang. Prisoner's dilemma, a "dilemma" elnevezés ritkábban használatos ... Wikipédia

Könyvek

  • Valószínűségszámítás és matematikai statisztika problémákban. Több mint 360 feladat és gyakorlat, Borzykh D.A. A javasolt kézikönyv különböző bonyolultságú feladatokat tartalmaz. A fő hangsúly azonban a közepes bonyolultságú feladatokon van. Ez szándékosan történik, hogy ösztönözze a diákokat, hogy…
Részvény