Reunajakauma

Kahden normaalisti jakautuneen satunnaismuuttujan yhteisjakauman (vihreä) reunajakaumien kuvaajat (punainen, sininen).

Reunajakauma on todennäköisyyslaskennassa usean satunnaismuuttujan todennäköisyysjakaumasta muodostettu rajoitettu jakauma, jossa varioi vain yksi satunnaismuuttuja, tai osa satunnaismuuttujista, ja samalla huomioidaan muiden satunnaismuuttujien yhteisvaikutus todennäköisyyteen.[1] Reunajakaumat ovat erityisen hyödyllisiä kaksiulotteisissa yhteisjakaumissa, jossa reunajakaumiin jää jäljelle vain toinen satunnaismuuttuja. Niillä yritetään pääasiassa helpottaa yhteisjakauman toiminnan ymmärtämistä, mikä toimii hyvin riippumattomien satunnaismuuttujien tapauksessa.

Kaksiulotteisen yhteisjakauman reunajakaumat

Todennäköisyysfunktioilla

Kaksiulotteinen yhteisjakauma muodostuu kahdesta satunnaismuuttujasta X {\displaystyle X} ja Y {\displaystyle Y} , jotka muodostavat järjestetyn parin ( X , Y ) . {\displaystyle (X,Y).} Diskreetin yhteisjakauman pistetodennäköisyysfunktion arvo annetuilla arvoilla ( x , y ) {\displaystyle (x,y)} merkitään

P ( X = x  ja  Y = y ) = f X Y ( x , y ) {\displaystyle P(X=x{\text{ ja }}Y=y)=f_{XY}(x,y)} [1][2]

ja jatkuvalla yhteisjakauman tiheysfunktiolla

f X Y ( x , y ) {\displaystyle f_{XY}(x,y)}

olevalla reaaliarvoisella lausekkeella.

Reunajakaumia on kaksi, koska yksi satunnaismuuttuja voidaan "jättää pois" kahdella eri tavalla. Diskreetillä satunnaismuuttujaparilla reunajakaumat muodostetaan ensimmäisen satunnaismuuttujan X {\displaystyle X} suhteen

f X ( x ) = P ( X = x ) = y Y f X Y ( x , y ) {\displaystyle f_{X}(x)=P(X=x)=\sum _{y\in Y}f_{XY}(x,y)} [1][2]

tai toisen satunnaismuuttujan Y {\displaystyle Y} suhteen

f Y ( y ) = P ( Y = y ) = x X f X Y ( x , y ) . {\displaystyle f_{Y}(y)=P(Y=y)=\sum _{x\in X}f_{XY}(x,y).} [1][2]

Jatkuvilla satunnaismuuttujaparilla muodostetaan vastaavasti

f X ( x ) = + f X Y ( x , y ) d y {\displaystyle f_{X}(x)=\int _{-\infty }^{+\infty }f_{XY}(x,y)dy} [1][2]

tai

f Y ( y ) = + f X Y ( x , y ) d x . {\displaystyle f_{Y}(y)=\int _{-\infty }^{+\infty }f_{XY}(x,y)dx.} [1][2]

Kertymäfunktioilla

Kaksiulotteinen yhteisjakauman ( X , Y ) {\displaystyle (X,Y)} kertymäfunktiot muodostetaan todennäköisyysfunktioista summan tai määrätyn integraalin avulla. Tässä esitetään ylhäältä rajoitettujen kertymäfunktioiden muodostustavat. Diskreetin satunnaismuuttujaparin yhteisjakauman kertymäfunktio arvojen ( x , y ) {\displaystyle (x,y)} alla merkitään ja lasketaan

P ( X x  ja  Y y ) = F X Y ( x , y ) = X x Y y f X Y ( x , y ) {\displaystyle P(X\leq x{\text{ ja }}Y\leq y)=F_{XY}(x,y)=\sum _{X\leq x}\sum _{Y\leq y}f_{XY}(x,y)} [1]

ja vastaavasti jatkuvan satunnaismuuttujaparin yhteisjakauman kertymäfunktio merkitään ja lasketaan

P ( X x  ja  Y y ) = F X Y ( x , y ) = x y f X Y ( x , y ) d y d x . {\displaystyle P(X\leq x{\text{ ja }}Y\leq y)=F_{XY}(x,y)=\int _{-\infty }^{x}\int _{-\infty }^{y}f_{XY}(x,y)dydx.} [1]

Näistä muodostetut reunajakaumien kertymäfunktiot ovat diskreettisillä satunnaismuuttujilla vastaavasti

P ( X x ) = F X ( x ) = X x y Y f X Y ( x , y ) {\displaystyle P(X\leq x)=F_{X}(x)=\sum _{X\leq x}\sum _{y\in Y}f_{XY}(x,y)} [1]

sekä

P ( Y y ) = F Y ( y ) = X x Y y f X Y ( x , y ) {\displaystyle P(Y\leq y)=F_{Y}(y)=\sum _{X\in x}\sum _{Y\leq y}f_{XY}(x,y)} [1]

ja jatkuvilla satunnaismuuttujilla

P ( X x ) = F X ( x ) = x + f X Y ( x , y ) d y d x {\displaystyle P(X\leq x)=F_{X}(x)=\int _{-\infty }^{x}\int _{-\infty }^{+\infty }f_{XY}(x,y)dydx} [1][3]

sekä

P ( Y y ) = F Y ( y ) = + y f X Y ( x , y ) d y d x . {\displaystyle P(Y\leq y)=F_{Y}(y)=\int _{-\infty }^{+\infty }\int _{-\infty }^{y}f_{XY}(x,y)dydx.} [1][3]

Esimerkki kahdella satunnaismuuttujalla

Kaksi diskreettiä satunnaismuuttujaa muodostavat yhteisjakauman f X Y ( x , y ) {\displaystyle f_{XY}(x,y)} . Satunnaismuuttujalla X {\displaystyle X} on vain neljä arvoa { x 1 , x 2 , x 3  ja  x 4 } , {\displaystyle \{x_{1},x_{2},x_{3}{\text{ ja }}x_{4}\},} joita ei mainita tässä. Vastaavasti satunnaismuuttujalla Y {\displaystyle Y} on myös neljä arvoa { y 1 , y 2 , y 3  ja  y 4 } . {\displaystyle \{y_{1},y_{2},y_{3}{\text{ ja }}y_{4}\}.} Jokaista arvoparia ( x i , y j ) {\displaystyle (x_{i},y_{j})} vastaa pistetodennäköisyys f X Y ( x i , y j ) , {\displaystyle f_{XY}(x_{i},y_{j}),} jollainen on esimerkiksi f X Y ( x 1 , y 4 ) = 8 32 . {\displaystyle f_{XY}(x_{1},y_{4})={\frac {8}{32}}.} Kaikki todennäköisyydet on esitetty oheisessa taulukossa.

fxy(x,y) x1 x2 x3 x4 fy(y)↓
y1 432 232 132 132 832
y2 232 432 132 132 832
y3 232 232 232 232 832
y4 832 0 0 0 832
fx(x) → 1632 832 432 432 3232
Yhteis- ja reunajakaumat järjestetylle diskreetille satunnais- muuttujaparille. Yhteisjakauman pistetodennäköisyydet sijaitsevat keskustan 4×4-alueella, ja reunajakaumien todennäköisyydet sijaitsevat alimmalla vaakarivillä ja oikeanpuoleisessa pystysarakkeessa.

Yhteisjakaumalla f X Y ( x , y ) {\displaystyle f_{XY}(x,y)} on kaksi reunajakaumaa f X ( x ) {\displaystyle f_{X}(x)} ja f Y ( y ) {\displaystyle f_{Y}(y)} . Reunajakaumat muodostetaan laskemalla kullekin satunnaismuuttujan arvoille yhteistodennäköisyydet. Esimerkiksi f X ( x 2 ) {\displaystyle f_{X}(x_{2})} lasketaan

f X ( x 2 ) = f X Y ( x 2 , y 1 ) + f X Y ( x 2 , y 2 ) + f X Y ( x 2 , y 3 ) + f X Y ( x 2 , y 4 ) = 2 32 + 4 32 + 2 32 + 0 = 8 32 , {\displaystyle f_{X}(x_{2})=f_{XY}(x_{2},y_{1})+f_{XY}(x_{2},y_{2})+f_{XY}(x_{2},y_{3})+f_{XY}(x_{2},y_{4})={\frac {2}{32}}+{\frac {4}{32}}+{\frac {2}{32}}+0={\frac {8}{32}},}

ja se on sijoitettu taulukkoon satunnaismuuttujan X {\displaystyle X} reunajakauman omalle riville alareunaan. Oikeassa pystysarakkeessa sijaitsevat satunnaismuuttujan Y {\displaystyle Y} reunajakauman todennäköisyydet.[1]

Moniulotteiset reunajakaumat

Kolmiulotteiset yhteisjakaumien todennäköisyysfunktiot satunnaismuuttujille X {\displaystyle X} , Y {\displaystyle Y} ja Z {\displaystyle Z} ovat muotoa f X Y Z ( x , y , z ) {\displaystyle f_{XYZ}(x,y,z)} ja kertymäfunktioille F X Y Z ( x , y , z ) . {\displaystyle F_{XYZ}(x,y,z).} Näiden reunajakaumia voidaan muodostaa "jättämällä pois" kaksi satunnaismuuttujaa laskemalla niiden vaikutukset todennäköisyyksiin mukaan jäljelle jäävän satunnaismuuttujan vaihteluihin. Silloin saadaan kolme reunajakaumaa: f X ( x ) {\displaystyle f_{X}(x)} , f Y ( y ) {\displaystyle f_{Y}(y)} ja f Z ( z ) . {\displaystyle f_{Z}(z).}

Näiden lisäksi voidaan muodostaa vielä kolme reunajakaumaa "jättämällä pois" vain yksi satunnaismuuttuja. Näin muodostettujen reunajakaumien todennäköisyysfunktiot olisivat f X Y ( x , y ) {\displaystyle f_{XY}(x,y)} , f Y Z ( y , z ) {\displaystyle f_{YZ}(y,z)} ja f X Z ( x , z ) . {\displaystyle f_{XZ}(x,z).}

Kun todennäköisyysjakaumien ulottuvuudet kasvavat, lisääntyvät myös eri mahdollisten reunajakaumien lukumäärät.

Lähteet

  1. a b c d e f g h i j k l m Mellin, Ilkka: Moniulotteiset satunnaismuuttujat ja jakaumat, s.187−202, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007
  2. a b c d e Luentomoniste: Joint, marginal, and conditional distributions (Arkistoitu – Internet Archive), kurrsilta Fundamental Principles of Actuarial Science (Arkistoitu – Internet Archive), Toronton Yliopisto
  3. a b Weisstein, Eric W.: Joint Distribution Function (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)