Peremeloszlás

A valószínűségszámításban és statisztikában a peremeloszlások több valószínűségi változó közös eloszlásának, illetve valószínűségi vektorváltozók eloszlásának jellemzői. Jellemzőjük, hogy csak néhány valószínűségi változót, illetve koordinátáját veszi tekintetbe. Például, ha X {\displaystyle X} és Y {\displaystyle Y} közös eloszlásáról van szó, X {\displaystyle X} és Y {\displaystyle Y} eloszlása ennek peremeloszlásai.

Megkülönböztetik diszkrét és folytonos valószínűségi változók peremeloszlásait:

  • Diszkrét peremeloszlások
  • Folytonos peremeloszlások

Peremeloszlásokat lehet abszolút illetve relatív gyakoriságokra is képezni. A peremeloszlás gyakoriságai a peremgyakoriságok. Kategorikus változók esetén a kontingenciatábla pereméről olvashatók le.

Példa

A diszkrét jellemzők peremeloszlása kontingenciatáblával mutatható be. A tábla szélén sorok, oszlopok összegeként olvashatók le a peremeloszlások.

Példaként bemutatunk egy abszolút gyakoriságokat tartalmazó kontingenciatáblát. Relatív gyakoriságokat is lehetne használni.

Fiú Lány Peremgyakoriságok
10. osztály 10 10 20
11. osztály 4 16 20
Peremgyakoriságok 14 26 40

A 10. osztályban a peremgyakoriságok a tanulók nemének elhanyagolásával 20. Ugyanez az eredmény a 11. osztályban, így mivel nincs több vizsgált osztály, a peremeloszlás egyenletes. Az osztályok különböző jellemzőként megmaradnak.

Vannak azonban folytonos jellemzők, melyeket nem lehet kontingenciatáblába rendezni. Ilyennek tekinthető például a testmagasság. Itt minden határ önkényes, és különféle határok meghúzása más-más eredményt adhat.[1] A kategóriákat úgy alakítják, hogy diszjunktak legyenek. Ha a kategóriák szűkek, akkor lehet, hogy túl kevesen esnek egy kategóriába, illetve a kontingenciatábla túl nagy, áttekinthetetlen lesz. Nem javasolják a természetszerűleg folytonos valószínűségi változók diszkretizálását.

Definíció

Adva legyen egy Z = ( X 1 , , X n ) {\displaystyle Z=(X_{1},\dotsc ,X_{n})} valószínűségi vektorváltozó, és eloszlása P Z {\displaystyle P_{Z}} mint valószínűségi mérték. Ekkor a

P X i ( A ) := P Z ( Ω 1 × × Ω i 1 × A × Ω i + 1 × × Ω n ) {\displaystyle P_{X_{i}}(A):=P_{Z}(\Omega _{1}\times \dotsb \times \Omega _{i-1}\times A\times \Omega _{i+1}\times \dotsb \times \Omega _{n})}

eloszlás Z {\displaystyle Z} i-edik peremeloszlása. Alternatívan, úgy is definiálható, mint

P X i ( A ) = P ( X 1 Ω 1 , , X i 1 Ω i 1 , X i A , X i + 1 Ω i + 1 , , X n Ω n ) {\displaystyle P_{X_{i}}(A)=P(X_{1}\in \Omega _{1},\dotsc ,X_{i-1}\in \Omega _{i-1},X_{i}\in A,X_{i+1}\in \Omega _{i+1},\dotsc ,X_{n}\in \Omega _{n})} .

Kétdimenziós esetben, ha Z = ( X , Y ) {\displaystyle Z=(X,Y)} , akkor az első peremeloszlás

P X ( A ) = P Z ( A × Ω 2 )  illetve  P X ( A ) = P ( X A , Y Ω 2 ) {\displaystyle P_{X}(A)=P_{Z}(A\times \Omega _{2}){\text{ illetve }}P_{X}(A)=P(X\in A,Y\in \Omega _{2})} .

Peremeloszlás definiálható minden J I = { 1 , , n } {\displaystyle J\subset I=\{1,\dotsc ,n\}} indexhalmazra. Ha | J | = m {\displaystyle |J|=m} , akkor ezek m dimenziós peremeloszlások. Ezek definiálhatók, mint

P X J ( A ) = { P ( X i A i ) ha  i J X i Ω i egyébként  {\displaystyle P_{X_{J}}(A)\;=\;{\begin{cases}P(X_{i}\in A_{i})&{\mbox{ha }}i\in J\\X_{i}\in \Omega _{i}&{\mbox{egyébként }}\end{cases}}}

ahol A = i J A i {\displaystyle A=\prod _{i\in J}A_{i}} .

Elemi tulajdonságok

  • Pontosan ( n m ) {\displaystyle {\tbinom {n}{m}}} számú m dimenziós peremeloszlás létezik.
  • Mértékelméleti szempontból a peremeloszlások a többdimenziós mérték vetülete egy vagy több dimenzióra.
  • Ha az összes X i {\displaystyle X_{i}} valószínűségi változó független, akkor a valószínűségi vektorváltozó eloszlása az egydimenziós peremeloszlások szorzata.

Származtatott fogalmak

Peremeloszlásfüggvények

Ha a Z {\displaystyle Z} valószínűségi vektorváltozó eloszlásfüggvénye F Z : R n [ 0 , 1 ] {\displaystyle F_{Z}\colon \mathbb {R} ^{n}\to [0,1]} , akkor egy peremeloszlásfüggvény a megfelelő peremeloszlás eloszlásfüggvénye. Egydimenziós esetben

F X i ( x i ) = F Z ( , , , x i , , , ) {\displaystyle F_{X_{i}}(x_{i})=F_{Z}(\infty ,\dotsc ,\infty ,x_{i},\infty ,\dotsc ,\infty )} .

Az i-edik kivételével mindegyiket végtelennel helyettesítik. Hasonlóan megy más dimenziókban is, a J {\displaystyle J} -ben adott dimenziókat megtartják, a többit végtelennel helyettesítik. Kétdimenziós esetben, ha Z = ( X , Y ) {\displaystyle Z=(X,Y)} , akkor az első peremeloszlásfüggvény

F X ( x ) = F Z ( x , ) {\displaystyle F_{X}(x)=F_{Z}(x,\infty )} .

Peremsűrűség

Az előzőhöz hasonlóan definiálhatók a peremsűrűségek. Ezek azok az f X i {\displaystyle f_{X_{i}}} függvények, melyekre

F X i ( x i ) = x i f X i ( t )   d t {\displaystyle F_{X_{i}}(x_{i})=\int _{-\infty }^{x_{i}}f_{X_{i}}(t)\ \mathrm {d} t}

Ha a Z {\displaystyle Z} valószínűségi vektorváltozó sűrűségfüggvénye f Z ( x 1 , , x n ) {\displaystyle f_{Z}(x_{1},\dotsc ,x_{n})} , akkor a peremsűrűségfüggvények definiálhatók, mint

f X i ( x i ) := f Z ( x 1 , , x i 1 , x i , x i + 1 , , x n )   d x 1 d x i 1 d x i + 1 d x n {\displaystyle f_{X_{i}}(x_{i}):=\int _{-\infty }^{\infty }\dotsi \int _{-\infty }^{\infty }\int _{-\infty }^{\infty }\dotsi \int _{-\infty }^{\infty }f_{Z}(x_{1},\dotsc ,x_{i-1},x_{i},x_{i+1},\dotsc ,x_{n})\ \mathrm {d} x_{1}\dotsm \mathrm {d} x_{i-1}\mathrm {d} x_{i+1}\dotsm \mathrm {d} x_{n}} .

Az m-dimenziós esetben azokon a koordinátákon kell integrálni, amelyek nem tartoznak J {\displaystyle J} -be. Ha Z = ( X , Y ) {\displaystyle Z=(X,Y)} , akkor a peremsűrűségek

f X ( x ) = f Z ( x , y )   d y {\displaystyle f_{X}(x)=\int _{-\infty }^{\infty }f_{Z}(x,y)\ \mathrm {d} y}
f Y ( y ) = f Z ( x , y )   d x {\displaystyle f_{Y}(y)=\int _{-\infty }^{\infty }f_{Z}(x,y)\ \mathrm {d} x}

Perem-valószínűségi tömegfüggvény

A sűrűségfüggvényekhez hasonlóan definiálhatók és számíthatók, de itt az integrált összegzés helyettesíti. Ha a Z {\displaystyle Z} valószínűségi tömegfüggvénye f Z ( x 1 , , x n ) {\displaystyle f_{Z}(x_{1},\dotsc ,x_{n})} , akkor az i-edik perem-valószínűségi tömegfüggvény

f X i ( x i ) = j i x j Z f Z ( x 1 , , x n ) {\displaystyle f_{X_{i}}(x_{i})=\sum _{j\neq i \atop x_{j}\in \mathbb {Z} }f_{Z}(x_{1},\dotsc ,x_{n})} .

Hasonlóan definiálható a többdimenziós eset, azokat a koordinátákat kell összegezni, amelyek nem tartoznak J {\displaystyle J} -be. Kétdimenziós esetben, ha Z = ( X , Y ) {\displaystyle Z=(X,Y)} , akkor

f X ( x i ) = k K f Z ( x i , y k ) {\displaystyle f_{X}(x_{i})=\sum _{k\in K}f_{Z}(x_{i},y_{k})}
f Y ( y k ) = i I f Z ( x i , y k ) {\displaystyle f_{Y}(y_{k})=\sum _{i\in I}f_{Z}(x_{i},y_{k})} .

Példa

Legyen Z = ( X , Y ) {\displaystyle Z=(X,Y)} kétdimenziós multinomiális eloszlású, tehát Z M ( n , ( p , 1 p ) ) {\displaystyle Z\sim M(n,(p,1-p))} . Ekkor Z {\displaystyle Z} valószínűségi tömegfüggvénye

f Z ( x , y ) = { ( n x , y ) p x ( 1 p ) y ha  x + y = n 0 különben {\displaystyle f_{Z}(x,y)\;=\;{\begin{cases}{n \choose x,y}\;p^{x}(1-p)^{y}&{\mbox{ha }}x+y=n\\0&{\mbox{különben}}\end{cases}}} ,

ahol ( n x , y ) {\displaystyle {n \choose x,y}} multinomiális együttható. Az y = n x {\displaystyle y=n-x} helyettesítéssel

f Z ( x , y ) = ( n x ) p x ( 1 p ) n x {\displaystyle f_{Z}(x,y)={n \choose x}p^{x}(1-p)^{n-x}} .

A valószínűségi tömegfüggvény y {\displaystyle y} -tól függetlenül is ábrázolható. Így X {\displaystyle X} peremsűrűsége, amit minden y {\displaystyle y} -ra összegezve kaphatunk, újra Z {\displaystyle Z} valószínűségi tömegfüggvényét adja, csak y {\displaystyle y} mint változó nélkül. Tehát az

f X ( x ) = ( n x ) p x ( 1 p ) n x {\displaystyle f_{X}(x)={n \choose x}p^{x}(1-p)^{n-x}}

perem-valószínűségi tömegfüggvény binomiális eloszlású az p {\displaystyle p} és n {\displaystyle n} paraméterekkel.

Legyen most Z = ( X 1 , , X m ) {\displaystyle Z=(X_{1},\dotsc ,X_{m})} m {\displaystyle m} dimenziós multinomiális eloszlású, tehát Z M ( n , ( p 1 , , p m ) ) {\displaystyle Z\sim M(n,(p_{1},\dotsc ,p_{m}))} , ahol p 1 + + p m = 1 {\displaystyle p_{1}+\dotsb +p_{m}=1} . Ekkor a valószínűségi tömegfüggvény

f Z ( x 1 , , x m ) = { ( n x 1 , , x m ) p 1 x 1 p k x m ha  x 1 , , x k N 0  és  x 1 + + x m = n 0 különben {\displaystyle f_{Z}(x_{1},\dotsc ,x_{m})\;=\;{\begin{cases}{n \choose x_{1},\dotsc ,x_{m}}\;p_{1}^{x_{1}}\dotsm p_{k}^{x_{m}}&{\mbox{ha }}x_{1},\dotsc ,x_{k}\in \mathbb {N} _{0}{\mbox{ és }}x_{1}+\dotsb +x_{m}=n\\0&{\mbox{különben}}\end{cases}}} .

Az első peremeloszlás számításához az x 2 , x 3 , , x m {\displaystyle x_{2},x_{3},\dotsc ,x_{m}} változók szerint kell összegezni. A számítás egyszerűsítéséhez elvégezzük az p 2 + + p m = 1 p 1 {\displaystyle p_{2}+\dotsb +p_{m}=1-p_{1}} és x 1 = n ( x 2 + + x 3 ) {\displaystyle x_{1}=n-(x_{2}+\dotsb +x_{3})} csoportosításokat. A multinomiális tétellel következik, hogy a peremeloszlás binomiális lesz, az n {\displaystyle n} és p 1 {\displaystyle p_{1}} paraméterekkel.

Kapcsolódó fogalmak

Ahhoz, hogy jellemezzenek egy többdimenziós eloszlást, nemcsak a peremeloszlást és a korrelációt kell tekintetbe venni, hanem az összefüggést más adatokkal is pontosabban kell jellemezni. A korreláció csak a lineáris függést jellemzi, emiatt használnak kopulákat és rangkorrelációkat, amelyek minden párt külön jellemeznek.

Előzetes tudás birtokában a feltételes eloszlás is meghatározható a peremeloszlások felhasználásával.

Források

  1. P. Heinz Müller (Hrsg.): Wahrscheinlichkeitsrechnung und mathematische Statistik. Lexikon der Stochastik. Akademie-Verlag, Berlin 1980, S. 116 und S. 124.
  • I. N. Bronstein: Taschenbuch der Mathematik. Verlag Harri Deutsch ISBN 3-8171-2006-0.
  • Norbert Henze: Stochastik für Einsteiger: Eine Einführung in die faszinierende Welt des Zufalls. Vieweg+Teubner Verlag 2010, ISBN 978-3-8348-0815-8, doi:10.1007/978-3-8348-9351-2.
  • Christian Hesse. Angewandte Wahrscheinlichkeitstheorie, 1., Wiesbaden: Vieweg (2003). ISBN 3-528-03183-2 

Fordítás

Ez a szócikk részben vagy egészben a Randverteilung című német Wikipédia-szócikk fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.