Rozptyl (statistika)

Rozptyl (též střední kvadratická odchylka, střední kvadratická fluktuace, variance nebo také disperze) se používá v teorii pravděpodobnosti a statistice. Je to druhý centrální moment náhodné veličiny.[1] Jedná se o charakteristiku variability rozdělení pravděpodobnosti náhodné veličiny, která vyjadřuje variabilitu rozdělení souboru náhodných hodnot kolem její střední hodnoty.

Rozptyl náhodné veličiny X {\displaystyle X} se označuje σ 2 ( X ) {\displaystyle \sigma ^{2}(X)} , S 2 ( X ) {\displaystyle S^{2}(X)} , D ( X ) {\displaystyle D(X)} nebo var ( X ) {\displaystyle \operatorname {var} (X)} .

Definice

Rozptyl je definován jako střední hodnota kvadrátů odchylek od střední hodnoty. Odchylku od střední hodnoty, která má rozměr stejný jako náhodná veličina, zachycuje směrodatná odchylka σ {\displaystyle \sigma } .

Pro diskrétní náhodnou veličinu je definován následujícím vztahem

σ 2 = i = 1 n [ x i E ( X ) ] 2 p i {\displaystyle \sigma ^{2}=\sum _{i=1}^{n}{\left[x_{i}-\operatorname {E} (X)\right]}^{2}p_{i}} ,

kde x i {\displaystyle x_{i}} jsou hodnoty, kterých může náhodná veličina X {\displaystyle X} nabývat (s pravděpodobnostmi p i {\displaystyle p_{i}} ) a E ( X ) {\displaystyle \operatorname {E} (X)} je střední hodnota veličiny X {\displaystyle X} .

Je-li pravděpodobnost všech diskrétních hodnot stejná, pak se předchozí vztah zjednoduší na

σ 2 = 1 n i = 1 n [ x i E ( X ) ] 2 {\displaystyle \sigma ^{2}={\frac {1}{n}}\sum _{i=1}^{n}{\left[x_{i}-\operatorname {E} (X)\right]}^{2}}

kde n je počet prvků souboru.

Pro spojitou náhodnou veličinu je rozptyl definován vztahem

σ 2 = [ x E ( X ) ] 2 p ( x ) d x = x 2 p ( x ) d x [ E ( X ) ] 2 {\displaystyle \sigma ^{2}=\int _{-\infty }^{\infty }{\left[x-\operatorname {E} (X)\right]}^{2}p(x)\,\mathrm {d} x=\int _{-\infty }^{\infty }x^{2}p(x)\,\mathrm {d} x-{[\operatorname {E} (X)]}^{2}} ,

kde p ( x ) {\displaystyle p(x)} je hustota pravděpodobnosti veličiny X {\displaystyle X} .

Vlastnosti

Pro rozptyl součinu náhodné veličiny X {\displaystyle X} a konstanty a {\displaystyle a} platí

σ 2 ( a X ) = a 2 σ 2 ( X ) {\displaystyle \sigma ^{2}(aX)=a^{2}\sigma ^{2}(X)\,}

Rozptyl náhodné veličiny je invariantní vůči posunu b {\displaystyle b} , tedy

σ 2 ( a X + b ) = a 2 σ 2 ( X ) {\displaystyle \sigma ^{2}(aX+b)=a^{2}\sigma ^{2}(X)\,}

Rozptyl součtu i rozdílu náhodných veličin X , Y {\displaystyle X,Y} je roven

σ 2 ( X ± Y ) = σ 2 ( X ) + σ 2 ( Y ) ± 2 Cov ( X , Y ) {\displaystyle \sigma ^{2}(X\pm Y)=\sigma ^{2}(X)+\sigma ^{2}(Y)\pm 2\operatorname {Cov} (X,Y)}
σ 2 ( a X ± b Y ) = a 2 σ 2 ( X ) + b 2 σ 2 ( Y ) ± 2 a b Cov ( X , Y ) {\displaystyle \sigma ^{2}(aX\pm bY)=a^{2}\sigma ^{2}(X)+b^{2}\sigma ^{2}(Y)\pm 2ab\operatorname {Cov} (X,Y)} ,

kde Cov ( X , Y ) {\displaystyle \operatorname {Cov} (X,Y)} značí kovarianci veličin X {\displaystyle X} a Y {\displaystyle Y} .

Pokud jsou náhodné veličiny nezávislé, jejich kovariance je nulová, a tedy rozptyl součtu (rozdílu) je roven součtu rozptylů jednotlivých náhodných veličin.

Obdobná tvrzení platí také pro rozptyl součtu většího počtu náhodných veličin.

Pro výpočet rozptylu se často používá následující vztah

σ 2 ( X ) = E ( X 2 ) [ E ( X ) ] 2 {\displaystyle \sigma ^{2}(X)=\operatorname {E} (X^{2})-{[\operatorname {E} (X)]}^{2}}

Příklad u kostky

Mějme kostku a náhodnou veličinu X {\displaystyle X} , která přiřadí každému z šesti možných jevů takové číslo, kolik puntíků je v daném jevu na horní straně kostky (čísla 1 až 6). Máme 6 jevů s pravděpodobností 1 6 {\displaystyle {\frac {1}{6}}} a střední hodnota (průměr) je 3,5. Kvadrát rozptylu veličiny X {\displaystyle X} lze pak podle vztahů výše vypočítat jako

σ 2 ( X ) = 1 6 i = 1 6 ( x i 3 , 5 ) 2 = 1 6 ( ( 1 3 , 5 ) 2 + ( 2 3 , 5 ) 2 + ( 3 3 , 5 ) 2 + ( 4 3 , 5 ) 2 + ( 5 3 , 5 ) 2 + ( 6 3 , 5 ) 2 ) = 17 , 5 6 2 , 92 {\displaystyle \sigma ^{2}(X)={\frac {1}{6}}\sum _{i=1}^{6}(x_{i}-3,5)^{2}={\frac {1}{6}}({(1-3,5)}^{2}+{(2-3,5)}^{2}+{(3-3,5)}^{2}+{(4-3,5)}^{2}+{(5-3,5)}^{2}+{(6-3,5)}^{2})={\frac {17,5}{6}}\doteq 2,92}

Variance (volatilita) u hazardních her

U hazardních her je variance čili volatilita mírou rozptylu dosahovaných výher. U her s nízkou variancí se vyskytují se menší, ale časté výhry, rozpočet hráče se obvykle mění celkem rovnoměrně. Naopak hráč hry s vysokou variancí většinou prohrává, ale pokud přijde výhra, bude vysoká. Ve hře s vysokou variancí tak lze vyhrát uspokojivou částku již v jednom kole, ale zároveň většina hráčů svůj počáteční kapitál prohraje rychleji, po menším počtu kol. Například varianci výherních automatů výrobci klasifikují slovy nízká, střední nebo vysoká.

Reference

  1. OTIPKA, Petr; ŠMAJSTRLA, Vladislav. PRAVDĚPODOBNOST A STATISTIKA [online]. Ostrava: Vysoká škola báňská - Technická univerzita Ostrava, rev. 2013-11-14 [cit. 2016-05-31]. Kapitola Náhodná veličina. Dostupné v archivu pořízeném dne 2016-06-10. 

Související články

Externí odkazy

Pahýl
Pahýl
Tento článek je příliš stručný nebo postrádá důležité informace.
Pomozte Wikipedii tím, že jej vhodně rozšíříte. Nevkládejte však bez oprávnění cizí texty.
Autoritní data Editovat na Wikidatech