Statystyka (funkcja)

Statystyka, statystyka z próby to – w najprostszym ujęciu – liczbowa charakterystyka próby losowej[1]. Ponieważ próba jest losowa, statystyka, jako funkcja próby, jest zmienną losową[2]. Przykładami statystyk są: średnia z próby, odchylenie standardowe i wariancja z próby, a także statystyki testowe, takie jak statystyka t lub statystyka chi-kwadrat.

Statystyki są często estymatorami parametrów rozkładu zmiennej losowej w populacji generalnej.

Definicja formalna

Niech ( Ω , F , P ) {\displaystyle (\Omega ,{\mathcal {F}},{\mathcal {P}})} będzie przestrzenią statystyczną, gdzie

P = { P θ : θ Θ } {\displaystyle {\mathcal {P}}=\{P_{\theta }\colon \theta \in \Theta \}}

jest rodziną miar probabilistycznych określonych na σ-ciele F {\displaystyle {\mathcal {F}}} podzbiorów zbioru Ω , {\displaystyle \Omega ,} indeksowaną parametrem θ . {\displaystyle \theta .} Niech dalej ( X , C ) {\displaystyle ({\mathcal {X}},{\mathcal {C}})} będzie przestrzenią mierzalną. Funkcję mierzalną T : Ω X {\displaystyle T\colon \Omega \to {\mathcal {X}}} nazywamy statystyką. Zbiór Ω {\displaystyle \Omega } jest nazywany przestrzenią prób.

Własności

  • Jeśli X = R {\displaystyle {\mathcal {X}}=\mathbb {R} } to statystykę T {\displaystyle T} nazywamy statystyką o wartościach rzeczywistych.
  • Jeśli X = R n {\displaystyle {\mathcal {X}}=\mathbb {R} ^{n}} to statystykę T {\displaystyle T} nazywamy statystyką o wartościach wektorowych.

Statystyka swobodna

Statystyka T : Ω R {\displaystyle T\colon \Omega \to \mathbb {R} } jest statystyką swobodną ze względu na wartość oczekiwaną, gdy E P θ ( T ) {\displaystyle E_{P_{\theta }}(T)} istnieje i nie zależy od θ . {\displaystyle \theta .} Wspólną dla θ Θ {\displaystyle \theta \in \Theta } wartość oczekiwaną oznaczamy E ( T ) {\displaystyle E(T)} i nazywamy wartością oczekiwaną statystyki T . {\displaystyle T.}

Statystyka dostateczna

Definicja i własności

σ-ciało dostateczne

σ-podciało G {\displaystyle {\mathcal {G}}} σ-ciała F {\displaystyle {\mathcal {F}}} jest dostateczne, gdy dla każdego F F {\displaystyle F\in {\mathcal {F}}} istnieje wersja prawdopodobieństwa warunkowego P ( F | G ) {\displaystyle P(F|{\mathcal {G}})} taka sama dla wszystkich miar z rodziny P . {\displaystyle {\mathcal {P}}.}

Statystyka dostateczna

Statystykę T {\displaystyle T} nazywamy dostateczną, jeżeli σ-podciało T 1 ( C ) {\displaystyle T^{-1}({\mathcal {C}})} jest dostateczne.

Twierdzenie

Niech statystyka T : ( R n , B R n , P ) ( R n , B R n ) {\displaystyle T\colon (\mathbb {R} ^{n},{\mathcal {B}}_{R^{n}},{\mathcal {P}})\to (\mathbb {R} ^{n},{\mathcal {B}}_{R^{n}})} będzie statystyką o wartościach wektorowych. T {\displaystyle T} jest statystyką dostateczną dla rodziny P {\displaystyle {\mathcal {P}}} lub dla θ , {\displaystyle \theta ,} jeżeli dla każdej wartości t {\displaystyle t} rozkład warunkowy P θ { | T = t } {\displaystyle P_{\theta }\{\cdot |T=t\}} nie zależy od θ . {\displaystyle \theta .}

Przypadek ogólny opisuje poniższe twierdzenie (zwane twierdzeniem o faktoryzacji lub twierdzeniem Neymana):

Twierdzenie

Niech ( Ω , F , { p θ : θ Θ } ) {\displaystyle (\Omega ,{\mathcal {F}},\{p_{\theta }:\theta \in \Theta \})} będzie przestrzenią statystyczną dominowaną. Statystyka T : Ω X {\displaystyle T\colon \Omega \to {\mathcal {X}}} jest dostateczna wtedy i tylko wtedy, gdy funkcje gęstości p θ {\displaystyle p_{\theta }} dają się przedstawić w postaci:

ω Ω p θ ( ω ) = g θ ( T ( ω ) ) h ( ω ) , {\displaystyle \bigwedge \limits _{\omega \in \Omega }p_{\theta }(\omega )=g_{\theta }(T(\omega ))h(\omega ),}

gdzie:

h : Ω [ 0 ; ) {\displaystyle h\colon \Omega \to [0;\infty )} jest funkcją F {\displaystyle {\mathcal {F}}} -mierzalną,
funkcje g θ : X [ 0 ; ) {\displaystyle g_{\theta }\colon {\mathcal {X}}\to [0;\infty )} C {\displaystyle {\mathcal {C}}} -mierzalne.

Minimalna statystyka dostateczna

Statystykę dostateczną S {\displaystyle S} nazywamy minimalną statystyką dostateczną, jeżeli dla każdej statystyki dostatecznej T {\displaystyle T} istnieje funkcja H {\displaystyle H} taka, że S = H ( T ) . {\displaystyle S=H(T).}

Zobacz też

Zobacz hasło statystyka w Wikisłowniku

Przypisy

  1. Amir D.A.D. Aczel Amir D.A.D. i inni, Statystyka w zarządzaniu, Wydanie 2, Warszawa: Wydawnictwo Naukowe PWN, 2018, ISBN 978-83-01-19510-6 [dostęp 2023-12-19] .
  2. J.R. Barra, Matematyczne podstawy statystyki, s. 11–12.

Bibliografia

  • Jean René Barra, Elżbieta Pleszczyńska, Maria Wesołowska: Matematyczne podstawy statystyki. Warszawa: Państwowe Wydawnictwo Naukowe, 1982. ISBN 83-01-02847-5.
  • Ryszard Zieliński: Siedem wykładów wprowadzających do statystyki matematycznej. Warszawa: 2004. http://web.archive.org/web/20040921200718/http://www.impan.gov.pl/~rziel/7ALL.pdf (dostęp: 21 maja 2008)
Encyklopedia internetowa (measured quantity value):
  • Universalis: statistique