Błąd średniokwadratowy

Błąd średniokwadratowy, średni błąd kwadratowy, MSE (od ang. mean square error) estymatora θ ^ {\displaystyle {\hat {\theta }}} nieobserwowanego parametru θ {\displaystyle \theta } definiowany jest jako:

MSE ( θ ^ ) = E ( ( θ ^ θ ) 2 ) {\displaystyle \operatorname {MSE} ({\hat {\theta }})=\operatorname {E} (({\hat {\theta }}-\theta )^{2})}

MSE jest wartością oczekiwaną kwadratu „błędu”, czyli różnicy między estymatorem a wartością estymowaną. Błąd średniokwadratowy spełnia tożsamość:

MSE ( θ ^ ) = D 2 ( θ ^ ) + ( b ( θ ^ ) ) 2 , {\displaystyle \operatorname {MSE} ({\hat {\theta }})=\operatorname {D^{2}} ({\hat {\theta }})+(\operatorname {b} ({\hat {\theta }}))^{2},}

gdzie:

D 2 ( θ ^ ) {\displaystyle \mathrm {D} ^{2}({\hat {\theta }})} – wariancja estymatora θ ^ , {\displaystyle {\hat {\theta }},}
b ( θ ^ ) = E [ ( θ ^ ) ] θ {\displaystyle b({\hat {\theta }})=E[({\hat {\theta }})]-\theta } – obciążenie estymatora.

Obciążenie estymatora jest różnicą między wartością oczekiwaną estymatora a wartością szacowanego parametru.

Przykładowo można założyć, że:

X 1 , , X n N ( μ , σ 2 ) , {\displaystyle X_{1},\dots ,X_{n}\sim \operatorname {N} (\mu ,\sigma ^{2}),}

czyli jest to próba losowa o liczności n {\displaystyle n} z populacji o rozkładzie normalnym. Najczęściej używane estymatory σ 2 {\displaystyle \sigma ^{2}} to:

1 n i = 1 n ( X i X ¯ ) 2  oraz  1 n 1 i = 1 n ( X i X ¯ ) 2 , {\displaystyle {\frac {1}{n}}\sum _{i=1}^{n}\left(X_{i}-{\overline {X}}\,\right)^{2}{\text{ oraz }}{\frac {1}{n-1}}\sum _{i=1}^{n}\left(X_{i}-{\overline {X}}\,\right)^{2},}

gdzie:

X ¯ = ( X 1 + + X n ) / n {\displaystyle {\overline {X}}=(X_{1}+\ldots +X_{n})/n}

jest średnią z próby. Pierwszy z tych estymatorów to estymator największej wiarygodności, który jest obciążony (to znaczy jego obciążenie jest niezerowe), ma jednak mniejszą wariancję od drugiego, który jest nieobciążony. Mniejsza wariancja w pewien sposób kompensuje obciążenie i średni błąd kwadratowy obciążonego estymatora jest nieco mniejszy niż nieobciążonego.

Niekiedy, zamiast błędu średniokwadratowego, korzysta się z RMSE (od ang. root mean square error), czyli średniej kwadratowej błędów, który jest po prostu pierwiastkiem kwadratowym z MSE.

Zobacz też

  • odchylenie standardowe

Bibliografia

  • Jacek Koronacki, Jan Mielniczuk: Statystyka dla studentów kierunków technicznych i przyrodniczych. Warszawa: WNT, 2006, s. 155 i 156. ISBN 83-204-3242-1.
Encyklopedia internetowa (measure of forecasting quality):
  • Britannica: science/mean-square-due-to-error