Metoda Pawłowskiego

Metoda Pawłowskiego – metoda doboru zmiennych objaśniających do modelu statystycznego (w szczególności modelu ekonometrycznego) stworzona przez Zbigniewa Pawłowskiego.

Załóżmy, że istnieje zbiór X = { X 1 , X 2 , , X p } {\displaystyle X=\{X_{1},X_{2},\dots ,X_{p}\}} potencjalnych zmiennych objaśniających dla zmiennej objaśnianej Y . {\displaystyle Y.} Do modelu może wejść m {\displaystyle m} zmiennych, gdzie m < p . {\displaystyle m<p.}

Wybieramy taką kombinację, która zapewnia z góry ustaloną dokładność opisu zmiennej Y {\displaystyle Y} oraz możliwie najmniejsze skorelowanie między m {\displaystyle m} -elementową kombinacją zmiennych objaśniających.

Aby model był dokładny zakłada się, że wartość współczynnika korelacji wielorakiej między zmienną endogeniczną a m {\displaystyle m} -elementowym zbiorem zmiennych objaśniających była nie mniejsza niż z góry zadana liczba δ > 0. {\displaystyle \delta >0.}

Oznaczamy r j {\displaystyle r_{j}} jako współczynnik korelacji między zmienną objaśnianą Y {\displaystyle Y} a zmienną objaśniającą X j , {\displaystyle X_{j},} a także współczynnik korelacji r j l {\displaystyle r_{jl}} między zmiennymi objaśniającymi X j {\displaystyle X_{j}} i X l . {\displaystyle X_{l}.} Otrzymane współczynniki korelacji między zmiennymi objaśniającymi tworzą macierz korelacji R , {\displaystyle R,} natomiast współczynniki korelacji między zmienną objaśnianą i zmiennymi objaśniającymi wektor korelacji R 0 : {\displaystyle R_{0}{:}}

R = [ 1 r 12 . . . r 1 m r 21 1 . . . r 2 m . . . . . . . . . . . . r m 1 r m 2 . . . 1 ] , R 0 = [ r 1 r 2 . . . r m ] . {\displaystyle R={\begin{bmatrix}1&r_{12}&...&r_{1m}\\r_{21}&1&...&r_{2m}\\...&...&...&...\\r_{m1}&r_{m2}&...&1\end{bmatrix}},\;R_{0}={\begin{bmatrix}r_{1}\\r_{2}\\...\\r_{m}\end{bmatrix}}.}

Następnie budujemy tzw. macierz rozszerzoną R : {\displaystyle R^{*}{:}}

R = [ 1 R 0 T R 0 R ] . {\displaystyle R^{*}={\begin{bmatrix}1&R_{0}^{T}\\R_{0}&R\end{bmatrix}}.}

Macierze R {\displaystyle R} oraz R {\displaystyle R^{*}} wykorzystujemy do budowy współczynnika korelacji wielorakiej R , {\displaystyle R,} który jest miarą liniowej zależności między zmienną objaśnianą a liniową kombinacją zmiennych objaśniających. Obliczany jest ze wzoru:

R = 1 | R | | R | [ 0 , 1 ] , {\displaystyle R={\sqrt {1-{\frac {|R^{*}|}{|R|}}}}\in [0,1],}

gdzie:

  • | R | {\displaystyle |R^{*}|} – wyznacznik macierzy korelacji m {\displaystyle m} -elementowej kombinacji zmiennych objaśniających, do której dołączono wektor współczynników korelacji zmiennej endogenicznej ze zmiennymi objaśniającymi,
  • | R | {\displaystyle |R|} – wyznacznik z macierzy korelacji m {\displaystyle m} -elementowej kombinacji zmiennych objaśniających.

Współczynnik korelacji wielorakiej przyjmuje wartości z przedziału [ 0 , 1 ] . {\displaystyle [0,1].} Jeżeli R = 0 , {\displaystyle R=0,} to nie ma zależności liniowej, natomiast gdy R = 1 , {\displaystyle R=1,} to między zmienną objaśniana a liniową kombinacją zmiennych objaśniających zachodzi zależność funkcyjna liniowa. W związku z tym, im wyższa jest wartość współczynnika, tym większa jest zależność funkcyjna.

Aby wybrać optymalną kombinację, rozpatrujemy wszystkie m {\displaystyle m} -elementowe kombinacje, jakie można utworzyć ze zbioru X potencjalnych zmiennych objaśniających. Następnie wybieramy te kombinacje, które spełniają warunek dokładności ( R δ ) , {\displaystyle (R\geqslant \delta ),} a tworzą one zbiór kombinacji dopuszczalnych. Wśród wybranych kombinacji poszukuje się najlepszej, czyli takiej, w której zmienne objaśniające są najsłabiej skorelowane między sobą.

Za optymalną przyjmuje się taką kombinację m {\displaystyle m} zmiennych, gdzie wyznacznik z macierzy korelacji jest największy ( R = max ) , {\displaystyle (R=\max ),} ponieważ im wyznacznik jest bliższy jedności, tym zmienne są słabiej skorelowane.

Bibliografia

  • A. Barczak, J. Biolik, Podstawy ekonometrii, Wydawnictwo AE Katowice, Katowice 2003, ISBN 83-87265-87-X.
  • J. Dziechciarz, Ekonometria. Metody, przykłady, zadania, Wydawnictwo AE we Wrocławiu, Wrocław 2002, ISBN 83-7011-551-9.