Tobit-Modell

Das Tobit-Modell ist ein auf James Tobin zurückgehendes ökonometrisches Modell zur Analyse beschränkt abhängiger Variablen (zensierte Daten). Da die abhängige Variable nur auf einem bestimmten Wertebereich existiert, sind normale Regressionsparameter nicht die bestmöglichen Schätzer, sodass die Schätzfunktion korrigiert werden muss. Diese Korrektur ist im Tobit-Modell implementiert.

Modell

Mit dem Tobit-Modell wird der Zusammenhang zwischen einer nicht-negativen abhängigen Variable y i {\displaystyle y_{i}} und einer unabhängigen Variablen (oder einem Vektor) x i {\displaystyle x_{i}} beschrieben. Das Modell geht davon aus, dass es eine latente (d. h. nicht beobachtbare) Variable y i {\displaystyle y_{i}^{*}} gibt. Diese Variable ist linear abhängig von x i {\displaystyle x_{i}} über einen Parameter (oder Vektor) β {\displaystyle \beta } , der wie bei einer linearen Regression den Zusammenhang zwischen der unabhängigen Variable (oder dem Vektor) x i {\displaystyle x_{i}} und der latenten Variablen y i {\displaystyle y_{i}^{*}} bestimmt.

Darüber hinaus gibt es einen normalverteilten Fehlerterm u i {\displaystyle u_{i}} , der die Zufallseinflüsse auf diesen Zusammenhang modelliert.

Die beobachtbare Variable y i {\displaystyle y_{i}} ist per Definition gleich der latenten Variablen, wenn diese größer als null ist; ansonsten ist sie null:

y i = { y i f u ¨ r y i > 0 , 0 f u ¨ r y i 0 , {\displaystyle y_{i}={\begin{cases}y_{i}^{*}&\mathrm {f{\ddot {u}}r} \;y_{i}^{*}>0,\\0&\mathrm {f{\ddot {u}}r} \;y_{i}^{*}\leq 0,\end{cases}}}

wobei y i {\displaystyle y_{i}^{*}} eine latente Variable darstellt:

y i = β x i + u i , u i N ( 0 , σ 2 ) {\displaystyle y_{i}^{*}=\beta x_{i}+u_{i},\quad u_{i}\sim {\mathcal {N}}(0,\sigma ^{2})}

Parameterschätzung

Falls der wahre Parameter β {\displaystyle \beta } über eine herkömmliche Regression der beobachteten Variable y i {\displaystyle y_{i}} auf x i {\displaystyle x_{i}} geschätzt wird, ist der resultierende Kleinste-Quadrate-Schätzer nicht konsistent für β {\displaystyle \beta } . Amemiya (1973) hat bewiesen, dass der Wahrscheinlichkeitsschätzer, der von Tobin für dieses Modell vorgeschlagen wurde, konsistent ist.

Verallgemeinerung

Das Tobit-Modell ist ein Spezialfall eines trunkierten Regressionsmodells, weil die latente Variable y i {\displaystyle y_{i}^{*}} nicht immer beobachtet werden kann, während die unabhängige Variable x i {\displaystyle x_{i}} beobachtbar ist. Eine verbreitete Variante des Tobit-Modells besteht darin, eine Variable auf einen von Null verschiedenen Wert y L {\displaystyle y_{L}} zu beschränken:

y i = { y i f u ¨ r y i > y L 0 f u ¨ r y i y L . {\displaystyle y_{i}={\begin{cases}y_{i}^{*}&\mathrm {f{\ddot {u}}r} \quad y_{i}^{*}>y_{L}\\0&\mathrm {f{\ddot {u}}r} \quad y_{i}^{*}\leq y_{L}.\end{cases}}}

Ein anderes Beispiel betrifft die Beschränkung auf Werte über y U {\displaystyle y_{U}} .

y i = { y i f u ¨ r y i < y U 0 f u ¨ r y i y U . {\displaystyle y_{i}={\begin{cases}y_{i}^{*}&\mathrm {f{\ddot {u}}r} \quad y_{i}^{*}<y_{U}\\0&\mathrm {f{\ddot {u}}r} \quad y_{i}^{*}\geq y_{U}.\end{cases}}}

Ein weiteres Modell resultiert, wenn y i {\displaystyle y_{i}} gleichzeitig von oben und von unten beschränkt wird.

y i = { y i f u ¨ r y L < y i < y U 0 f u ¨ r y i y L oder y i y U . {\displaystyle y_{i}={\begin{cases}y_{i}^{*}&\mathrm {f{\ddot {u}}r} \quad y_{L}<y_{i}^{*}<y_{U}\\0&\mathrm {f{\ddot {u}}r} \quad y_{i}^{*}\leq y_{L}\quad {\text{oder}}\quad y_{i}^{*}\geq y_{U}.\end{cases}}}

Solche Verallgemeinerungen werden typischerweise ebenfalls als Tobit-Modelle bezeichnet. Je nachdem, wo und wann die Beschränkung erfolgt, resultieren weitere Varianten des Tobit-Modells. Takeshi Amemiya klassifiziert diese Varianten in fünf Kategorien (Tobit-Regression Typ 1–Tobit-Regression Typ 4), wobei die Tobit-Regression Typ 1 für das oben beschriebene Modell steht.[1] Schnedler liefert eine allgemeine Formel, um konsistente Wahrscheinlichkeitsschätzer für diese und andere Varianten des Tobit-Modells zu erzielen.[2]

Literatur

  • Amemiya, Takeshi (1973). „Regression analysis when the dependent variable is truncated normal“. Econometrica 41 (6), 997–1016.
  • Tobin, James (1958). „Estimation of relationships for limited dependent variables“. Econometrica 26 (1), 24–36.

Einzelnachweise

  1. Takeshi Amemiya: Advanced Econometrics. Harvard University Press, Cambridge 1985, ISBN 0-674-00560-0, S. 360 ff. 
  2. Schnedler, Wendelin (2005). „Likelihood estimation for censored random vectors“. Econometric Reviews 24 (2), 195–217.