一般化線形混合モデル

曖昧さ回避 この項目では、一般化線形混合モデルについて説明しています。一般線形混合モデルについては「混合モデル」をご覧ください。

一般化線形混合モデル(いっぱんかせんけいこんごうモデル、: Generalized linear mixed model, GLMM)とは、統計学において一般化線形モデルを拡張した統計解析モデルである。さらにこの一般化線形混合モデルを拡張し、事前分布に含まれる母数の事前分布を導入する場合には、階層ベイズモデルとみなされる。

  • 固定効果に加えて変量効果を考慮している。変量効果は通常、正規分布を仮定される。変量効果の積分を含めて最尤法に基づき解を求めるが、一般に解析形式で式を表現することができない。そのため、数値積分マルコフ連鎖モンテカルロ法等を用いて計算機により数値解析的に解を求める。コンピュータの高速化により実用化されてきている。
  • 逆ロジット関数のようなリンク関数のほかにも、多くのリンク関数を用いて、ベルヌイ分布以外の確率分布に回帰式をリンクできることが利点である。

モデル

一般化線形混合モデルは、一般に、ランダム効果 u {\displaystyle u} を条件とする従属変数 y {\displaystyle y} 指数型分布族に従って分布し、その期待値がリンク関数 g {\displaystyle g} を介して線形予測子 X β + Z u {\displaystyle X\beta +Zu} に関連する、として定義される。

g ( E [ y u ] ) = X β + Z u {\displaystyle g\left(E\left[y\mid u\right]\right)=X\beta +Zu}

ここで、 X {\displaystyle X} は固定効果 β {\displaystyle \beta } のデザイン行列、 Z {\displaystyle Z} はランダム効果 u {\displaystyle u} のデザイン行列である。 この簡潔な定義を理解するためには、一般化線形モデル混合モデルについての説明を参照のこと。 一般化線形混合モデルは、階層型一般化線形モデルのうち、ランダム効果の正規分布を仮定したものと考えることもできる。

完全尤度 ln p ( y ) {\displaystyle \ln {p(y)}} は次式で表され、多くの場合、膨大な計算量が必要になる[1]

ln p ( y ) = ln p ( y u ) p ( u ) d u {\displaystyle \ln {p(y)}=\ln {\int p(y\mid u)\,p(u)\,du}}

Gauss-Hermite 求積法などによる数値積分のほか、ラプラス近似を用いた方法も提案されている [2]。 罰則つき疑似尤度法(penalized quasi-likelihood method)は、重み付き正規混合モデルを作業変数で繰り返しフィッティングするものであり、多くの商用ないしオープンソースの統計プログラムで実装されている[3]

モデルのフィッティング

最尤法による一般化線形混合モデルのフィッティングにはランダム効果の積分が必要だが、一般的に、解析的な形では表現できない。様々な近似法が開発されたが、どんなモデルとデータセットにも上手く適用できるような方法はない。このため、計算能力の向上と手法の進歩により、数値積分マルコフ連鎖モンテカルロ法が広く用いられるようになった。

モデル選択の基準としては、赤池情報量規準(AIC)が一般的である。最近、ある指数型分布族の分布に基づく、一般化線形混合モデルの AIC の推定値が得られた[4]

ソフトウェア

関連項目

脚注

[脚注の使い方]

出典

  1. ^ Pawitan, Yudi. In All Likelihood: Statistical Modelling and Inference Using Likelihood (Paperbackition ed.). OUP Oxford. pp. 459. ISBN 978-0199671229 
  2. ^ Breslow, N. E.; Clayton, D. G. (20 December 2012). “Approximate Inference in Generalized Linear Mixed Models”. Journal of the American Statistical Association 88 (421): 9–25. doi:10.1080/01621459.1993.10594284. 
  3. ^ Wolfinger, Russ; O'connell, Michael (December 1993). “Generalized linear mixed models a pseudo-likelihood approach”. Journal of Statistical Computation and Simulation 48 (3-4): 233–243. doi:10.1080/00949659308811554. 
  4. ^ Saefken, B.; Kneib, T.; van Waveren, C.-S.; Greven, S. (2014), “A unifying approach to the estimation of the conditional Akaike information in generalized linear mixed models”, Electronic Journal of Statistics 8: 201–225, doi:10.1214/14-EJS881, http://goedoc.uni-goettingen.de/goescholar/bitstream/handle/1/10640/euclid.ejs.1393510264.pdf?sequence=1 
  5. ^ Pinheiro, J. C.; Bates, D. M. (2000), Mixed-effects models in S and S-PLUS, Springer, New York 
  6. ^ Berridge, D. M.; Crouchley, R. (2011), Multivariate Generalized Linear Mixed Models Using R, CRC Press 
  7. ^ “IBM Knowledge Center”. www.ibm.com. 2017年12月6日閲覧。
  8. ^ “Statsmodels Documentation”. www.statsmodels.org. 2021年3月17日閲覧。

参考文献

  • Breslow, N.E.; Clayton, D.G. (1993). “Approximate Inference in Generalized Linear Mixed Models”. Journal of the American Statistical Association 88 (421): 9–25. doi:10.2307/2290687. JSTOR 2290687. 
  • Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). Applied longitudinal analysis. Hoboken, NJ: Wiley-Interscience. ISBN 0-471-21487-6 
標本調査
要約統計量
連続確率分布
位置
分散
モーメント
カテゴリデータ
推計統計学
仮説検定
パラメトリック
ノンパラメトリック
その他
区間推定
モデル選択基準
その他
ベイズ統計学
確率
その他
相関
モデル
回帰
線形
非線形
時系列
分類
線形
二次
非線形
その他
教師なし学習
クラスタリング
密度推定(英語版)
その他
統計図表
生存分析
歴史
  • 統計学の創始者
  • 確率論と統計学の歩み
応用
出版物
  • 統計学に関する学術誌一覧
  • 重要な出版物
全般
その他
カテゴリ カテゴリ
  • 表示
  • 編集