井出草平の研究ノート

ベイジアンP値

重回帰分析

Stataでデータwomenwageを読み込む。女性の就労のデータのようだ。

. use http://www.stata-press.com/data/r16/womenwage.dta, clear

回帰分析をする。初めて使うデータで詳しくないし、詳しくないし、分析内容はわりと適当。有意になる変数と有意にならない変数を選んだ。

  • school: 教育年数
  • age: 年齢
  • tenure: 在職年数

wage: 賃金が従属変数で残りの3つが独立変数である。
通常の重回帰分析を行う。

. reg wage school age tenure

      Source |       SS           df       MS      Number of obs   =       488
-------------+----------------------------------   F(3, 484)       =     83.28
       Model |  16315.6844         3  5438.56147   Prob > F        =    0.0000
    Residual |  31608.2971       484   65.306399   R-squared       =    0.3404
-------------+----------------------------------   Adj R-squared   =    0.3364
       Total |  47923.9816       487   98.406533   Root MSE        =    8.0812

------------------------------------------------------------------------------
        wage |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      school |   1.423874   .1427238     9.98   0.000      1.14344    1.704309
         age |  -.0003934   .0601166    -0.01   0.995    -.1185151    .1177283
      tenure |   .9309508   .1111943     8.37   0.000     .7124676    1.149434
       _cons |   -3.14417   2.128803    -1.48   0.140    -7.327007    1.038668
------------------------------------------------------------------------------

年齢だけ有意にならず、教育年数と在職年数は有意になっている。

ベイズ推定を用いた重回帰分析

ベイズ推定を行う場合、bayes:と前につければよいようだ。

. bayes:reg wage school age tenure

Model summary
------------------------------------------------------------------------------
Likelihood:
  wage ~ regress(xb_wage,{sigma2})

Priors:
  {wage:school age tenure _cons} ~ normal(0,10000)                         (1)
                        {sigma2} ~ igamma(.01,.01)
------------------------------------------------------------------------------
(1) Parameters are elements of the linear form xb_wage.

Bayesian linear regression                       MCMC iterations  =     12,500
Random-walk Metropolis-Hastings sampling         Burn-in          =      2,500
                                                 MCMC sample size =     10,000
                                                 Number of obs    =        488
                                                 Acceptance rate  =      .3651
                                                 Efficiency:  min =     .06028
                                                              avg =     .09881
Log marginal-likelihood = -1743.1885                          max =      .2248

------------------------------------------------------------------------------
             |                                                Equal-tailed
             |      Mean   Std. Dev.     MCSE     Median  [95% Cred. Interval]
-------------+----------------------------------------------------------------
wage         |
      school |   1.42746   .1428921   .005161   1.427762    1.14294   1.691908
         age | -.0006101   .0613317   .002422   .0015164  -.1249813   .1155295
      tenure |  .9335003   .1107249    .00451   .9299339   .7168522   1.142494
       _cons | -3.198892   2.123934   .081357  -3.199921  -7.157741   1.090784
-------------+----------------------------------------------------------------
      sigma2 |  65.56849    4.28004   .090266   65.23421    58.0508   74.34627
------------------------------------------------------------------------------

頻度統計を長年やってきた者としては、P値を探すのだが、ベイズ統計にはP値はない。

その代わりに使われることもあるのが、ベイジアンP値(Bayesian p-value)である。95%確信区間が0をまたいでいると確かではない、0をまたいでいないと、確かだという考え方だ。

頻度統計でも95%信頼区間で使ってきた考え方なのでそれほど違和感はない。

この分析ではageが0をまたいでいるので、効果が認められないことがわかる。他の2つの値は0をまたいでいないので、効果が認められるといった判断になる。