重回帰分析
Stataでデータwomenwageを読み込む。女性の就労のデータのようだ。
. use http://www.stata-press.com/data/r16/womenwage.dta, clear
回帰分析をする。初めて使うデータで詳しくないし、詳しくないし、分析内容はわりと適当。有意になる変数と有意にならない変数を選んだ。
- school: 教育年数
- age: 年齢
- tenure: 在職年数
wage: 賃金が従属変数で残りの3つが独立変数である。
通常の重回帰分析を行う。
. reg wage school age tenure
Source | SS df MS Number of obs = 488
-------------+---------------------------------- F(3, 484) = 83.28
Model | 16315.6844 3 5438.56147 Prob > F = 0.0000
Residual | 31608.2971 484 65.306399 R-squared = 0.3404
-------------+---------------------------------- Adj R-squared = 0.3364
Total | 47923.9816 487 98.406533 Root MSE = 8.0812
------------------------------------------------------------------------------
wage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
school | 1.423874 .1427238 9.98 0.000 1.14344 1.704309
age | -.0003934 .0601166 -0.01 0.995 -.1185151 .1177283
tenure | .9309508 .1111943 8.37 0.000 .7124676 1.149434
_cons | -3.14417 2.128803 -1.48 0.140 -7.327007 1.038668
------------------------------------------------------------------------------
年齢だけ有意にならず、教育年数と在職年数は有意になっている。
ベイズ推定を用いた重回帰分析
ベイズ推定を行う場合、bayes:と前につければよいようだ。
. bayes:reg wage school age tenure
Model summary
------------------------------------------------------------------------------
Likelihood:
wage ~ regress(xb_wage,{sigma2})
Priors:
{wage:school age tenure _cons} ~ normal(0,10000) (1)
{sigma2} ~ igamma(.01,.01)
------------------------------------------------------------------------------
(1) Parameters are elements of the linear form xb_wage.
Bayesian linear regression MCMC iterations = 12,500
Random-walk Metropolis-Hastings sampling Burn-in = 2,500
MCMC sample size = 10,000
Number of obs = 488
Acceptance rate = .3651
Efficiency: min = .06028
avg = .09881
Log marginal-likelihood = -1743.1885 max = .2248
------------------------------------------------------------------------------
| Equal-tailed
| Mean Std. Dev. MCSE Median [95% Cred. Interval]
-------------+----------------------------------------------------------------
wage |
school | 1.42746 .1428921 .005161 1.427762 1.14294 1.691908
age | -.0006101 .0613317 .002422 .0015164 -.1249813 .1155295
tenure | .9335003 .1107249 .00451 .9299339 .7168522 1.142494
_cons | -3.198892 2.123934 .081357 -3.199921 -7.157741 1.090784
-------------+----------------------------------------------------------------
sigma2 | 65.56849 4.28004 .090266 65.23421 58.0508 74.34627
------------------------------------------------------------------------------
頻度統計を長年やってきた者としては、P値を探すのだが、ベイズ統計にはP値はない。
その代わりに使われることもあるのが、ベイジアンP値(Bayesian p-value)である。95%確信区間が0をまたいでいると確かではない、0をまたいでいないと、確かだという考え方だ。
頻度統計でも95%信頼区間で使ってきた考え方なのでそれほど違和感はない。
この分析ではageが0をまたいでいるので、効果が認められないことがわかる。他の2つの値は0をまたいでいないので、効果が認められるといった判断になる。