重回帰分析
Stataでデータwomenwageを読み込む。女性の就労のデータのようだ。
. use http://www.stata-press.com/data/r16/womenwage.dta, clear
回帰分析をする。初めて使うデータで詳しくないし、詳しくないし、分析内容はわりと適当。有意になる変数と有意にならない変数を選んだ。
- school: 教育年数
- age: 年齢
- tenure: 在職年数
wage: 賃金が従属変数で残りの3つが独立変数である。
通常の重回帰分析を行う。
. reg wage school age tenure Source | SS df MS Number of obs = 488 -------------+---------------------------------- F(3, 484) = 83.28 Model | 16315.6844 3 5438.56147 Prob > F = 0.0000 Residual | 31608.2971 484 65.306399 R-squared = 0.3404 -------------+---------------------------------- Adj R-squared = 0.3364 Total | 47923.9816 487 98.406533 Root MSE = 8.0812 ------------------------------------------------------------------------------ wage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- school | 1.423874 .1427238 9.98 0.000 1.14344 1.704309 age | -.0003934 .0601166 -0.01 0.995 -.1185151 .1177283 tenure | .9309508 .1111943 8.37 0.000 .7124676 1.149434 _cons | -3.14417 2.128803 -1.48 0.140 -7.327007 1.038668 ------------------------------------------------------------------------------
年齢だけ有意にならず、教育年数と在職年数は有意になっている。
ベイズ推定を用いた重回帰分析
ベイズ推定を行う場合、bayes:
と前につければよいようだ。
. bayes:reg wage school age tenure Model summary ------------------------------------------------------------------------------ Likelihood: wage ~ regress(xb_wage,{sigma2}) Priors: {wage:school age tenure _cons} ~ normal(0,10000) (1) {sigma2} ~ igamma(.01,.01) ------------------------------------------------------------------------------ (1) Parameters are elements of the linear form xb_wage. Bayesian linear regression MCMC iterations = 12,500 Random-walk Metropolis-Hastings sampling Burn-in = 2,500 MCMC sample size = 10,000 Number of obs = 488 Acceptance rate = .3651 Efficiency: min = .06028 avg = .09881 Log marginal-likelihood = -1743.1885 max = .2248 ------------------------------------------------------------------------------ | Equal-tailed | Mean Std. Dev. MCSE Median [95% Cred. Interval] -------------+---------------------------------------------------------------- wage | school | 1.42746 .1428921 .005161 1.427762 1.14294 1.691908 age | -.0006101 .0613317 .002422 .0015164 -.1249813 .1155295 tenure | .9335003 .1107249 .00451 .9299339 .7168522 1.142494 _cons | -3.198892 2.123934 .081357 -3.199921 -7.157741 1.090784 -------------+---------------------------------------------------------------- sigma2 | 65.56849 4.28004 .090266 65.23421 58.0508 74.34627 ------------------------------------------------------------------------------
頻度統計を長年やってきた者としては、P値を探すのだが、ベイズ統計にはP値はない。
その代わりに使われることもあるのが、ベイジアンP値(Bayesian p-value)である。95%確信区間が0をまたいでいると確かではない、0をまたいでいないと、確かだという考え方だ。
頻度統計でも95%信頼区間で使ってきた考え方なのでそれほど違和感はない。
この分析ではage
が0をまたいでいるので、効果が認められないことがわかる。他の2つの値は0をまたいでいないので、効果が認められるといった判断になる。