井出草平の研究ノート

2019-10-01から1ヶ月間の記事一覧

有病率の計算[Stata]

疫学調査で有病率を出す方法である。専門用語では母比率の推定という。日本語で母比率と言うとピンとこないが、英語だとpopulation rateなので、こちらの方が直感的に理解できるはずである。 Stataで有病率を推定する Stataではcii propコマンドを使用する。…

AO入試はサイコパスばかりが通る試験なのでやめるべき

中野信子の主張である。 サイコパス (文春新書)作者: 中野信子出版社/メーカー: 文藝春秋発売日: 2016/11/18メディア: 新書この商品を含むブログ (12件) を見る ビジネスマンにとって最大の興味は、「サイコパスは仕事ができるのか、できないのか?」ではない…

ベイジアンロジスティック回帰分析[Stata]

HardinとHilbeが書いたglmのStata本をちらちらと読んでいて少し気になったので、自分でも分析をしてみた。 Generalized Linear Models and Extensions: Fourth Edition作者: James W. Hardin,Joseph M. Hilbe出版社/メーカー: Stata Press発売日: 2018/06/28…

日本醤油の輸出と世界への浸透

日本の味 醤油の歴史 (歴史文化ライブラリー)作者: 林玲子,天野雅敏出版社/メーカー: 吉川弘文館発売日: 2005/03/01メディア: 単行本 クリック: 2回この商品を含むブログ (4件) を見る 今回は世界への影響について。 まずは、醤油は江戸時代から主要な輸出品…

日本の味 醤油の歴史

日本の味 醤油の歴史 (歴史文化ライブラリー)作者: 林玲子,天野雅敏出版社/メーカー: 吉川弘文館発売日: 2005/03/01メディア: 単行本 クリック: 2回この商品を含むブログ (4件) を見る 醤油が生まれたのは中国である。 中国では明の時代に大豆、小麦を原料と…

ベイジアンP値

重回帰分析 Stataでデータwomenwageを読み込む。女性の就労のデータのようだ。 . use http://www.stata-press.com/data/r16/womenwage.dta, clear 回帰分析をする。初めて使うデータで詳しくないし、詳しくないし、分析内容はわりと適当。有意になる変数と有…

明治時代の義務教育の浸透

文科省が1962年に明治時代からの教育の歴史をまとめた『日本の成長と教育』という書籍がある。統計データを中心に書かれているが、非常に興味深い。 文科省上のWebスペースでHTML化されて公開されているようだ。 追記:2022.05.08 リンク切れ http://www.mex…

オープンダイアローグによる介入によりひきこもりが著効した例

オープンダイアローグがひらく精神医療作者: 斎藤環出版社/メーカー: 日本評論社発売日: 2019/07/09メディア: 単行本この商品を含むブログを見る 以下は斎藤環さんが実際に介入した事例である。 最初の事例はひきこもりの男性だった。家族内暴力を振るい、家…

今学期のおすすめ学習アプリ2019年春

学生たちに学習アプリのおすすめを聞く授業のまとめ。 2019年春学期のまとめである。 もう秋じゃない?という突っ込みがありそうだが、放置していた結果である。 2018年秋学期のまとめはこちら。 ides.hatenablog.com お試し翻訳 まずは自分の推薦から。 mir…

パスカルの生の倦怠とデュルケームのアノミー

パスカルとデュルケームが少し似たようなことを言っている気がしたのでエントリを書き始めたのだが、よくよく確認するとパスカル的な考え方をデュルケームは批判的に取り上げ、嘆いているというのが実際のところだったので両者を引用して比較してみたい。 パ…

ソマーズのD[R]

SatataでソマーズのDの出力の方法を以前のエントリで書いたのでRでの出し方も書いておこうと思う。 ryoureadyパッケージ ryoureadyパッケージを使うのが最も楽なのではないかと思う。 ord.somers.d関数を利用する。データは「データ作成」以降のスクリプトに…

オッズ比のバリエーション

オッズ比にいくつかの計算方法があるということには少し前から気になっていた。といっても僕の勉強する範囲の研究では古典的なオッズ比以外みたことがなく、何のことかよくわからなかった。 Rのepitoolsパッケージでは4種類のオッズ比が出力できる。何が出力…

トリンテリックス(ボルチオキセチン)と高齢者のうつ病

11月に新しい抗うつ薬トリンテリックス(一般名:ボルチオキセチン)が投入されるようだ。効果はSSRI+リフレックス的な効果で、忍容性が高い(継続率70%)ということのようだ(トリンテリックス | kyupinの日記 気が向けば更新)。 新規の抗うつ薬が登場しても…

相関係数の比較[Stata]

Stataでも相関係数の計算をしてみた。こちらのエントリ尺度水準に適した相関係数とシミュレーションをStataで行ったバージョンである。 データはこちらからダウンロード、もしくは下部にRでの作成方法を掲載しているので、そのままRで走らせると、dta形式の…

2値と連続変数の関連を示す指標

ROC曲線下の面積の続きである。 医学分野では連続変数とカテゴリカル変数の関連を表現する指標としてROC曲線下の面積が利用される理由はよく知らないのだが、他にも使える指標があるのではないかと思い、候補を並べてみた。 勉強をしているとROC曲線下の面積…

ROC曲線のサンプルサイズの推定

ROC曲線のサンプルサイズの推定について。質問を受けたので推定方法を書いておこう。 pROCパッケージのpower.roc.test関数を利用する。 aucは目標とするACUの値。任意の値である。 sig.levelは有意水準。デフォルトでは5%となっていて書かなくてもいいし、変…

ROC曲線下の面積

ROC曲線のAUC(Area Under the Curve)はAUCは0から1までの値をとる。値が1だと完全に判別ができており、ランダムであるとき、AUC = 0.5となる。 医学で尺度(連続変数)と診断(2値)の一致度、つまり併存妥当性を表すときに使うらしい。論文でもよく使われるそ…

尺度水準に適した相関係数とシミュレーション

今回は相関係数の比較をする。 通常、相関係数というとピアソンの積率相関係数のことを指す。 ピアソンの積率相関係数は連続変数と連続変数の関連を調べるために使用されるが、連続変数以外でも下記のような相関係数がある。 ピアソンの積率相関係数: 連続変…

分位点でデータをリコードする

以前にもシミュレーションで使っている手技たが一度まとめておこうと思う。 55点が平均で標準偏差15程度のテストっぽい仮想データを作成する。 set.seed(123) # 乱数シードの固定 d1 <- data.frame(rnorm(100, mean=55, sd= 15)) # 100個のデータの作成 d1 <…

全変数の関連を楽に把握する試み(ただし道半ば)

二次分析をする際に、データのどこが使える部分なのかわからない時がしばしばある。そういう時に、褒められた方法とは言えないかもしれないが、全変数の関連を把握できると分析のとっかかりになることがある。 ということで、いかに楽に把握をするかというこ…

相関係数を指定した乱数を作る

相関係数のデモをirisデータで作っていてうまくいかず、サンプルデータを作成した時の副産物。 今回は数学と科学のテスト点のサンプルデータを作った。 使用するのはrmvnormであって多次元正規分布を作成する機能である。パッケージは不要であるmvtnormパッ…