井出草平の研究ノート

2023-04-01から1ヶ月間の記事一覧

全ての組み合わせでCramerのVを計算する、1つのデータフレームで実行する場合

先に作成したコードの変型版。 ides.hatenablog.com コード # ライブラリの読み込み library(dplyr) # ダミーデータの作成 set.seed(42) dummy_data <- data.frame(matrix(sample(0:2, 1000, replace = TRUE), ncol = 10)) colnames(dummy_data) <- paste0("…

無条件平均値代入法 Unconditional Mean Imputation [stata]

欠測値の補足方法の一つ。やっていることは変数の平均値を出し、欠損値の中に入れる、というだけである。 利点については以下のようなものが挙げられている。 簡単で直感的: 平均値代入法は非常に簡単で直感的な手法であるため、理解しやすく、実装も容易で…

物議をかもした香川県「ゲーム規制条例」、現地で追い続けた記者の著書が発売

www.itmedia.co.jp

「ゲーム条例」に関する書籍『ルポ ゲーム条例;なぜゲームが狙われるのか』が発売 問題を追ってきた記者によるノンフィクション

jp.ign.com

Little's Missing Completely at Random (MCAR) 検定

naniarパッケージを用いた方法 library("naniar") Little (1988)の検定統計量を用いて、データが完全にランダムに欠落しているかどうか(MCAR)を評価する。この検定の帰無仮説は、データがMCARであるというもので、検定統計量はカイ二乗値である。 mcar_test(…

献本御礼:山下洋平『ルポ ゲーム条例 なぜゲームが狙われるのか』

KSB瀬戸内海放送の山下洋平さんのご著書『ルポ ゲーム条例 なぜゲームが狙われるのか』をご献本いただきました。 ありがとうございます。 ルポ ゲーム条例;なぜゲームが狙われるのか 香川の #ゲーム条例 をテーマにしたノンフィクション書籍を執筆しました!…

全ての組み合わせでCramerのVを計算する[R]

今回はCramerのVの計算。 CramerのVは名目尺度以上のものに適応できる。 今回は2値の名義尺度と3値の順序尺度を例にしている。 検定はカイ二乗検定を用いるため、やや複雑でAIにすべて書かせるのは無理だった。 Phindが書いたのはCramerのVのところだけだが…

Phindでリコードのコードを書く[R]

統計の分野の人がリコードと呼ぶ作業をPhindで実験してみた。リコードという呼び方は方言(ジャーゴン)だそうで、プログラミングの分野ではnormalizeかcanonicalizeと呼ぶらしい。統計でnormalizeというと正規分布を用いて0から1までの数字にすることなどを指…

全ての組み合わせでクロス集計表分析を行う[R]

Phind(https://www.phind.com/)を利用してデータに含まれる変数の全組み合わせのクロス集計表分析を実行するコードを書いてもらった。 まず、ダミーデータを作成。 set.seed(123) df <- data.frame(matrix(sample(0:2, 100, replace = TRUE), nrow = 10)) co…