lcca_1.1.0.zip
の中にあるdataフォルダにデータがある。
データはgzで圧縮されているので、解凍すると.txt形式のデータが表れる。
Excelなどでは読めないのでread.table()
を用いてRで読む。
NHsmoking
データ読み込み
NHsmoking <- read.table(file="NHsmoking.txt",header = TRUE)
head(NHsmoking)
WEIGHT CLUSTER STRATUM AGEYRS TOB5DAYS USEDCIGS DAYSCIGS CIGSPERDAY LASTCIG 1 6571.396 2 44 0 1 1 1 1 1 2 8987.042 1 52 11 1 1 1 1 1 3 5586.719 1 51 15 2 1 1 1 1 4 34030.995 2 46 85 1 1 1 1 1 5 26770.585 1 48 44 2 1 1 1 1 6 35315.539 2 52 70 2 1 1 1 1
データの説明
NHsmoking
パッケージ:LCCA
R ドキュメント
NHANESからの最近のタバコの使用状況
説明
このデータセットは 2005-2006 National Health and Nutrition Examination Survey (NHANES) から得られたもので、12歳以上の自己申告による最近の喫煙行動に関連するものである。
使用方法 NHsmoking
フォーマット
9,950 行、9 変数を持つデータフレーム。 WTMEC2YR 回答者の調査体重 SDMVPSU SDMVSTRA にネストされた分散推定のためのサンプリング擬似クラスタ
SDMVSTRA 分散推定のためのサンプリング擬似クラスター
RIDAGEYR 回答者の年齢(歳)
SMQ680r 最近5日間にタバコ/ニコチンを使用しましたか?(1=はい, 2=いいえ, 3=AGEYRS<12のため適用不可)
SMQ690Ar 過去5日間にタバコを使用しましたか?(1=はい, 2=いいえ, 3=SMQ680>rのため適用外)
SMQ710r 過去5日間にタバコを使用した日数 (1=1, 2=2, 3=3, 4=4, 5=5, 6=SMQ690Ar>1 のため非該当)
SMQ720r 利用した日、1日に吸うタバコの本数(1=1-4, 2=5-9, 3=10-19, 4=20+, 5=SMQ690Ar>1のため該当なし)
SMQ725r 回答者が最後にタバコを吸ったのはいつですか (1=今日, 2=昨日, 3=3-5日前, 4=SMQ690Ar>1 のため適用不可)
詳細
変数名の末尾のrは、NHANES項目の再コード化を示す。例えば、SMQ690Ar は NHANES の項目 SMQ690A を再コード化したものである。NHANES項目の正確な定義については、NHANES 2005-2006のドキュメントを参照されたい。
最近の喫煙の項目は、RIDAGEYR<12の参加者には適用されない。
検査順序によって、SMQ680r、SMQ690Ar、SMQ710r、SMQ720r、SMQ725rの入れ子型スキップパターンが作成された。最初の質問(SMQ680r)の回答が「最近5日間にタバコ/ニコチンを使いましたか」であった場合、残りの項目はスキップされた。はい」の場合、過去5日間にタバコを使用したかどうかを尋ねました(SMQ690Ar)。いいえ」と答えた場合は、残りの項目はスキップされた。
NHANES は複雑な多段階のサンプリングデザインを用いており、推定値と標準誤差を計算する際には、デザイン情報を考慮する必要がある。変数WTMEC2YRは、最近の喫煙項目を含む分析を意図した調査重みである。擬似クラスターおよび擬似層別識別子(SDMVPSUおよびSDMVSTRA)は、実際のサンプリング層および一次サンプリング単位ではなく、回答者の秘密を保護するためのマスクバージョンである。詳細については、NHANES 2005-2006の分析ガイドラインを参照されたい。
diet
diet <- read.table(file="diet.txt",header = TRUE)
head(diet)
DISTRESS.1 BLACK NBHISP GRADE SLFHLTH SLFWGHT WORKHARD GOODQUAL PHYSFIT PROUD LIKESLF ACCEPTED FEELLOVD DISTRESS.2 U.1 U.2 U.3 1 0.47 0 0 10 4 4 2 2 2 2 5 2 2 0.40 2 2 2 2 0.05 0 0 8 2 3 1 1 2 1 1 2 1 0.09 2 2 2 3 0.63 0 0 8 2 3 2 2 2 2 3 2 2 0.69 1 1 1 4 0.16 1 0 9 1 4 2 1 2 1 2 2 1 0.08 2 2 1 5 1.79 1 0 9 4 4 1 2 2 2 3 3 2 1.41 1 1 1 6 0.32 0 0 10 1 3 1 1 2 1 4 1 1 0.52 1 1 2
Schafer and Kang (2008) は、思春期の少女の感情的苦痛に対するダイエットの影響を評価するために、模擬観察研究を発表した。サンプルは、100万人の少女からなる人工的な集団から抽出された。この集団の変数は、National Longitudinal Study of Adolescent Health (Add Health) (Udry, 2003) の最初の2波の実際の変数に類似している。しかし、Add Health参加者の実際のデータは、母集団にもサンプルにも現れない。すべてのデータは、Schafer and Kang (2008)が記述したように、Add Healthから推定した確率分布からランダムに生成されたものである。
この母集団から6,000人の少女を抽出した1つのサンプルの観測値が、データセット・ダイエットに提供されている。このデータセットに含まれる変数を表1に示す。ダイエッターと非ダイエッターは、それぞれ人口の約20%と80%で構成されています。治療変数であるWave Iのダイエットのバイナリ指標は、データセットから削除され、3つの条件付き独立バイナリ指標U.1、U.2、U.3に置き換えられ、支持確率は、ダイエッターで0.90, 0.85, 0.80, ノンディッターで 0.10, 0.15, 0.20 とされました。この構造は、U.1、U.2、U.3に2つのクラスを持つ潜在クラス・モデルを当てはめることで見ることができる。
変数
DISTRESS.1
第 1 波での精神的苦痛のスコア
BLACK
1=黒人、0=その他 NBHISP 1=非黒人ヒスパニック、0=その他
GRADE
第1波における学校の成績(7, ... , 11)
SLFHLTH
健康全般に関する自己評価(1=優れている、2=非常に良い、3=良い、4=まあまあ、5=悪い)。
SLFWGHT
体重の自己評価(1:非常に少ない、2:やや少ない、3:ほぼ適正、4:やや多い、5:非常に多い)。
WORKHARD
「欲しいものが手に入るのは、たいていそのために努力したからだ」(1=とてもそう思う、...、5=あまりそう思わない)。
GOODQUAL
「あなたは良いところをたくさん持っている」(1=とてもそう思う、...、5=あまりそう思わない)。
PHYSFIT
"あなたは体力がある" (1=とてもそう思う, ... , 5=あまりそう思わない)
PROUD
"誇りに思うことがたくさんある" (1=とてもそう思う, ... , 5=あまりそう思わない)
LIKESLF
"あなたは今の自分が好きだ" (1=とてもそう思う, ... , 5=とてもそう思わない)
ACCEPTED
「社会的に受け入れられていると感じる」(1=とてもそう思う、...、5=あまりそう思わない)
FEELLOVD
「愛され、必要とされていると感じる」(1=強くそう思う、...、5=強くそう思わない) FEELLOVD
U.1
ダイエットに関連する1つ目の二項指標
U.2
ダイエットに関連する2つ目の二項指標
U.3
ダイエットに関連する3つ目の2値指標
DISTRESS.2
第2波で観察されたストレス