井出草平の研究ノート

川端亮「計量的テキスト分析」

川端亮,2004,
「計量的テキスト分析」
『社会調査における非定型データ分析支援システムの開発(平成13年度〜平成15年度 科学研究費補助金研究成果報告書)』


「計量的テキスト分析」についての総論。非常に勉強になる。


計量的テキスト分析の得意とするところと、不得意とするところについて。

 第一は,大量のデータが扱えることである。たとえば、 10年分の新聞記事の分析は,人手では不可能である。コンピュータ・コーディングを用いることで、今まで5年間の変動しか分析できなかったものが, 10年分、 20年分のデータを用いて、より長期の分析を行うことができるので,新たな発見が期待できる。また, 5年分の新聞記事のうち、偶数月のみの分析しかできなかったものが、すべての月の分析を行うことにより、より正確な分析が行える可能性もある。
 二番目にあげるのは、質的データ分析における信憑性を高めることである。ここでいう信頼性は,一般にいわれる質的データにおける信頼性のすべてではなく、一部のことである.質的データにおける信頼性は,たとえば、 Lincoln and Guba (1985)においては、 credibility:信用性(量的調査でいう内的妥当性) , transferability:移転性(外的妥当性)、 dependability:信悠性(信頼性) , confirmability:確証性(客観性)の4つに分けて論じられている。コンピュータ・コーディングの利点としてあげあれる信頼性は、この4つの中のdependabilityのことである。それは、量的調査に即していえば反復しても同じ結果が出るということを指す。しかしながら質的調査においては、異なる研究者がたとえ同じ対象を同時期に調査したとしても(現実的には同時に調査はできないが) 、同じデータを得るとは考えにくく,またたとえ同じデータを得られたとしても異なる研究者が分析した場合に同じ結果が得られるとは考えにくいであろう.
 三番目にあげられることは,共同研究が可能になることである。コンピュータ・コーディングによってコード化の方法が明示化されるので,そのリストやプログラムが理解できれば、多数の研究者間で共有が可能である。
 四番目にサンプルの選択に役立っことをあげておく。(中略) これは、手作業や記憶に基づくよりもはるかに素早く、もれなくさがすという点で、コンピュータ・コーディングを用いる大きな利点である。


 つぎにコンピュータ・コーディングの欠点といわれているものをあげておこう。
 第一に、データが少ないと労力の割に報われないことが挙げられる。この場合は、読んでわかること以上のことを発見することも難しいし、読むよりもコーディングに時間も労力もかかる。
たとえば、数分程度の会話を詳細に分析するような会話分析には向かないであろう。
 二番目に言葉の曖昧さをうまく識別できない場合が多いという問題がある。たとえば、英語でいえば、「Spring」が、春なのか、泉なのかというのは、コンピュータで識別できない場合も多い。日本語では、「おかあさん」といった場合、実母なのか義母なのか、識別するのは難しいであろう。これらの問題は、「非あいまい化(disambiguation)」として議論されており、英語のプログラムの中では、特殊な処理が行われているものもある(Popping 2000)。
 三番目にあげられることは、コンピュータでは、文脈を理解できないということである。単語を取り出すことは比較的容易であるが、構文として理解したり、意味論的理解をすることは、かなり難しい。


したがって、大量のデータをコーディングするためには、できるだけコンピュータに自動的にコード化させる方が望ましく、一文に複数のコードを振るためには、できるだけ短い単位をコード化の単位とする方がよい。このような観点で、文脈やあいまい化の問題を多少犠牲にしても、自動的にコードを振るという作業が求められるのである。
 この計量分析をするためのコーディングという意味で、本書で用いるコーディングを単なる「コンピュータ・コーディング」という言葉と区別し、「計量的テキスト分析」と呼ぶことにする。したがって、計量的テキスト分析の長所として、先に挙げたコンピュータ・コーディングのメリットに加えて、潜在的論理を発見し、新たな分析のための発想を得ることを、5番目の長所としてあげておく。


以下はグランデッド・セオリーとの共通点相違点について

しかし結論からいうと、計量的テキスト分析は、基本的なコーディングの発想はグラウンデッド・セオリーに準じているが、いくつかの異なる点を持つ。


 グラウンデッド・セオリーとは,質的研究の一つの方法であり、研究の過程を通じて体系的に集められ,分析されるデータから引き出された理論である(Strauss and Corbin 1990:p.24,Strauss and
Corbin 1998:p.12) 。これは、グレイザ-とストラウスによって、 grand theoryに対抗して作られたものであり、また,計量分析の仮説 - 検証型調査-の批判でもあった.つまり,理論は調査に先立つものではなく,データから帰納的に浮かび上がってくるものなのである。データに基づいているので、グラウンデッド・セオリーによる理論は,現象をよりよく理解するのに役立つという。

ここで注意すべきなのは、この大卒、高卒、中卒という選択肢は、計量的分析では順序尺度として用いたり教育年数に変換して比例尺度として用いられるが、グラウンデッド・セオリーになぞらえるときには名義尺度と思った方がわかりやすいことである。グラウンデッド・セオリーが扱うような質的なデータにおいては、計量的分析がおもに扱う比例尺度や間隔尺度はもちろんのこと、順序尺度もそれほど多くなく、実際はほとんどが名義尺度と考えなければならない。


表1用語の対比
グラウンデッド・セオリーの用語 量的分析、調査法の用語 具体例 計量的テキスト分析の用語
概念 (理論的)概念 社会的地位 概念
カテゴリー 構成概念(潜在概念) 教育的地位など カテゴリー
特性 変数 学歴、収入、仕事 単語
次元 選択肢のセット 大卒一高卒一中卒

500万円未満−500万円 以上
あり−なし

1回−2回−3回以上


また,グラウンデッド・セオリーには, in vivo codeと呼ばれる対象者の生きた言葉がそのままカテゴリーとして扱われる場合があるが、これも女性の社会的地位の分析において、 「既婚」かどうかを1-0のダミー変数として、社会的地位の構成概念と考えれば、それほど不自然ではないであろう。


以下断片的なメモ。

この点に関して、ダラウンデッド・セオリーのテキストから例を挙げると, 「厨房の近くの壁の方-行き、スケジュールがどうなっているのかを見る」という動作を単に要約して「スケジュールを読む」とコーディングするのではなく, 「情報の収集」というように命名することが必要なのである(Strauss and Corbin 1990,pp.64-65-1999、 63頁) 。

 この考え方は、極めて魅力的である。質的なデータ収集のように深く調査現場に関与していると、さまざまな予断が自然と身に付いてしまう。この予断に影響されると、調査対象の人々の見方と同じような見方になってしまい、分析者としてのデータから距離を置いた、調査対象の人とは異なった学問的見方、データの解釈を行うことが困難になる。また逆に、この予断を排しようとすると、今度は分析者の学問的背景から導き出される仮説的な見方でしかデータを見られなくなることもある。そして、この姿勢こそがグラウンデッド・セオリーがもっとも批判したデータ分析の方法なのである。

形態素解析とは、句読点でしか区切られていない日本語の文章を解析し、最小単位(形態素)に分解することをいう。

この3段階をとっているのは、Strauss(1987)やStrauss and Corbin(1990, 1998)であり,Glaser(1978)は,領域密着コーディングと理論的コーディングに分け,さらに領域密着コーディングを、オープンコーディングと選択コーディングに分けている。

理論的感受性もグラウンデッド・セオリーの重要な用語の一つであり、グレイザーは、グラウンデッド・セオリーの2番目の本に『理論的感受性』というタイトルを付け、最初の本のグラウンデッド・セオリーの説明を補うとともに、これは理論的感受性を高めることを目的とすると述べている(Glaser1978:p.1)。理論を生み出す感受性は、文献を読む能力、個人的な体験、思いつき、 勘などを含めた研究者の個人の資質によるといえる。しかし、思いつきや勘に頼るのでは、学問的方法とはいえないであろう。きちんとした手順の中で、思いつきを助ける方法がグラウンデッ ド・セオリーであるともいえる。


以下関連文献。
効率よく読む必要がありそうだ。


データ対話型理論の発見―調査からいかに理論をうみだすか

データ対話型理論の発見―調査からいかに理論をうみだすか


Glaser, B. G. and Strauss, A. L. 1967 The Discovery ofGrounded Theory: Strategies for Qualitative Research.Chicago:Aldine. (後藤隆・大出春江・水野節夫訳1996 『データ対話型理論の発見−−調査からいかに理論をうみだすか』新曜社。 )


Theoretical Sensitivity: Advances in the Methocology of Grounded Theory

Theoretical Sensitivity: Advances in the Methocology of Grounded Theory

Glaser, B. G. 1978 The Theoretical Sensitivity: Advances in the Methodology ofGrounded Theory. Mill Valley: The Sociology Press.


グラウンデッド・セオリー・アプローチの実践―質的研究への誘い

グラウンデッド・セオリー・アプローチの実践―質的研究への誘い

木下康仁 1999『グラウンデッド・セオリー・アプローチ −質的実証研究の再生−』弘文堂。


Qualitative Analysis for Social Scientists

Qualitative Analysis for Social Scientists

Strauss, Anselm L. 1987 Qualitative Analvsis for Social Scientists. Cambridge: Cambridge University Press.


質的研究の基礎―グラウンデッド・セオリー開発の技法と手順

質的研究の基礎―グラウンデッド・セオリー開発の技法と手順

  • 作者: アンセルム・ストラウス,ジュリエット・コービン,操華子,森岡崇
  • 出版社/メーカー: 医学書院
  • 発売日: 2004/12
  • メディア: 単行本
  • 購入: 1人 クリック: 2回
  • この商品を含むブログ (6件) を見る

Strauss, Anselm L. and Corbm, J. 1990 Basics of Qualitative Research: Grounded Theory Procedures and Techniques. London, Thousand Oaks, New Delhi: Sage. (南裕子監訳1999 『質的研究の基礎1 -グラウンデッド・セオリーの技法と手順』医学書院。 )


Basics of Qualitative Research: Techniques and Procedures for Developing Grounded Theory

Basics of Qualitative Research: Techniques and Procedures for Developing Grounded Theory

Strauss, Anselm L. and Corbin, J. 1998 Basics of Qualitative Research: Techniques and Procedures for Developing Grounded Theory(2nd ed.). London, Thousand Oaks, New Delhi: Sage.Tesch, R. 1990 Qualitative Research: Analvsis Tvpes and Software Tools. New York: The Palmer Press.

  • 黒岩祥太2002 「社会学におけるテクストマイニングの展開」現代社会理論研究会『現代社会理論研究』 12、 358-367.
  • 佐藤裕1993 「部落問題に関する「表現」の構造-人権意識調査の自由回答項目の計量分析」 『解放社会学研究』 7、 63-86.
  • 佐藤裕1999 「AUTOCODEプログラムについて」川端亮編『非定型データのコーディング・システムとその利用』平成8-10年度科学研究費補助金(基盤研究(A) (1))研究成果報告書(課題番号08551003) , 11-29.