井出草平の研究ノート

新型コロナのフェイク情報はリツイートされにくい

新型コロナ関連のTwitterの分析。International Sociologyの論文。

journals.sagepub.com

インフォデミック

COVID-19アウトブレイクは、公衆衛生上の緊急事態であると同時に、インフォデミックでもあるとされる。WHOは、SARS-CoV-2ウイルスに起因するパンデミックの脅威に加えて、この問題について利用可能な大量の情報と、偽りの情報から真実の情報を選別することの難しさによって、疫病が発生していると宣言した(WHO, 2020)。

インフォデミックはCOVID-19で初めて現れたわけではない。健康の分野でよく見られる(Wang et al.,2019)。予防接種(Betsch, 2017; Hotez, 2016)と感染症(Fung et al. 研究では、このような文脈での虚偽の情報の拡散が、反ワクチン運動によって引き起こされるような公衆衛生に深刻な結果をもたらす可能性があることがわかっている(Scheufele and Krause, 2019)。

Allcott et al.(2019)は、2016年のアメリカ大統領選挙以降、両ソーシャルネットワークがプラットフォーム上でのこのようなコンテンツの拡散を制限するために導入したアルゴリズムやポリシーの変更を経て、2015年と2016年の間にFacebookTwitterで行われたフェイク情報の流通を分析した。彼らの調査結果によると、2016年の大統領選挙前には、フェイクニュースとのインタラクションが着実に増加していた。しかし、その1ヶ月後には、Facebookではフェイクニュースとのインタラクションが半分以上に減っていたのに対し、Twitterではそのようなインタラクションが増え続けてたという。

リサーチクエスチョン

RQ1:虚偽の情報を含むツイートはどれくらいありますか?これらのツイートのRT数は?
RQ2: 偽りの情報を論破するツイートは何個ありますか?これらのツイートのRT数は?
RQ3: 科学的な情報に基づいたツイートはいくつあるか?これらのツイートのRT数は?
RQ4:結果のインプリケーションは?

データ収集

基準1. 最初の基準は、ソーシャルメディアのソースを選択することである。本研究では、この特定のソーシャルメディア上での虚偽情報の拡散が世界的に懸念されていることから、Twitterを選択した。
基準2. ハッシュタグではなくキーワードの選択をした。今回は、このキーワードを含むツイートを検索するために、「コロナウイルス」というキーワードを選択した。このオプションは、ハッシュタグ「#coronavirus」を持つツイートも含まれるため、より包括的になる。
基準3. ツイートが公開された期間。利用可能なすべての言語で、2020年2月6日と7日に公開されたツイートを選択した。
基準4. 使用したソフトウェア。NVivoを用いて抽出した。
基準5. より多くのRTを持つ1000のツイートを選択。定義された日のTwitterの全サンプルを取得した後、人々からの注目度が高いものを分析するために、RTの多い1000ツイートを抽出した。

NVivoというのはこのツールのようだ。
www2.usaco.co.jp

結果

虚偽情報(RQ1)は92%のメッセージが該当した。その中には、フェイクニュース、噂、神話、陰謀論などが含まれていた。例えば、ウイルスが生物兵器であることを指摘するツイートや、ウイルスに感染して突然倒れたり、発作を起こしたりする映像や画像を含むメッセージなどである。また、全体に占める虚偽の情報を含むツイートの割合は10.62%と低い(表2)。これらの結果は、彼らのデータについて、2016年中にFacebook上のほとんどのユーザーがフェイクニュースを共有していなかったことを指摘したGuess et al.(2019)の知見と一致している。

f:id:iDES:20201012022531p:plain

事実確認のためのツイート(RQ2)は、2%のツイートが、事実や科学的根拠に基づいた情報を提供することで、虚偽の情報を論破することを目的としたものであった。このカテゴリーのツイートは、ツイートされたものよりもリツイートされたものの方が13,000倍近く多かった(表2)。リツイートされた事実確認のメッセー表2ジには、一般的なインフルエンザとコロナウイルスに関する誤解を招くような事実に挑戦するツイート、誤った症例の確認、怪しげな治療法の論破、香港クルーズとウイルスの起源に関する噂、誤解を招くような画像の特定などが含まれていた。

科学的根拠に基づいた根拠(RQ3)は、事実確認のツイートの約9%が科学的根拠に基づいた根拠を含んでいた(表4)。これらのツイートは、リツイートされる可能性が約3000倍であった(表2)。このカテゴリでリツイートされたメッセージには、マスクの適切な着用方法に関する情報、予防と制御対策に関する意識を広めるための情報、コロナウイルスとは何か、この病気の症状、感染、合併症に関する情報、ウイルスの完全なゲノム、実験中の抗ウイルス薬への言及、中国での検出例と非検出例の割合、米国の医療システムが薬や供給のために中国に不健康に依存していること、この新しいウイルスの検査キットに関する情報、確認された症例、ウイルスの突然変異などが含まれていた。

インプリケーション

すべて偽情報を含むツイートの割合は10.62%、一部フェイクが含まれるものは63.38%と多いことがわかった。しかし、リツイートはすべてフェイク情報は600(RT/T)であり、すべて正しい情報は1227(RT/T)であり、フェイク情報はリツイートされない傾向にあることが分かった。

2014年8月にWHOがエボラ発生を国際的に懸念される公衆衛生上の緊急事態として宣言した後、ソーシャルメディアTwitterと微博)上の情報のほとんどは、アウトブレイク関連のニュースと科学的な健康情報であり、そのほとんどは公衆衛生機関が発信した情報を報告する報道機関からのものであることが明らかになった(Fung et al., 2016)。これら2つのソーシャルネットワークは、世界保健緊急事態の発表直後にWHOからの重要なメッセージ(すなわち、エボラの予防と制御に関する現在の科学的理解)を広めるのに役立ち、これらのソーシャルメディアエボラウイルスの伝播を制御する努力において重要な役割を果たしたことを示唆しているという(Fung et al., 2016)。

COVID-19アウトブレイクでもエボラの時と同じように、フェイク情報よりも正しい情報の方が流通する傾向がみられたと著者らは述べており、下記のように主張が述べられている。

インターネットとWeb2.0.は、市民がコンテンツにアクセスし、制作し、交流する方法を民主化してきた。しかし、このような民主化を進めるためには、利用者が科学的知識にアクセスできるだけでなく、情報を批判的に評価し、有効なコンテンツと虚偽のコンテンツを見分ける能力が必要である。このような観点から、利用者がエビデンスに基づいた情報にアクセスし、虚偽を否定するために必要なスキルを身につけるための予防的な教育介入に焦点を当てた研究が今後も行われるべきである。

論文中ではあまり触れられていないが、問題なのは、フェイクと真実が混じったツイートで1122(RT/T)であるように思う。玉石混交の情報はすべて正しい情報(1227, RT/T)と同じ程度リツイートされている。Twitterといわず、現実世界でも、まったくデタラメな情報よりも、一部、真実が混じったフェイク情報の方が信じてしまう傾向があるだろう。チェーンメールの類も真実を混ぜた方が流行すると言われている。対処すべき課題というのは、おそらくこちらなのだろう(どうやったらいいか分からないけど)。