クラスター分析を行い新型コロナワクチンの有害事象--VAERSデータから--

例によって、某所で書いたものです。
私の所属する団体とは関係ないことは、事前にお伝えしておきます。
各種データおよびPythonでの処置(ipynbファイル)はご希望あれば、ご連絡ください。


背景

 ワクチン、特に新型コロナワクチンの副反応(正確には有害事象)の問題は社会現象になりやすい。感染症には有効で有害事象はゼロというワクチンは今まで無かったし、今後も存在しないであろう。ワクチンのリスクがゼロでない以上、モニタリングは必須のシステムである。
 アメリカではワクチン安全関心システムとして、受動的モニタリングでシグナルを検知するVAERS(Vaccine Adverse Event Reporting System),能動的なモニタリングをして因果関係を評価するVSD(Vaccine Safety Datalink),そして科学的根拠に基づき予防接種後の推奨を行うACIP(Advisory Committee on Immunization Practices)などが相補的に機能している。 [紙谷, 2021]

 VAERSは予防接種後の有害事象の自発的報告を受けて解析する機構であり、ワクチン非接種者のみならず第三者でもレポートが可能である。また、一定の疾患については報告義務がある。そのため、比較的迅速なシグナル検出が可能であり、稀な有害事象も検出可能である。バイアスが多く因果関係の検討はできないものの報告数は膨大であり、リアルワールドデータ(RWD)とも呼べるビッグデータである。

 今回、2022年に報告されたVAERSのデータ [VAERS, 日付不明]から新型コロナワクチンで報告された有害事象の有無を抽出し、k-means法を用いてクラスター分析を行うこととした。

分析手法

 VAERSに報告された症状については決められた方式はなく銘々で行われるため、そのままデータとして用いるのは適当ではない。「分析可能な形」に前処理する必要がある。こちらのサイト [CHERT_HOLLOW, 2021](以下引用元サイト)を参考にして有害事象を抽出することにした(引用元サイトのデータは2021年のものを使用している)。
 引用元サイトの処理はRで行われていたため、逐次Pythonのプログラムに変換して行った。引用元サイトでは、任意の病名をピックアップして”symptomsOfInterest”というデータフレームを作っているが、今回はトップ50の症状をピックアップし、さらにそこから以下に述べる取捨選択を行い、症状のデータフレームを作成した。
 引用元サイトでは”COVID-19 immunisation”を”not symptom”として症状リストから外しているが、誤投与と思われる項目も本来の有害事象とはいい難いため削除した。
 'SARS-CoV-2 test positive'、'SARS-CoV-2 test'、'Vaccination failure'、'Vaccine breakthrough infection'、および'Drug ineffective'は新型コロナウイルスの感染と考えられ、'COVID-19'と同義だと思われる。そのため全てを’COVID-19’に置換した。
 また引用元サイトでは症状の有無をTrue/Falseで表していたが、データとして処理するために1/0のダミー変数に変換した。
 クラスター分析についてVIF(分散拡大要因 Variance Inflation Factor)をつかって多重共線性を検討した、VIFが5以上であれば多重共線性がデータを歪めている可能性があるが、最高でも2.56なので調整はしなかった。エルボー法及びシルエット法でクラスター数を検討した。最適なクラスター数はそれぞれ3及び2であったが後述する理由で対象を広げ、クラスター数を2-7つにした場合のクラスター分析を行った。
 クラスター分析を行った後、それぞれのクラスターごとの各変数の平均値を算出し、平均値以上のものをハイライトし、エクセルファイルおよびPDFで保存した。

分析結果

 すべての症状の元々の数値が症状の有無を表す1/0であり、平均値のみで比較ができる。つまり、平均値が1の場合は、そこのクラスターに属するほぼ全ての人がその症状を報告したことになる。平均値以上の数値がでた症状をクラスターごとに比較した。平均値以上のものは列挙するに留める。

2つのクラスター Table 1

  • Cluster 0 : 疲労・頭痛・有害事象なし・痛み・四肢の痛み・発熱。
  • Cluster 1: 無力症・COVID-19感染・咳・死亡・呼吸困難・疲労・頭痛・倦怠感・咽頭痛・痛み・発熱。

3つのクラスター Table 2

  • Cluster 0: 有害事象なしのみ。
  • Cluster 1: COVID-19感染・咳・死亡・呼吸困難・発熱。COVID-19の平均値は1であり、かなり関連は強い。
  • Cluster 2: 関節痛・無力症・血液検査・COVID-19感染・胸痛・悪寒・咳・めまい・呼吸困難・疲労・異常な感覚・頭痛・接種部の痛み・疲労・筋肉痛・嘔気・咽頭痛・痛み・四肢の痛み・発熱。COVID-19の平均値は0.234であり、弱い関連である。

4つのクラスター Table 3

  • Cluster 0: 有害事象なしのみ。
  • Cluster 1: COVID-19感染(平均値は0.900)および関連する疾患だった。
  • Cluster 2: 接種部位の痛みや胸痛など、副反応を疑わせるグループである。
  • Cluster 3: COVID-19感染(同1)のみ。

5つのクラスター Table 4

  • Cluster 0: 平均値を上回る症状なし。
  • Cluster 1: COVID-19感染および、随伴症状と思われる症状。
  • Cluster 2: COVID-19感染(同1)のみ。ただし、平均値以下ではあるが、死亡の割合が各グループで最も高かった (0.0816) 。
  • Cluster 3: 痛み(同1)および接種部位の痛み・関節痛・紅斑など、副反応を疑わせる症状であった。胸痛も報告されている。
  • Cluster 4: 有害事象なし(同1)のみ

6つのクラスター Table 5

  • Cluster 0: ワクチンの副反応を疑わせる。
  • Cluster 1: 平均値を上回る症状なし。
  • Cluster 2: 有害事象なし(同1)のみ。
  • Cluster 3: COVID-19感染(同1)のみ。死亡の平均値が各グループで一番高い (0.0789) 。
  • Cluster 4: COVID-19感染(同 0.947)および随伴症状。
  • Cluster 5: COVID-19感染(同 0.103)および随伴症状。

考察

 VAERSは一定の疾患については報告義務があるものの、第三者からのどんな症状も報告が可能である。そのため「有害事象なし」という報告もワクチン接種とは関係のない有害事象も報告が可能である。そもそも有害事象とは薬物を投与された後に生じる好ましくないまたは意図しないあらゆる医療上の事柄であり、因果関係は問わないものである。
 そのため、有害事象と真の副反応を峻別する必要がある。また、「有害事象なし」や真の副反応、及びCOVID-19感染など、VAERSの報告はいくつものカテゴリに分かれる可能性がある。
 つまりクラスターは少なくとも4つに分かれる可能性がある(COVID-19感染、真の副反応、有害事象なし、真の副反応以外の有害事象)。そのため、エルボー法やシルエット法では最適と思われるクラスター数は2-3であったが上記の理由により、7つまで対象を広げて検討した。
 クラスター数が2-4つまでは、感染・副反応など上記の4つのカテゴリが混在しているように見られた。クラスター数が5つの場合は、それぞれクラスター順に、真の副反応以外の有害事象、COVID-19感染、COVID-19感染及び死亡など重症化の傾向、ワクチンの真の副反応、および、有害事象なしと分類できたと推察される。胸痛など、副反応としての心筋炎を疑わせる症状もあり、年齢・性別のグループで解析すれば、更に細かい情報が得られるであろう。

画像の説明

 6つではCOVID-19感染および似たような随伴症状のグループが2つグループできたが、COVID-19感染のクラスター分析は今回の課題から外れるため、7つでの考察は行っていない。
 なお、クラスター分析はグルーピングすることはできるが、因果関係を調べることはできない。5つのクラスター分析でCOVID-19感染及びCOVID-19感染と死亡のグループが報告されているが、コロナワクチンで感染のリスクが上がるとか死亡者が増えるというエビデンスは報告されていない。 [CDC, 2023]また、いわゆる「ターボ癌 turbo cancer」と思われるクラスターは確認できなかった。
 今回新型コロナワクチンのアメリカでの有害事象報告(VAERS)のデータで、有害事象のクラスター分析を行った。今回の限界として、データの質(VAERSは能動的なデータ収集を積極的にしない)・分析手法(因果関係は解析でない)、外部の検証(妥当性)などがあった。今後はVAERSおよび連携システムを参考にしながらも、より能動的なモニタリングシステムの構築およびRWDの提供が必要になってくるだろう。

引用文献

CDC. (2023年7月23日). Selected Adverse Events Reported after COVID-19 Vaccination. 参照日: 2023年8月6日, 参照先: https://www.cdc.gov/coronavirus/2019-ncov/vaccines/safety/adverse-events.html
CHERT_HOLLOW. (2021年3月26日). VAERS data preprocessing, Version 11. 参照日: 2023年8月6日, 参照先: R · COVID-19 World Vaccine Adverse Reactions: https://www.kaggle.com/code/jmreuter/vaers-data-preprocessing/notebook
VAERS. (日付不明). Download Data File (2022VAERSData.zip). 参照日: 2023年8月6日, 参照先: https://vaers.hhs.gov/eSubDownload/index.jsp?fn=2022VAERSData.zip
紙谷聡. (2021年7月19日). 米国における予防接種安全性モニタリングシステムの実際. 参照日: 2023年8月6日, 参照先: 医学書院: https://www.igaku-shoin.co.jp/paper/archive/y2021/3429_02