メインコンテンツに移動
クロト社 糸瀬 に投稿

HORIZON Expert Interview リアルワールドデータの現在地

メディカルアフェアーズ情報

オンコロジーメディカルアフェアーズについて

オンコロジーメディカルアフェアーズについて

HORIZON(リアルワールドエビデンス)

HORIZON(リアルワールドエビデンス)
HORIZON リアルワールドエビデンスとは
HORIZON Expert Interview リアルワールドデータの現在地 トップページ
Expert Lecture 多発性骨髄腫のリアルワールドエビデンスの重要性

臨床研究データ共有

臨床研究データ共有
大腸癌患者を対象とした臨床研究「PARADIGM試験」
画像(PC)
リアルワールドデータ研究の実施・解釈における科学的考察のポイント
画像(SP)
リアルワールドデータ研究の実施・解釈における科学的考察のポイント

 

リアルワールドデータ研究におけるデータソースの選択

適格基準や除外基準を定義して実施される臨床試験とは異なり、リアルワールドデータ(RWD)には多様な患者情報が含まれていることから、RWD研究ではリサーチクエスチョンの検討に適した対象を明確に定義し、一般化可能性を踏まえたうえで、それに適したデータソースを選択する必要があります。

 

――データソースの種類

現在、RWD研究に用いられているデータソースには、患者/疾患レジストリのほか、電子カルテ情報、行政請求情報、患者から直接収集された患者報告アウトカムなどがあります。また、既収集された臨床試験/研究データを二次的に用いるなど、ad-hocに収集されたデータや、WHO VigiBaseのような医薬品有害事象の自発報告システムで得られた情報もデータソースとして考えることができるでしょう。

今後は、ウェアラブル端末から得られるようなバイオセンサーのデータや画像情報、ソーシャルメディア情報の活用なども期待されるところです。

 

――設定の確認

疾患レジストリであれば、運営組織や参加施設、調査項目、蓄積症例数、登録率、品質管理、透明性など、電子カルテデータであれば、疾患の発症頻度や近医との連携診療など、解析に影響を及ぼすデータベースの設定をていねいに確認し、解析の目的や対象に合ったデータソースを選択することが肝要です。

たとえば、データソースとして電子カルテ情報を用いる場合、ここには治療に関するすべての情報が含まれていると捉えられがちですが、患者さんは複数の医療機関を受診しているケースも多く、併用薬や他の疾患の治療などの情報が網羅されていないこともあり得ます。

 

――複数のデータソースの活用

RWD研究では、複数のデータソースを用いた解析も可能であり、たとえば人口動態調査やがん統計といった他の調査で報告されている推定値との比較方法を含み、複数のデータソースを用いての研究も実施され得ます。また、データソース間で患者の重複がなければデータのアペンド(追加)、同一患者を特定できる場合にはデータのリンケージにより、異なるデータソース間でデータを連携して解析できることもあります。

 

研究デザインや統計解析におけるピットフォール

――起算日の設定

RWD研究において時間解析を実施する際に注意したいのが「起算日」の設定です。どの時点から評価を開始するかが明確な前向きの臨床試験とは異なり、RWDを用いる場合には「いつから観察して、何を評価するのか」を明確にし、各データベースの特徴をよく理解したうえで、適切な起算日を選択しなくてはなりません。

たとえば、日本造血細胞移植データセンター(JDCHCT)が運用する造血細胞移植レジストリの場合、診断日や診断時疾患情報、移植前治療内容などの情報が収集されていることから、診断日を起算日とした時間解析により、移植前治療の効果を評価できると考えてしまうかもしれません。しかしながら、本レジストリには移植を実施した患者のみが登録されており、たとえば急性骨髄性白血病として診断されている患者のうち移植を行わなかった患者は登録対象外のため造血細胞移植レジストリには含まれていないため、診断日を起算日とした時間解析は不適切です(図1)。したがって、本レジストリを用いて時間解析を行う場合には、「移植日」や「移植後2年(2年以上の非再発生存者を対象とした場合など)」などを起算日として設定する必要があります1)

図1|造血細胞移植レジストリにおける起算日の設定

画像(PC)
図1 造血細胞移植レジストリにおける起算日の設定
本文

日本造血細胞移植データセンター 熱田 由子先生ご提供

――時間固定変数と時間依存変数

RWD研究に用いられる変数は、起算日の時点で値が明らかな「時間固定変数」と起算日以降に起こる項目を扱う「時間依存変数」に分けられ(表1)、扱う変数がどちらに該当するかを正しく判断し、それに合った解析手法を用いなければなりません2)

表1|固定時間変数と時間依存変数の例

画像(SP)
図1 造血細胞移植レジストリにおける起算日の設定
本文

日本造血細胞移植データセンター 熱田 由子先生ご提供

――時間固定変数と時間依存変数

RWD研究に用いられる変数は、起算日の時点で値が明らかな「時間固定変数」と起算日以降に起こる項目を扱う「時間依存変数」に分けられ(表1)、扱う変数がどちらに該当するかを正しく判断し、それに合った解析手法を用いなければなりません2)

表1|固定時間変数と時間依存変数の例

画像(PC)
表1 固定時間変数と時間依存変数の例
本文

日本造血細胞移植データセンター 熱田 由子先生ご提供

たとえば、慢性移植片対宿主病(GVHD)の発現が同種造血細胞移植後の全生存期間(OS)に与える影響を評価したいと考えた場合に、慢性GVHDは起算日(移植日)以降に生じる時間依存変数であるにもかかわらず、時間固定変数として扱い「慢性GVHDが移植日にわかっていた情報として慢性GVHDの有無により患者を2群に分けて移植日からのOSを比較する」という解析が行われると、誤った結果が導かれてしまいます(図2)。

図2|変数を扱う際のピットフォール

画像(SP)
表1 固定時間変数と時間依存変数の例
本文

日本造血細胞移植データセンター 熱田 由子先生ご提供

たとえば、慢性移植片対宿主病(GVHD)の発現が同種造血細胞移植後の全生存期間(OS)に与える影響を評価したいと考えた場合に、慢性GVHDは起算日(移植日)以降に生じる時間依存変数であるにもかかわらず、時間固定変数として扱い「慢性GVHDが移植日にわかっていた情報として慢性GVHDの有無により患者を2群に分けて移植日からのOSを比較する」という解析が行われると、誤った結果が導かれてしまいます(図2)。

図2|変数を扱う際のピットフォール

画像(PC)
図2 変数を扱う際のピットフォール
本文

日本造血細胞移植データセンター 熱田 由子先生ご提供

――変数がアウトカムに及ぼす影響(交絡因子の調整)

注目する変数がアウトカムに及ぼす影響について評価する際、RWDは臨床試験のように計画されて収集されたデータではないため、注目する変数とアウトカムの双方に影響を与える交絡因子を調整する必要があります。たとえば、造血細胞移植の移植前処置強度がOSに与える影響を評価する際、移植時の患者年齢は、OSと前処置強度の両者に対して影響を及ぼすため、交絡因子として扱います。交絡因子の調整方法としては、研究デザインの面では背景因子をマッチさせた患者群の選択、解析手法では他の変数との交互作用を考慮した多変量解析などが用いられます(図3)。

図3|交絡因子とその調整法の例

画像(SP)
図2 変数を扱う際のピットフォール
本文

日本造血細胞移植データセンター 熱田 由子先生ご提供

――変数がアウトカムに及ぼす影響(交絡因子の調整)

注目する変数がアウトカムに及ぼす影響について評価する際、RWDは臨床試験のように計画されて収集されたデータではないため、注目する変数とアウトカムの双方に影響を与える交絡因子を調整する必要があります。たとえば、造血細胞移植の移植前処置強度がOSに与える影響を評価する際、移植時の患者年齢は、OSと前処置強度の両者に対して影響を及ぼすため、交絡因子として扱います。交絡因子の調整方法としては、研究デザインの面では背景因子をマッチさせた患者群の選択、解析手法では他の変数との交互作用を考慮した多変量解析などが用いられます(図3)。

図3|交絡因子とその調整法の例

画像(PC)
図3 交絡因子とその調整法の例
本文

日本造血細胞移植データセンター 熱田 由子先生ご提供

また、解析手法の特性にも配慮が必要であり、たとえば多変量解析で用いられるCox比例ハザードモデルは、比例ハザード性(時間によらずハザード比が一定であること)を前提とした解析手法です。したがって、この条件が成立しない場合には、層別化解析や注目する変数の条件が変化した時点(たとえば移植後1年未満と1年以上など)で区切って解析を行うなどの工夫も求められます。
 解析結果のプレゼンテーションは、誤解を招くようなものであってはならないので、十分に検討する必要があります。図3のようなものを因果関係図といいますが、1つのモデルから得られる暴露と交絡因子の影響を理解するのに有用です3)

 

――バイアスに関する検討

RWD研究で注意したいバイアスは、大きく「選択バイアス」と「情報バイアス」に分けられ、前者については、紹介バイアス(ある特定の患者だけしか含まれていないことによるバイアス)や自己選択バイアス(研究への参加が参加者により選択されることで、参加者と非参加者の間に生まれるバイアス)のほか、データが完全な症例のみを用いた解析もデータが不完全な症例の除外に伴うバイアスを生じる可能性があります4)。一方、情報バイアスについては、測定エラーや誤分類、データの欠測、定期健診の有無などによる監視/検出バイアスのほか、RWD研究ではimmortal timeバイアス(無イベント生存期間が存在することによるバイアス、図2)も見落とされやすいため注意が必要です。

 

おわりに

ここまで示したように、RWD研究から質の高いリアルワールドエビデンス(RWE)を生み出すためには、数多くの変数、交絡因子、バイアスなどをていねいに検討しながら、適切に対処していくことが求められます。解析に影響を及ぼす因子は多く、これらの作業には苦労も伴いますが、こうした検討や議論の過程から新たなリサーチクエスチョンが生まれ、より深い研究へとつながることが多いのもRWD研究の特徴だと思います。また、類似の研究であっても、医療環境や社会的な背景が変化すれば異なる結果が得られることもあり、長期的に解析を続けながら、数多くのRWEを創出することができるという利点もあります。臨床医にとって、常にクリニカルクエスチョンをもちながら、その答えを求め続けていくことは重要であり、その解決の手法の1つとしてRWD研究は大きな役割を担うと考えています。

画像(SP)
図3 交絡因子とその調整法の例
本文

日本造血細胞移植データセンター 熱田 由子先生ご提供

また、解析手法の特性にも配慮が必要であり、たとえば多変量解析で用いられるCox比例ハザードモデルは、比例ハザード性(時間によらずハザード比が一定であること)を前提とした解析手法です。したがって、この条件が成立しない場合には、層別化解析や注目する変数の条件が変化した時点(たとえば移植後1年未満と1年以上など)で区切って解析を行うなどの工夫も求められます。
 解析結果のプレゼンテーションは、誤解を招くようなものであってはならないので、十分に検討する必要があります。図3のようなものを因果関係図といいますが、1つのモデルから得られる暴露と交絡因子の影響を理解するのに有用です3)

 

――バイアスに関する検討

RWD研究で注意したいバイアスは、大きく「選択バイアス」と「情報バイアス」に分けられ、前者については、紹介バイアス(ある特定の患者だけしか含まれていないことによるバイアス)や自己選択バイアス(研究への参加が参加者により選択されることで、参加者と非参加者の間に生まれるバイアス)のほか、データが完全な症例のみを用いた解析もデータが不完全な症例の除外に伴うバイアスを生じる可能性があります4)。一方、情報バイアスについては、測定エラーや誤分類、データの欠測、定期健診の有無などによる監視/検出バイアスのほか、RWD研究ではimmortal timeバイアス(無イベント生存期間が存在することによるバイアス、図2)も見落とされやすいため注意が必要です。

 

おわりに

ここまで示したように、RWD研究から質の高いリアルワールドエビデンス(RWE)を生み出すためには、数多くの変数、交絡因子、バイアスなどをていねいに検討しながら、適切に対処していくことが求められます。解析に影響を及ぼす因子は多く、これらの作業には苦労も伴いますが、こうした検討や議論の過程から新たなリサーチクエスチョンが生まれ、より深い研究へとつながることが多いのもRWD研究の特徴だと思います。また、類似の研究であっても、医療環境や社会的な背景が変化すれば異なる結果が得られることもあり、長期的に解析を続けながら、数多くのRWEを創出することができるという利点もあります。臨床医にとって、常にクリニカルクエスチョンをもちながら、その答えを求め続けていくことは重要であり、その解決の手法の1つとしてRWD研究は大きな役割を担うと考えています。

本文

1)JP Klein, et al. Bone Marrow Transplant 2001; 28(10): 909-915.
2)JP Klein, et al. Bone Marrow Transplant 2001; 28(11): 1001-1011.
3)Westreich D, et al. Am J Epidemiol 2013; 177(4): 292-298.
4)Rothman KJ, et al. Modern epidemiology Third Edition. Wolters Kluwer Health/Lippincott Williams & Wilkins, 2008, p758.