YAKUGAKU ZASSHI 135(6) 793―808 (2015)  2015 The Pharmaceutical Society of Japan

793

―Review―

バイアスと交絡医療情報データベースを使った薬剤疫学研究 野尻宗子

Bias and Confounding: Pharmacoepidemiological Study Using Administrative Database Shuko Nojiri Juntendo Clinical Research Support Center; 211 Hongo, Bunkyo-ku, Tokyo 1138421, Japan. (Received January 17, 2015; Accepted February 10, 2015) The provision of health care frequently creates digitalized data such as hospital-based electronic data, medication prescription records, and claims data collectively termed ``administrative database research''. The data source and analytical opportunities for study create risks that can lead to misinterpretation or bias the results. This review serves as an introduction to the concept of bias and confounding to help researchers conduct methodologically sound pharmacoepidemiologic research projects using administrative databases. Beyond general considerations for observational study, there are several unique issues related to database research that should be addressed. The risks of uninterpretable or biased results can be minimized by: providing a robust description of the data tables used; focusing on why and how they were created; measuring and reporting the accuracy of diagnostic and procedural codes used; and properly accounting for any time-dependent nature of variables. The hallmark of good research is rigorously careful analysis and interpretation. The promise for value of real world evidence using databases in medical decision making must be balanced against concerns related to observational inherited limitations for bias and confounding. Researchers should aim to avoid bias in the design of a study, adjust for confounding, and discuss the eŠects of residual bias on the results. Key words―bias; confounding factor; database; epidemiology; pharmacoepidemiology

1.

緒言

これらの手法では,情報収集に時間がかかること

医薬品の安全性や有効性に関する課題を検討する

と,データマネージメントが煩雑になる点がしばし

手段としては,介入を要するランダム化臨床試験

ば問題となり得る.これらの問題を克服する 1 つの

(randomised clinical trial; RCT)や介入を要しない

手段として,短時間でデータを入手するには医療情

観察研究によるアプローチがある.また,単独の研

報データベースを活用する手段があり,海外では

究だけでなく,過去の臨床試験や観察研究を統合分

データベースを使用した観察研究が数多く報告され

析するメタ解析などの手段もある. RCT は医薬品

ている.1) U.S. Food and Drug Administration

の有効性・安全性を評価する上では大変有用である

( FDA )は統合された情報システムを Sentinel Ini-

が,厳しい登録・除外基準の下で行われるので,試

tiative にて構築し,医薬品の安全性監視の国家戦略

験に含まれないような高齢者や様々な合併症を伴う

に用いる試みを行っている.2)

日常診療の状況を完全に反映していないこともあ

一方,日本における薬剤疫学分野における医療情

る.なにより倫理面の観点から,安全性評価の目的

報データベースの利用の現状を振り返ると,平成

で RCT を用いることは困難である.

18 年度の医療制度改革で「老人保健法」が改正後,

一方,通常の観察研究では臨床試験で得られない

平成 20 年より「高齢者の医療の確保に関する法律」

ような日常臨床下のデータを収集でき,調査票ある

が施行された.現在では,医療情報データベースの

いは面談形式によって情報収集されることが多い.

1 つである「ナショナルデータベース」3)の使用が可

能となっており,公益性の高い研究であれば個別審 順天堂大学臨床研究支援センター(〒1138421 東京都 文京区本郷 211) e-mail: s-nojiri@juntendo.ac.jp

査を経た上でデータが研究者へ提供されるように なった. 大規模データベースを用いた研究の大きな利点と

794

YAKUGAKU ZASSHI

Vol. 135 No. 6 (2015)

しては,通常の臨床試験では除外される可能性の高

Health's NIHR Research Capability Programme

い患者(高齢者や小児など)も含まれている(代表

(RCP)を組み合わせた Clinical Practice Research

性を有している),サイズが大きいので稀なイベン

Datalink12) や The Health Improvement Network

トの評価に耐え得る,データ入手までのタイムラグ

(THIN)13)などが知られている.

が短い,総コストが安価であることなどが挙げられ

医療情報データベースの選択基準については,カ

る.一方では,臨床所見の詳細な記録や検査値など

バーしている集団,データ内容,継続的なデータ収

が欠落していることもある.データベース研究は観

集がされているか,興味あるイベントリスクを評価

察研究の 1 つであることからバイアス,交絡の影響

するための潜伏期間( latency period )があるかな

も受け易く,その特性や限界を熟知した上で研究を

どを考慮する必要がある.14) これらデータベースを

実施することが求められる.本稿では,データベー

用いた研究は十分な疫学等の基礎知識を有していて

ス研究におけるバイアス,交絡を概説し,医療情報

も,実施には倫理的,医学・科学面から克服するべ

データベースを使った薬剤疫学研究を実施する上で

きことは多く,そのためデータベース使用のガイド

の対処方法とその課題を論じる.ただし,解析手法

ラインやその留意点を明記したチェックリストもい

の詳細を説明することを本稿の目的としていないた

くつか公表されている.1517)

め,別に紹介する文献や成書を参照されたい. 2.

日本では国民皆保険制度の下で「ナショナルデー タベース」が保険加入者の全データをカバーし,研

医療情報データベースとは

医療情報データベースは,自動化されたシステム

18) 公用の 究目的での使用も一部が許可されている.

で医療情報を収集して得られたデータ3)であり,そ

ナショナルデータベース以外には民間レベルの様々

の歴史は 1980 年まで遡ることができる.医療情報

な商用データベースもある.それらの商用データ

データベースの成り立ちや歴史について Strom ら1)

ベースには,医療事務や医事会計で使われるレセプ

がまとめており,本稿では割愛する.医療データ

トデータベース(主に医科レセプト・調剤レセプト

ベースには,保険請求を目的として蓄積されたも

を含む),検査・処置のオーダー記録,臨床データ

の,各病院で保有している電子媒体の医療情報,糖

値なども含まれているものもあり,木村らがその詳

尿病などの個別疾患毎の疾患レジストリーなどがあ

細について紹介しており,本稿では個別のデータ

る.データベース研究を実施する上では,各国の社

ベースの特徴については割愛する.19)

会保障制度の仕組み・データ取得目的・対象集団の

米国では,レセプトデータはがん登録など他の

違いなどにより,データベースの内容や質が異なる

データと連結がされている場合が多く,薬剤と疾患

ことに留意しなければならない.

発生との関連性を評価する薬剤疫学研究に用いるこ

保険請求データベースとしては,米国には政府保

とができる.日本では個人情報保護の観点から,他

4) がん登録と保険請求データ 有の Veterans AŠairs,

の疾患レジストリーなどとのリンケージは行われて

5) 民間保険 ベースをリンクさせた SEER-Medicare,

いない.さらに,データベースの整備自体も諸外国

会 社 Health Maintenance Organization ( HMO ) の

に比べて遅れており,そのためにデータベース研究

6) 公 的 医 療 保 険 制 度 network ,

自体に大きな限界があり,研究もそれほど進んでい

HMO

research

Research

ない.薬剤疫学研究を医薬品リスク管理計画におけ

and Manufacturers of America (PhRMA:米国研究

る安全性評価に対して用いる機運は日本においても

製薬工業協会) と FDA とのパートナーシップの下,

盛んになってきており,様々な環境が整った近い将

Foundation for the National Institutes of Health

来,薬剤疫学研究は社会にとって必須になることが

(FNIH)により設立された Observational

想定される.しかしながら,薬剤疫学研究は観察研

8) Pharmaceutical Medicare7) ・ Medicaid ,

Outcomes Partnership

Medical

(OMOP)9)などがある.

米国以外では,カナダ Saskatchewan 州の Health Services

10) Databases ,

データベース

オランダの薬剤処方情報の

11) PHARMO,

英国の General

Prac-

tice Research Database (GPRD)と Department of

究の 1 つであり,バイアスや交絡などの影響を受け 易く,単一のデータベースの研究結果から最終結論 を導くことは避けなければならないだろう. 3.

疫学研究での関連と因果

データベース研究も二次データを使った疫学研究

Vol. 135 No. 6 (2015)

YAKUGAKU ZASSHI

Fig. 1.

795

Association versus Causation

Reproduced from Ref. 20).

である.疫学研究の目的の 1 つは,曝露(薬剤の投

が共通の原因であるときに,曝露とアウトカムの関

与など)とイベント発症の間の「因果関係(causa-

係は交絡を起こしていると考える.例えば,日常診

tion )」を知ることにある.しかし,その結果から

療下では,特に医師は患者の既往歴,来院時の状

「関連(association)」については知ることができる

態,検査値などレセプトにあらわれないような背景

が, 「因果関係」の全容を把握することはできない.

因子から治療方針を決定する.そのため医師と患者

Figure 1 に示すように,ある集団 A では曝露を

の考えによって曝露状況が左右されることになる.

受けており(X=1),異なる集団 B では曝露を受け

このような患者や医師の経験値による治療方針の決

ていない( X= 0 )ときに,あるイベントの分布が

定は,曝露群と非曝露群において患者背景の分布の

曝露群と非曝露群で異なるならば,曝露とイベント

不均衡を起こし,治療あるいは薬の効果を推定する

は「関連がある( association )」と言う.20) 一方,

20) 上で問題となる.

同じ集団で曝露を受けているあるいは曝露を受けて

4.

いないという仮想シナリオ下でのイベントの分布の

4-1.

バイアス・誤分類・交絡 バイアス

推定における誤差は系統的あ

違いがあるときに「因果関係がある」とする.この

るいは偶然誤差に区分される.疫学では,「系統的

ように同じ集団で事実と反実仮想を設定して曝露の

な偏り( systematic bias )」が「バイアス( bias )」

効果を検討できれば,曝露とあるイベントの因果

を指していることが多く,バイアスの反対が「妥当

( causation )の評価ができるということである.20)

性( validity )」である.21) また,「偶然誤差( ran-

しかし,現実には同時に曝露と非曝露を経験するこ

」の反対は「精度(precision) 」である. dom error)

とは不可能であり,別な集団でイベントの分布を比

「ランダムエラー」はサンプルサイズ増で解決され

較することになる.別な集団のデータを比較するの

るが,バイアスはサンプルサイズとは独立に発生す

で,曝露以外の背景情報の分布も異なってしまう.

る.Sackett22) と Choi23) はバイアスを研究段階によ

Well-designed randomized experiments 下 で は , 曝

り分類している:フィールドでの情報収集,研究対

露の割り付けをランダムにすることで曝露以外の変

象の特定・選択,実験の実施,曝露とアウトカムの

数が同じ分布になるとみなし,「関連」イコール

測定,データ解析,解析結果の解釈と公表段階.ま

ランダム化により交換可能

た,Kleinbaum ら24)は,バイアスを選択バイアス,

( exchangeability )となるので,ランダム化された

情報バイアス,交絡に分類した.Steineck ら25)は,

実験下では,集団レベルの因果効果( population

交絡( confounding ),誤分類( misclassiˆcation ),

20) eŠects)が同定可能(identiˆable)となる.

代表性の欠如(misrepresentation)と解析上の逸脱

一方,観察研究では曝露がランダム化されていな

( analysis deviation ) を 提 案 し て い る . Delgado-

いので,曝露とアウトカムが同じ原因であるときに

Rodráƒguez ら26)は,バイアスについての用語の定義

交換可能(exchangeability)とならず,曝露と交絡

をわかり易く解説している.

「因果」と考える.20)

causal

796

YAKUGAKU ZASSHI

Vol. 135 No. 6 (2015)

近年では,Maclure ら27)はバイアスのソースにつ

「 new user design 」であっても,前述した healthy

いて directed acyclic graphs ( DAG :有向非巡回グ

adherer eŠect によるバイアスの影響があるかを考

ラフ)を用いて,情報バイアス・選択バイアス・交

察した方がいい場合がある( as-treated あるいは

絡の解釈が行われていて興味深い.疫学研究におけ

29) 市販後の早い時期の薬に on-treatment analysis ).

る交絡の考察では,DAG を用いることが提案され

ついて「new user design」を適用すると,サンプル

ており,詳細は Greenland

サイズが小さくなるというデメリットもあるが,新

らの文献28)を参照された

い. Table 1 は Delgado-Rodráƒguez

ら26) のバイアス

と交絡のリストを筆者が観察研究のバイアスを中心 に改変したものである.以下に挙げるバイアスは,

規薬剤と従来薬との比較をする上では「 new user design」は重要である. 4-1-3.

生存・死亡に係わるバイアス( survival

その中でもデータベース研究を実施する上で注意す

bias, immortal time bias)

べきものである.

mortal time bias 」とは,追跡中あるいは観察時間

疫学研究での「Im-

Healthy user eŠect・Healthy adherer eŠect

において死亡が起き得ない期間31)である(Fig. 2) .

Healthy user eŠect とは,ある予防薬を使用する

特にコホート研究において,登録時から薬曝露開始

患者は,運動や食事にも気を配っている可能性があ

までの期間には研究対象はかならず生存しており,

り,その予防薬の不使用者より薬以外の要因により

32)「 Im疫 学 上 の 「 Immortal time 」 期 間 と な る .

関心のあるイベントを起こし難いという効果であ

mortal time 」の起源は, 1970 年代始めに心臓移植

る.29)

例えば,観察研究では hormone replacement

における生存期間の影響についての議論である.

therapy ( HRT :ホルモン補充療法)における心疾

Texas Heart Institute study と Stanford Heart Trans-

4-1-1.

患イ ベ ント 抑制 効 果が みら れ ,そ の要 因 とし て

plant study で心臓移植患者の方が心臓移植を受け

healthy user eŠect が指摘された.

なかった患者より生存時間の延長が認められた研究

ま た , Healthy adherence eŠect も healthy user

結果から,33,34) Gail35) は治療あるいは薬の影響を評

eŠect と同じく,薬使用者の方では健康意識が高い

価するときに「 Immortal time 」を含めて解析する

こともあるために起きるバイアスである.例えば,

と,移植群の方が生存時間を長くカウントしてしま

予防薬の継続率が高い患者では,他の治療の継続率

うバ イ アス を示 唆し た. Suissa31) は ,「 Immortal

も高く,がんスクリーニング受診率なども高い傾向

time bias」による影響を受けている事例を挙げて,

29) がある.

薬の安全性そして有効性の結果が間違ったものとな 「Prevalent user

る こ と を 指 摘 し て い る . Suissa36) は , カ ナ ダ

bias」とは,観察開始時に薬既使用者と新規使用者

Saskatchewan 州のデータベースを用い, 3524 例の

が混在するために生じるバイアスである.29) 既使用

慢性閉塞性肺疾患( chronic obstructive pulmonary

者( prevalent users)を対象とする疫学研究では,

disease; COPD)患者における吸入コルチコステロ

薬使用が長い患者も新規患者も混在しており,薬の

イドの予後について, immortal bias の影響を検討

使用期間も異なる.そのため,薬によるイベントを

している.従来の intention-to-treat approach では,

誘導する期間(誘導期間: induction period )も異

0.75 ( 95 % CI: 0.62 0.90 ), according-to-treatment

なり,リスク評価に影響を及ぼす.このような研究

approach では 0.94 (95%CI: 0.81 1.09)であった.

デザインによるバイアスを少なくする目的で,新規

Immortal bias の原因として,曝露の定義のされ方

使用者のコホート( inception cohort )に限定する

と曝露開始点の定義を考えた.すなわち, COPD

ことが多い( new user

co-

の治療ガイドラインでは ‰uticasone proportionate

hort」の設定では,新規性を担保する目的である薬

あるいは salmeterol 処方前に短時間作用性気管支拡

曝露前の一定期間を登録期間とし,その登録期間内

張剤使用が推奨されており,実際の処方実態も短時

には対象薬使用がない患者だけを研究対象とする.

間作用性気管支拡張剤から移行されているケースが

大規模データベースの利用では,新規使用者に限定

多かった. COPD 診断から吸入コルチコステロイ

して も 十分 なサ ン プル サイ ズ が得 られ る ので ,

ド曝露前の処方期間がバイアスを起こすと考察し

「 new user design 」 が 使 わ れ る 方 が よ い だ ろ う .

た.また,3 回の処方のうち最初の処方を開始点と

4-1-2.

Prevalent user bias

29,30)「 Inception design ).

Vol. 135 No. 6 (2015)

YAKUGAKU ZASSHI

Table 1. Group of bias Selection bias

797

Bias and Confounding in Observational Studies

Name of bias Ascertainment bias Berkson's bias Centripetal bias Competing risks Detection bias Diagnostic/Treatment access bias Diagnostic suspicion bias Exclusion bias Healthcare access bias Healthy worker eŠect Healthy user eŠect Healthy adherer eŠect Prevalent user bias Incidence-prevalence bias (synonym of Neyman bias) Inclusion bias Length biased sampling Losses/withdrawals to follow up Mimicry bias Missing information in multivariable analysis Neyman bias

Type of design aŠected Inappropriate deˆnition of the eligible population Inappropriate deˆnition of the eligible population Healthcare access bias Ascertainment bias Uneven diagnostic procedures in the target population Healthcare access bias Detection bias Inappropriate deˆnition of the eligible population Ascertainment bias Inappropriate deˆnition of the eligible population Inappropriate deˆnition of the eligible population Inappropriate deˆnition of the eligible population Inappropriate deˆnition of the eligible population Inappropriate deˆnition of the eligible population

Study design Observational study Hospital based case-control study Observational study All studies Case-control study Observational study Case-control study Case-control study Observational study Cohort study Observational study Observational study Observational study Hospital based case-control study

Ascertainment bias During study implementation Detection bias During study implementation

Cross sectional study, screening Cohort study, trial Case-control study All studies (mainly retrospective)

Ascertainment bias

Cross sectional study, case-control study with prevalent cases Observational study Observational study Case-control study

Non-random sampling bias Non-response bias Overmatching

Lack of accuracy of sampling frame During study implementation Inappropriate deˆnition of the eligible population Popularity bias Healthcare access bias Referral ˆlter bias Healthcare access bias Relative control bias Inappropriate deˆnition of the eligible population Survivor treatment selection bias, im- Ascertainment bias mortal bias Unmasking―detection signal―bias Detection bias

Observational study Observational study Case-control study Cohort study Case-control study

Information bias Detection bias Diagnostic suspicion bias DiŠerential misclassiˆcation bias Lead-time bias Mimicry bias Non-diŠerential misclassiˆcation bias Protopathic bias (Reverse causality) Regression dilution bias Sick quitter bias Temporal ambiguity

Misclassiˆcation bias Detection bias Misclassiˆcation bias Detection bias Misclassiˆcation bias Regression to the mean Protopathic bias

Cohort study Cohort study All studies Screening study Cohort study Observational study Cohort study, trial Observational study Cross sectional study, ecological study

Confounding Confounding by indication Reproduced from Ref. 26).

Case-control study, cohort study

798

YAKUGAKU ZASSHI

Vol. 135 No. 6 (2015)

いて胃がんリスクのオッズ比を算出した.胃がん発 症日より前の期間を 030 ヵ月まで変化させラグタ イムとし,感度分析を行っており,胃がんリスクの オッズ比は,ラグタイムを増やすことでオッズ比減 少がみられ,6 ヵ月程度で安定することを報告して いる( ORs: 0.97 3.52 ).薬の有効性・安全性研究 で「 Reverse causality 」の影響は,疾患の自然歴が 複雑あるいは薬曝露以前の診断に至る前の患者の病 状の情報が得られないなどの理由から十分な吟味が Fig. 2.

Immortal Bias

なされていないことも多い.

Reproduced from Ref. 31).

4-2.

薬の曝露・疾患に対する誤分類

離散変

数において,「測定誤差」( measurement error )を すると,13 回目までの処方がされる期間は,患者

「分類誤差」( classiˆcation error )あるいは「誤分

は生存していなければ 3 回目の処方はされないこと

類」( misclassiˆcation )と言う.21) バイアスの方向

から, Immortal bias の原因となり得ると指摘して

性とその大きさは,ある変数の誤差分布がある変数

いる.このようなバイアスの解決方法としては,3

(例えば,曝露あるいは疾患など)あるいはその他

回目の処方を曝露開始点とすることを提案している.

の変数の値に依存するかどうかによるところが大き

4-1-4. 因果の逆転(Reverse causality)

Reverse

い.他の変数に従属な場合,「偏りのある誤分類」

causality (あるいは protopathic bias )は,直訳す

( diŠerential misclassiˆcation )と言い,他の変数の

れば「因果の逆転」である.ある症状の治療に薬が

値に従属でない場合,「偏りのない誤分類」( non-

使われる場合に,その処方自体が原疾患の有無によ

21) データベー diŠerential misclassiˆcation )と言う.

りバイアスを受けることがある.37) 例えば,Korho-

スで薬剤疫学研究やアウトカム研究を実施する場合

nen ら38)は,スタチンにおける主要心血管イベント

には,以下に述べるような薬曝露・疾患の誤分類に

( major cardiac events; MACE )の抑制効果を調べ

留意しなければならない.また,バイアスを考える

る目的で,フィンランドの処方データベースを用

ときは,結果に及ぼす向きと大きさを考える必要が

い,スタチン新規使用の糖尿病患者 53943 例を対象

ある.観察される曝露とアウトカムとの関連におい

にコホート研究を行った.その結果,全体の

てバイアスの向きは,「帰無仮説に向かうバイアス

MACE 発症率は 2.9 / 100 人年であったが,全体の

(bias toward the null hypothesis) 」と「帰無仮説か

およそ半分(46.4%)のイベントがスタチン服用開

ら離れる方向のバイアス(bias away from the null

始後 1 年以内に発症しており,開始 1 年間の発症率

21) 例えば,誤分類における hypothesis )」がある.

は 5.9/100 人年であった.糖尿病患者では狭心症合

「偏りのない誤分類」は,曝露(あるいは疾患)を

併や心カテーテル治療予定者にスタチン使用を始め

二値変数とし,独立で起こる場合,「帰無仮説に向

る患者が多いためであるとし,糖尿病患者における

かうバイアス(bias toward the null hypothesis) 」と

スタチンの MACE 抑制効果は「 Reverse causality 」

なることは知られている.21) 一方で,「偏りのある

の影響を受けていると考察した. 「Reverse causality」

誤分類」が生じてもバイアスの方向性は,「帰無仮

への対策としては,あるイベント発症までの一定期

説に向かうバイアス(bias toward the null hypothe-

間をラグタイムとして解析上除く方法が提案されて

sis)」あるいは「帰無仮説から離れる方向のバイア

いる. Tamim

ス(bias away from the null hypothesis) 」のどちら

ら39) はプロトンポンプ阻害剤(

pro-

ton pump inhibitors; PPIs )と胃がんリスクについ

て , R áegie

de

l'assurance-maladie

du

Qu áebec

かの方向性もあり得る.21) 4-2-1.

薬曝露の誤分類

薬の曝露情報として

(RAMQ)データベースを用い症例対照研究を行っ

は,処方レセプトから得られる医薬品名・Anatom-

た.胃がん自体が PPIs の投薬に影響することを考

ical Therapeutic and Chemical classiˆcation (ATC)

慮し,胃がん発症日より前の期間を曝露期間から除

分類・剤型・処方日数・用量などがある.薬の曝露

Vol. 135 No. 6 (2015)

YAKUGAKU ZASSHI

情報,医薬品使用実態調査,薬の平均一日量の算出 40) などに使われる.

医薬品の使用実態調査,特に薬の継続率研究で

799

Table 2. Accuracy Measures for Electric Health Care Data in Epidemiologic Studies Algorithm

は,「薬の曝露終了」の定義が重要である.通常の

Diseases True

False

薬の継続率の指標としては, persistence と adher-

Agreement

A

B

ence という 2 種類がよく用いられている. Persis-

Disgreement

C

D

tence は,薬開始から薬中止あるいは観察期間終了

の期間から算出される.また,adherence は,薬使 用期間を観察期間全体で割り medication possession ratio を求める.筆者らは,DPC データベースを用

いて,骨折予防薬である Teriparatide の継続率を求

Sensitivity A/(A+C) Speciˆcity D/(B+D) PPV A/(A+B) =Prevalence×Sensitivity/[(Prevalence×Sensitivity) +(1-Prevalence)×(1-Speciˆcity)] NPV D/(C+D) =(1-Prevalence)×Speciˆcity/[(1-Prevalence)×Speciˆcity +Prevalence×(1-Sensitivity)] Reproduced from Ref. 46).

めた.41) 飲み忘れなどで服薬遵守がよくない患者の 処方日と処方間隔は,患者の服薬状況を正確に反映 していないだろう.例えば中断期間が存在する場合

を使用した場合の真陽性の割合,特異度とは,カル

に,その期間をどこまで許容するかの gap(処方と

テで偽と判定された者のうちで使用するアルゴリズ

次の処方の間隔)の設定により,連続処方と解釈す

ムを使用した場合の真陰性の割合を指す. PPV と

る「薬曝露期間」が変化する.この gap の設定の

は,使用したいアルゴリズムを使用した場合の真陽

され方が患者の服薬状況を反映していなければ,曝

性の割合, NPV とは,使用したいアルゴリズムを

露の誤分類となる.「薬の曝露終了」の定義を何通

使用した場合の真陰性の割合を指す.感度,特異度

りかに設定して感度分析( sensitivity analysis )40) を

は対象集団におけるアウトカムの頻度に依存しない

行うことで,その頑強性( robustness)を確認する

指標であるが,PPV や NPV はアウトカムの頻度に

こともある.

依存する指標であり,留意が必要である.「疾患の 病院ではレセプトに

誤分類」に関して,曝露において独立に発生してい

International Classiˆcation of Diseases ( ICD )コー

ると きに 「 偏り の ない 疾患 の 誤分 類」 と 呼ば れ

ドが各疾患に付与されるが,その中には疑い病名や

る.21) 例えば, Nakhai-Pour ら47) は, Quebec Preg-

検査病名も含まれる可能性がある.傷病名のコー

nancy Registry の デ ー タ を 使 っ て 妊 娠 中 の non-

ディングの正確性が不明瞭のままでは,発症率,有

steroidal anti-in‰ammatory drugs ( NSAIDS ) 使 用

病率の推定や相対リスクなどの影響を正しく考察で

による中絶リスクを評価しているが,「 over-the-

きず,歪んだ結果を導きだす危険性がある.そこ

counter ( OTC )」の NSAIDS はデータベース上で

で,レセプトの ICD コードがどれほど正確かを知

は測定されないため,バイアスを引き起こしている

る た め , validation を 実 施 す る こ と が 重 要 と な

可能性がある.しかし, NSAIDS 曝露群と非曝露

4245) Validation の一般的な方法として大きく分 る.

群で「 over-the-counter 」の曝露状況による偏りは

けて 3 つ46)あり,エコロジカル研究と統計データと

なく,「偏りのない誤分類」になり得ると考察して

の比較,カルテからコード化までの過程を繰り返し

いる.

4-2-2.

疾患の誤分類

行い,その一致性を調べる Re-abstraction 法,病院

死亡は疫学のアウトカム指標として重要である

カルテまで戻って疾患コードとの一致を調べる法の

が,わが国ではデータベース間のリンケージが許さ

3 つがあり,カルテまで戻る方法は Gold standard

れておらず,薬剤疫学研究上の限界である. DPC

とされている. Table 2 に示すように,感度( sen-

データベースは退院後の死亡情報は追跡できない

sitivity ),特異度( speciˆcity ),陽性的中率( posi-

が,入院時であればデータベース上に死亡記録が存

tive predictive value; PPV ),陰性的中率( negative

在している.Nakajo ら48)は,DPC データベースを

predictive value; NPV ) か ら 判 定 を 行 う こ と が 多

用いて,統合失調症患者の急性期の入院死亡率を算

46) い.

出しており,データベースの特徴を生かした試みと

感度とは,gold standard とされるカルテ情報

で真と判定された者のうちで使用するアルゴリズム

言える.

800

YAKUGAKU ZASSHI

多くのデー

ABO 不適合反応」・「アナフィラキシー以外の過敏

タベース研究では,validation の結果なしでコード

反応」 ・ 「多形性紅斑」 ・ 「スティーブンス・ジョンソ

あるいは処置を組み合わせた疾患のアルゴリズムを

ン症候群」 ・ 「中毒性表皮剥離症」 ・ 「肺線維症」 ・ 「間

使 っ て い る 場 合 が 多 い . van Walraven

質性肺炎」などが挙げられている.

4-2-3.

疾患コードの validation

Vol. 135 No. 6 (2015)

ら49) は ,

MEDLINE から年度毎にランダムサンプリングし

データベース研究では,興味あるアウトカムの疾

た 150 のデータベース研究について,疾患のコード

患コードと入院,処方や処置を組み合わせたアルゴ

における validation の実施状況を報告している.全

リズムを使ってその正確性を上げる方法がとられる

体の 76.7 %にあたる 115 研究で疾患や処置コード

こともある.このようなアルゴリズムにおいても

が使われており,対象疾患集団の定義で疾患コード

46) validation を行うことが推奨される.

の正確性の評価を実施しているのは,そのうちの

真のケースを抜けなく抽出したいならば感度を重

ら50) は, MOX-

視すべきであり,このような例として, HIV 治療

XI 研究に参加しているカナダケベック州の高齢者

薬である Abacavir の過敏反応のアルゴリズムがあ

コホート(14980 例)について,レセプトデータベー

52) 過敏症に関連のありそうな症状,診断,アナ る.

ス( RAMQ )と彼らの病院カルテ情報からレセプ

フィラキシーショックあるいは不特定のアレルギー,

ト上のコードの validation 研究を行った.そこで

90 日以内の Abacavir 治療の中断などについて再帰

は,薬剤の禁忌に係わっている 14 の疾患[高血圧,

分割法( recursive partitioning )を用い,変数の値

消化性潰瘍,糖尿病,COPD,前立腺肥大,ぜんそ

に基づいて対象者を逐次 2 分し,validation 済の有

く , う っ 血 性 心 不 全 ( congestive heart failure;

害事象のあった患者となかった患者を区分できるよ

CHF),痛風,腎不全,緑内障,起立性低血圧,心

うなアルゴリズムを作り,高リスク者を抽出する感

臓ブロック,レイノー病]における感度と特異度を

度が最高になる変数の組み合わせを求めた.

12.1 %であった.また, Wilchesky

算出した.薬と疾患の禁忌に係わる 14 疾患のう

一方, PPV が高いアルゴリズムは抽出データの

ち,「緑内障」,「高血圧」,「糖尿病」などの感度は

偽陽性を減らしたい場合に重視されるが,使用条件

それぞれ 76.0 % , 68.7 % , 64.4 %であったと報告し

46) 高い によっては偽陰性が増加する危険性がある.

ている.Carnahan51) は, Mini-Sentinel におけるい

PPV を保証するには高い特異度である必要があ

くつかのアウトカムの validation 結果をまとめてい

る.しかし,低い頻度の場合には特異度が高いだけ

る.例えば,「心不全」の場合では PPV は 90 %以

では高い PPV を得るのに十分とは言えない.この

上と高いものであった.しかし,「脳血管障害」で

ように,対象集団のアウトカムの頻度や研究目的に

は,24/25 研究で急性イベント,22/25 の研究で脳

より validation 指標の重要度を考慮する必要があ

卒中による入院だけで脳卒中を定義しており,入院

46) このような海外の診断コードの validation 結 る.

は重篤なイベントを示唆する重要な指標であると考

果は各地の医療システムや医師に依存するところも

察している.「一過性脳虚血発作」では, 6 / 7 の研

あり,そのまま日本のデータベースに当てはめるこ

究では急性イベント,5/7 の研究で入院あるいは緊

とはできない.Okubo らは,DPC データベースを

急入院を指標としてイベントがカウントされてい

用い,悪性リンパ腫患者における gemcitabine 使用

る.「心房細動」においては,PPV は 7097%,感

実態を調査するために,悪性リンパ腫を抽出するた

度は 5795%であり,心電図データ情報を「心房細

め化学療法や処置を組み合わせたアルゴリズムを作

動」を抽出するためのアルゴリズムへ組み入れでき

成し,validation の試みを行っている.53) Benchimol

るかが今後の課題としている.「うつ」の場合では

ら54)はデータベース使用での validation の記載方法

PPV は 31.598.8%とその幅が広いが,過小診断の

についてのガイドラインを提案しており,報告の際

傾向があるので診断コードを用いただけでは限界が

には適用したアルゴリズムとその validation 結果を

あることが示唆されている.今後更なるアルゴリズ

明確にする必要があると述べている.

ムの検討が必要なアウトカムとしては,「自殺」・

4-2-4.

誤分類の特殊事例

Stricker ら55) は前

「自殺企図」・「リンパ腫」・「血液製剤,移植に係わ

向きコホート研究において,イベントの進行を「誘

る感染症」 ・ 「輸血に係わる敗血症」・「輸血に係わる

導期」 , 「潜伏期」 , 「発症期」に分けたとき,薬の曝

Vol. 135 No. 6 (2015)

YAKUGAKU ZASSHI

801

医療現場では,医師の治療方針や患者の意向によ り,治療(曝露)群と未治療(非曝露)群で患者背 景にアンバランスを生じることがある.このような アンバランスが系統的に起きることを「処方による 交 絡 ( confounding by indication )」 あ る い は 「channeling bias」57)と言う.事例として,スタチン は脂質低下薬であり心疾患発症抑制効果を期待して 処方される.日常診療下では,心疾患発症リスクの 高い患者に投与され易いので,ベースライン時で既 Fig. 3. Risk of Cancer Induction after Long-term Exposure to Drug A Reproduced from Ref. 55).

に曝露群と非曝露群での心疾患発症リスクの背景因 57) 子の分布にアンバランスが生じ易い.

4-4.

データ欠測・脱落(Lost to follow up)・ク

ラスタリング(Clustering)

データベースは一次

露を受けた期間がどの時期に設定するかで,リスク

データと異なり,患者の記憶や研究への参加意向と

比にどう影響するかを考察している.Figure 3 に示

は無関係なので,医療記録の欠測はランダムに発生

す よ う に , 曝 露 期 間 を 「 誘 導 期 」 に お く ( Ex-

すると考えられる.40) また,レセプトデータでは脱

posure window 2 )とリスク比は 5.0 である症例に

落は所属する保険からの脱退でも起こり得るし,社

おいて,曝露期間を「誘導期」と「潜伏期」に設定

会保険であれば病気の悪化による退職でも脱落とし

する( Exposure window 1 )とリスク比は 2.0 に希

40) Schneeweiss ら58) は , レ セ プ ト て観測される.

釈され,さらに「潜伏期」と「発症期」に設定する

デ ー タ ベ ー ス で あ る Health

と( Exposure window 3 )リスク比は 1.0 と低下す

Research Database SM と検査値データを連結させ,

る.例えば,エストロゲンが肝アデノーマのリスク

703484 例 の ス タ チ ン あ る い は Vytorin ( ezetimibe

であるかを調べたいとき,発症の 1 ヵ月前に曝露さ

and simvastatin)の新規使用者を対象として,外来

れたとすると,「潜伏期」に曝露を受けた患者も含

診療での検査値の情報(LDL ・HDL ・ HbA1c )の

まれるので,薬の影響によらない発症者も曝露群に

欠測メカニズムついて考察している.検査値の欠測

カウントされてしまい,「偏りのない誤分類」を起

は, 1 ) 医師による判断, 2 ) 患者による選択, 3 )

こしていることになる.薬の曝露の影響は,用量,

医療電子記録への反映の 3 つの理由のいずれかによ

服薬期間,薬投与のタイミングやその作用機序,興

るものと考え,検査値の欠測に対して予測が可能か

味のあるイベントの半減期から推察する生物学的な

を吟味した.その結果,外来の臨床検査は患者の背

リスク期間,併用薬そして患者のアドヒアランスに

景情報(リスク因子の分布)やガイドラインに依存

大きく依存していることを念頭に置いて曝露期間の

しているが,欠測データが多いため,データベース

設定をしていく必要がある.

と検査値データを連結させて薬の有効性評価に使う

Core

Integrated

Confounding by Indication/Dis-

ことは大きな付加価値にはならないと結論してい

ease Severity(処方による交絡)や Confounding by

る.データベースと連結させた検査値データを使用

Functional Status and Cognitive Impairment(機能

して有効性や安全性評価をする際には,検査値の欠

状態や認知障害による交絡)は,医療情報データ

測が多い場合,そのメカニズムを吟味することが重

ベー スを 使 用し た疫 学 研究 で報 じ 得る 交絡 で あ

要であり,欠測値を生じさせないよう情報収集時の

る.56)

機能的あるいは認知能力の低下が起きている

工夫が必要である.例えば,検査値欠測の原因は,

高齢者や重症患者などの医療サービスへのアクセス

実際に検査がされていないのか,あるいは検査記録

頻度の低下や,逆に健康意識の高い患者層において

のシステムが構築されていないのか,入力し難いと

は予防医療へのアクセスが増加する(healthy user/

いった情報収集時の問題をなるべく解決していく必

交絡

4-3.

adherer

bias)56)ことなども結果に影響を及ぼす現象

が指摘されている.

要があるだろう. 特殊な疾患患者は特定病院に集中し,その病院で

802

YAKUGAKU ZASSHI

Vol. 135 No. 6 (2015)

イベント発生が特異的に発生する場合がある.この 現象を「クラスタリング( clustering )」と言う.40) 例えば,喘息発作に伴う緊急入院は同一患者で同一 のイベントが何度も生じ,標準誤差が小さくみえる ことがある.Vellinga ら59)はトリメトプリム・シプ ロフロキサシン処方と Escherichia coli 耐性の関連 を調べるため,トリメトプリム・シプロフロキサシ ン耐性の有無という個人レベル( patient-level )の 事象と医療施設レベル(practice-level)といった帰 属集団に関する変数を階層的モデルとして扱い,医 療施設間の変動を変量効果とする階層的多変量ロジ スティック回帰分析を行った.このように「クラス

Fig. 4.

Deˆnition of Risk-sets

Reproduced from Ref. 64).

タリング」を補正するために, generalized estimating equations (GEE)法や階層的モデルを用いるこ

装着リスクについて検討した.4 つの固定変数と 7

6063) とも有効である.

つの時間依存性共変量のデータでのコホート内症例 対照研究デザインと Cox 比例ハザードモデルを用

交絡への対処方法

5.

一般に疫学研究におけるバイアスは解析時には調

いたコホート研究デザインの 2 通りの方法でのコン

整することはできず,事前の研究デザインや情報収

ピュータ効率を比較したところ,コホート内症例対

集方法を工夫するなどしてバイアスを減らしてい

照研究デザインの方が計算速度において勝っている

く.しかし,交絡は解析段階で以下に述べるような

と報告している.

対策が有効である.

データベース研究では,必要な情報をすべて保持 データベース

しているわけではなく,観察データによる薬の効果

研究でも,症例対照研究やコホート研究のような通

の推定は「未測定交絡」,とりわけ「処方による交

常の観察研究と同様な研究デザインが使われる.し

絡」の影響を受ける可能性があり,通常の観察研究

かし,薬剤疫学研究での大きな特徴として,稀な曝

以上に扱いに注意がいるだろう.68) この対処法の 1

露かつアウトカムを扱わなければならない場合があ

つとして,同一人物内での研究デザイン( within-

る.データベース研究では容易に全コホートの情報

subject study designs)あるいは Case-only デザイン

を入手することが可能であるため,通常の症例対照

が提案されており,本稿では,ケースクロスオー

研究・コホート研究だけではなく,コホート内症例

バーデザイン(case-crossover design)を紹介する.

対照研究( nested case control )などのハイブリッ

ケ ー ス ク ロ ス オ ー バ ー デ ザ イ ン は 1991 年 に

ド型デザインが行われることも多い.コホート内症

Macure69) により疫学分野に紹介された研究デザイ

例対照研究では,Risk-set サンプリングで症例と同

ン で, 用 途と し て は一 時 的な 曝 露( transient ex-

6466) 時期の対照群をサンプリングされる(Fig. 4).

posure)の影響と急性疾患発症の関連を調べたいと

通常の症例対照研究とコホート内症例対照研究の違

きに使える. Macure は Case-only 研究が使われる

いは,後者は「well-deˆned cohort」(定義されたコ

条件として以下の 3 条件を挙げている:1) アウト

ホート)内でサンプリングされる点である.コホー

カムが急性疾患,2) 観察期間内に最低 1 度,最大

ト内症例対照研究は,データベースを用いない一次

の曝露と最少の曝露が交差( crossover )している

データを使用する観察研究では情報収集の時間と費

こと(ただし,交差は急激でなくてもよい),言い

用を節約できることがメリットとされている. Es-

換えれば,薬曝露が一定であると曝露による影響が

5-1.

sebag

研究デザインによる対処

ら67)は,ケベック住民のレセプトデータベー

評価できない.3) 一時的な曝露であること.

ス(州立病院の退院サマリーを連結)を用い, 65

解析方法は,イベント発症直前と,発症前の同一

歳以上で新規アミオダロン使用者( 1134 例)をコ

人物の期間(いくつかに区分)を対照群として設定

ホートとして,アミオダロン使用とペースメーカー

し,条件付きロジスティック解析でオッズ比を算出

Vol. 135 No. 6 (2015)

YAKUGAKU ZASSHI

803

する.環境疫学の分野では,イベント発症前後で対

れ,「処方による交絡」を調整することが多い.

照を設定することもあるが( bi-directional ),薬剤

Shah ら76) は,傾向スコアを使った医学研究につい

疫学分野では発症後で医師による治療方針が変わる

てシステマティックレビューを行っている.

こともあるので,発症前に対照を設定することが多 い.69)

観察研究において傾向スコアが近い患者でマッチ ングをすると,治療割り当ては,測定変数とは独立

時間に依存しない交絡(time invariant confound-

であり,ランダム化臨床試験に類似するものと考え

ings )があっても, Case-only デザインでは同一人

られる.しかし,注意しなければならないのは,同

物を研究対象としているので交絡の影響は考えなく

じ傾向スコアの層であっても,未測定変数の分布も

てよいが,イベント発症以降のイベント自体が曝露

測定変数と同様に曝露群と非曝露群とで同じとは限

に影響するときや時間依存性交絡がある場合では,

らない点である.77) 従来のモデル解析より傾向スコ

70) Case-only デザインでは効果推定に影響が出る.

アが,「処方による交絡」の調整に優れていること

飲酒における心筋梗塞リスクにおいて,症例対照研

はまだ実証されておらず,78) 未測定交絡の影響は,

究では発症前 24 時間前の飲酒は心筋梗塞リスクが

傾向スコアを使用しても通常の多変量解析と同じ程

ら71)

度であると Drake79) は報告している. Schonberger

は同時に case-crossover 研究も実施した結果,飲酒

ら80)によれば,傾向スコアマッチングによる交絡の

が習慣化しているケースでは心筋梗塞のリスク比は

調整を行っても,変数の選び方によっては交絡の調

0.48 ( 95 % CI: 0.27 0.84 ),飲酒頻度がランダムな

整が不十分となることをシミュレーション解析で指

群では心筋梗塞のリスク比は 1.88 ( 95 % CI: 1.35 

摘している.傾向スコアについては別にわかり易く

2.61)であった.このように曝露における急性イベ

まとめており参照されたい.81,82)

0.75 ( 95 % CI: 0.62 0.90 )であった. Jackson

ントの影響を調べる場合,慢性の曝露かどうかがリ スク評価に影響することがある. 5-2.

5-2-3.

選択バイアスと操作変数法

操作変数

( instrumental variables )は従来から経済分野で用 いられてきたが,未測定因子の不均衡を調整する方

解析方法 通常の観察研究と同じよ

法として疫学分野でも利用されるようになってき

うにデータベース研究においても,解析時の交絡の

8286) 操作 た.詳細な解説又は成書を参照されたい.

72) モデルの適用 調整は,層別化( stratiˆcation ),

変数とは,下記の条件を満たす変数である:1) 未

(線形モデル,ロジスティックモデル, COX 比例

測定の変数 U と独立,2) 曝露(治療)S と関連,

ハザードモデル,Poisson モデルなど)が一般的で

3) 予定された治療 R から直接結果 Y への効果はな

ある.

く,S を通してのみ Y に影響(Fig. 5).82) 適切な操

5-2-1.

交絡の調整

近年では傾向スコア法や操作変数法による調整, 40) 疾患スコアなども使われている.

作変数の見極めも重要であり,操作変数と曝露の相 関が小さいと弱い操作変数( weak instrument )と

観察

なり,サンプルサイズが小さいと,操作変数の分散

研究では前述のように「処方による交絡」の影響を

が大きくなる.また,大きいサンプルサイズであっ

受け易く,データベース研究でも全く同様である.

ても前提から逸脱すればバイアスを生じる.85)

5-2-2.

傾向 スコア( Propensity score )

傾向スコアとは,共変量を与えたもとである特定の

操作変数を使い選択バイアスを調整した事例とし

7375) 例 曝露(治療)を受ける条件付き確率である.

ては, Medicare のレセプトデータを使って,患者

えば,患者 A と患者 B の傾向スコアが同じなら,

の自宅と医療機関への距離を操作変数とし,急性心

ある治療を同じくらいの確率で受けると解釈され,

筋梗塞(acute myocardial infarction; AMI)発症後

測定因子の分布は患者 A と患者 B は近い分布であ

の 4 年予 後 に与 え る集 中治 療 の効 果を 調 べた 研

る.傾向スコアを算出するための変数選択には明確

究,87) 同様に地域毎の心カテーテル治療率を操作変

な基準はないが,臨床疫学分野では receiver oper-

数とし, AMI 発症後の 7 年予後における侵襲的心

ating characteristic ( ROC )曲線か c 統計量を用い

88) 医師の処方の好みを操作 疾患治療の効果の検討,

て決定することが推奨されている.傾向スコアを用

変数法として, COX-2 阻害剤の胃保護作用を調べ

いて,マッチング・層別化・モデル調整などが行わ

た研究89)などがある.

804

YAKUGAKU ZASSHI

Vol. 135 No. 6 (2015)

される可能性がある.100) HbA1c 検査値は「時間依 存性交絡(time-dependent confounder) 」である. 「時間依存性交絡」の存在下,時間に依存する治 療 の 因 果 効 果 を 推 定 す る た め に , Robin ら は gcomputation formula を提案し, G 推定( g-estimation ) の structural nested models ( SNMs ) や 周 辺 Fig. 5.

Example of DAG

R: Planned treatment, S: Obsereved treatment, Y: Result, U: All risk factors. Reproduced from Ref. 82).

構造モデル(marginal structural models; MSM )な ど も さ ら に 提 案 さ れ て い る .101103) Robins と Hern áan や Daniel がわかり易いチュートリアルを書

統計モデルのための変数選択

5-2-4.

疫学研

いており,別に参照してもらいたい.104,105)

究での適切な変数を考察する上で,DAG の使用は

抗レトロウィルス製剤の HIV 患者へ与える影響

有用な手段である.DAG を用いることで,結果に

は,標準的な Cox 解析では薬の有効性に関する時

大きい影響を及ぼす交絡因子の因果関係を視覚的に

間依存的評価が行えないため,MSM 法によりその

把握でき,臨床的に適切な変数が選択されるので推

ネットベネフィットが示されている.106) Sanni Ali

定された効果は「under-adjustment」となる可能性

ら107)は,累積患者数として 60000 例を含む Nether-

を低減することができるだろう.また,その反対

lands University Medical Centre Utrecht General

に,過剰に変数を選択してモデル解析することで

Practitioner Research Network データベース研究

「 over-adjustment 」を起こす可能性もある.「 over-

で,時間依存性傾向スコアを用いて b アゴニスト

adjustment 」から発生するバイアスとして Z- バイ

の心疾患リスクの影響を調べている.時間依存性傾

アスと M-バイアスがあるが,詳細については他稿

向スコアによる層別化や共変量調整によりバイアス

56) に譲る.

が誘導されると指摘している.また,Platt ら108)は, 合 併 症 ス コ ア ( Comorbidity scores )

GPRD を 使っ てワ ー ファ リ ンと 出 血リ ス クを 例

データベース研究では,既往症,合併症の情報を

に,平均因果効果(average causal eŠect)の推定に

使って交絡の調整が行われることがある.一般的に

観察確率の逆数で重みづけする inverse probability

は,解析方法としては下記の 3 つの使用法がある:

of treatment weighting (IPTW)法と通常のロジス

1 ) 層別解析, 2 ) 疾患の状態に区分, 3 ) スコア

ティック回帰分析を比較検討している.時間依存性

9092) Charlson スコア93,94) は,元々は乳がんの臨 化.

変数の影響についてはいくつかの統計手法を実施

床試験に参加予定の患者の 1 年後の死亡率の予測に

し,その利点と欠点をあわせて評価するべきである

作られたものだが,退院サマリー,レセプトデータ

と提案している.時間依存性交絡の調整について

を用いた比較的短期間の入院時死亡率,輸血,入院

は,コホート内症例対照研究による時点マッチング

9598) し 費,入院期間の予測などにも使われている.

の検討や,薬曝露リスクウィンドウの設定,IPTW

かし,合併症スコアを使用することですべての交絡

使用あるいは感度分析を実施し,疫学上の因果関係

99,100) の影響を除去できるわけではない.

を考察していくことが有用である.また, immor-

5-2-5.

5-2-6.

扱い

時間依存性交絡と immortal time bias の

tal time bias の対処には,薬の曝露は個々に時間依

臨床研究,疫学研究では,治療を受けるこ

存的に変化する点を考慮した解析方法が有効とされ

とで患者の状態が変化し,その結果治療方針も時間

ている.

とともに変更されるサイクルが繰り返される.血液

6.

検査結果は時間とともに変化し治療方針に影響する

データベースは,本来そのデータ収集目的が診療

変数であり,かつ次の治療方針を決定する要因に

報酬を目的としているため,必要なデータがすべて

なっ て いる 場合 , この 変数 を 「時 間依 存 性交 絡

入っているわけではない.さらにデータベース研究

( time-dependent

医療情報データベース研究の限界

confounder )」82) と言う.例えば,

を難しくしているのは,疾患により誤分類が起こり

糖尿病治療における HbA1c の検査値は継続的に何

得るという点にある.また,OTC 医薬品使用・疾

度も測定され,その値によって糖尿病治療薬も変更

患の重症度・ BMI ・喫煙や飲酒習慣・家族歴・検

Vol. 135 No. 6 (2015)

YAKUGAKU ZASSHI

査値などの情報がない,あるいは含まれていたとし ても欠測値が多いこともある.データベース上の処 方情報は正確な情報ではあるが,患者のコンプライ

4)

アンスを反映したものではなく,さらに医薬品のオ フラベル使用では薬剤が適用外使用されることもあ り,データベース上の疾患コードは処方のために仮

5)

の疾患である場合もある.また,データベースの種 類によっては患者の追跡が特定の病院に通院中の期

6)

間だけしかできないこともある.このようなデータ ベース研究の限界を熟知した上で,適切な対応と結 果の解釈を注意深くしていくことが必要となる. 7.

結論

疫学研究では,種々のバイアスや交絡が複雑に影 響し合って結果に影響を及ぼすことがあることは古

7) 8) 9)

くから知られている.データベース研究も,一次 データを用いた疫学研究と同じく交絡とバイアスの

10)

影響を受け易く,研究デザインから解析,結果の解 釈に至る一連の過程で医学・統計・疫学分野の研究 者の密な連携が重要である.今後は,データベース のリンケージを始めとしたデータベースの基盤づく

11) 12)

り,医薬品リスク管理計画のなかでのデータベース の位置づけに関する議論,そして産官学の連携の 下,薬剤疫学研究に精通した人材育成を強化し取り

13)

組んでいくことが重要と考える. 謝辞

本稿の作成にあたり,専門的観点から重

要なコメントを頂きました古閑

晃氏,蔡

14)

志紅

氏,竹綱正典氏,大宮將義氏,遠藤幸一氏に深謝い

15)

たします. 16)

利益相反

日本イーライリリー(株)に所属して

いた( 2011 2014 年).現在,開示すべき利益相反 はない.

17)

REFERENCES 1)

``Pharmacoepidemiology,'' Chap. 11, ed. by Strom B. L., Kimmel S. E., Hennessy S., 5th ed., Wiley-Blackwell, Chichester, 2011, pp. 162. 158 2 ) Mini-Sentinel: 〈 http: // www.mini-sentinel. , cited 3 August, 2014. org/〉 3) Ministry of Health, Labour and Welfare, Recept joho, Tokutei Kenshin tou Joho Teikyo:〈http://www.mhlw.go.jp/seisakunitsuite

18)

805

/ bunya / kenkou _ iryou / iryouhoken / reseputo /〉 , cited 3 August, 2014. U.S. Department of Veterans AŠairs, VA Information Resource Center: 〈http://www. , cited 3 August, 2014. virec.research.va.gov/〉 National Cancer Institute, SEER-Medicare: 〈 http: // appliedresearch.cancer.gov / seermedi, cited 3 August, 2014. care/overview/〉 HMO research network: 〈 http: // www. , cited 3 Auhmoresearchnetwork.org/en/〉 gust, 2014. 〈 https: // www.medicare.gov /〉 Medicare.gov: , cited 3 August, 2014. 〈 http: // www.medicaid.gov /〉 Medicaid.gov: , cited 3 August, 2014. Observational Medical Outcomes Partnership: 〈https://omop.org/〉 , cited 3 August, 2014. Government of Saskatchewan, Saskatchewan Health Services Databases: 〈http://www. , cited 3 August, 2014. health.gov.sk.ca/〉 PHARMO:〈http://www.pharmo.nl/〉 , cited 3 August, 2014. Clinical Practice Research Datalink:〈http:// www.cprd.com/home/〉 , cited 3 August, 2014. The Health Improvement Network (THIN): 〈http://www.thin-uk.com/〉, cited 3 August, 2014. Hall G. C., Sauer B., Bourke A., Brown J. S., Reynolds M. W., LoCasale R., Pharmacoepidemiol. Drug. Saf., 21, 1 10 (2012). Sørensen H. T., Sabroe S., Olsen J., Int. J. Epidemiol., 25, 435 442 (1996). Motheral B., Brooks J., Clark M. A., Crown W. H., Davey P., Hutchins D., Martin B. C., 97 (2003). Stang P., Value Health, 6, 90 The European Network of Centres for Pharmacoepidemiology and Pharmacovigilance (ENCePP), Guide on Methodological Standards in Pharmacoepidemiology (Revision 1): 〈 http: / / www.encepp.eu / standards _ and _ guidances / documents / ENCePPGuideof, cited 3 August, MethStandardsinPE.pdf〉 2014. Pharmaceuticals and Medical Devices Agency, Iryo joho no database tou wo mochiita yakuzaiekigakukenkyu no jisshi: 〈http:// www.pmda.go.jp / public / pubcome _ 250710 _ 1 /ˆle/db-ep-guideline.pdf〉 , cited 3 August,

806

YAKUGAKU ZASSHI

2014. Kimura T., Koide K., Orii T., Jpn. J. Pharmacoepidemiol., 17, 135 144 (2013). 20) ``Causality: Statistical Perspectives and Applications,'' Chap. 2, ed. by Berzuini C., Dawid P., Bernardinelli L., John Wiley & Sons, Ltd., Chichester, 2012. 21) Rothman K. J., Greenland S., Lash T. L., ``Modern Epidemiology, Chap. 9, Validity in Epidemiologic Studies,'' Lippincott Williams & Wilkins, Philadelphia, 2012. 63 22) Sackett D. L., J. Chronic Dis., 32, 51 (1979). 23) Choi B. C. K., ``Encyclopedia of Epidemiologic Methods, Bias, overview,'' ed. by Gail M. H., Benichou J., Wiley, Chichester, 2000, 82. pp. 74 24) Kleinbaum D. G., Morgenstern H., Kupper L. 463 (1981). L., Am. J. Epidemiol., 113, 452 25) Steineck G., Ahlbom A., Epidemiology, 3, 482 (1992). 477 26 ) Delgado-Rodráƒguez M., Llorca J., J. Epidemiol. Community Health, 58, 635 641 (2004). 27) Maclure M., Schneeweiss S., Epidemiology, 122 (2001). 12, 114 ) Greenland S., Pearl J., Robins J. M., 28 Epidemiology, 10, 37 48 (1999). 29) Shrank W. H., Patrick A. R., Brookhart M. 550 (2011). A., J. Gen. Intern. Med., 26, 546 920 30) Ray W. A., Am. J. Epidemiol., 158, 915 (2003). 31) Suissa S., Pharmacoepidemiol. Drug Saf., 16, 249 (2007). 241 499 32) Suissa S., Am. J. Epidemiol., 167, 492 (2008). 33) Messmer B. J., Nora J. J., Leachman R. D., 956 (1969). Cooley D. A., Lancet, 1, 954 34) Clark D. A., Schroeder J. S., Griepp R. B., Stinson E. B., Dong E., Shumway N. E., Har576 (1973). rison D. C., Am. J. Med., 54, 563 817 35) Gail M. H., Ann. Intern. Med., 76, 815 (1972). 395 (2004). 36) Suissa S., Eur. Respir. J., 23, 391 37) Horwitz R. I., Feinstein A. R., Am. J. Med., 258 (1980). 68, 255 38) Korhonen M. J., Huupponen R., Ruokoniemi P., Helin-Salmivaara A., Eur. J. Clin. Pharmacol., 65, 1167 1168 (2009).

39)

19)

40) 41)

42) 43)

44) 45) 46) 47) 48)

49) 50) 51) 52)

53)

54)

55) 56)

Vol. 135 No. 6 (2015)

Tamim H., Monfared A. A., LeLorier J., Pharmacoepidemiol. Drug Saf., 16, 250 258 (2007). Schneeweiss S., Avorn J. J., Clin. Epidemiol., 337 (2005). 58, 323 Tanaka I., Sato M., Sugihara T., Faries D. E., Nojiri S., Graham-Clarke P., Flynn J. A., Burge R. T., J. Osteoporos., 2013, 654218 (2013). Ray W. A., Gri‹n M. R., Am. J. Epidemiol., 849 (1989). 129, 837 Roos L. L., Mustard C. A., Nicol J. P., McLerran D. F., Malenka D. J., Young T. K., 212 Cohen M. M., Med. Care, 31, 201 (1993). Iezzoni L. I., Ann. Intern. Med., 127, 666 674 (1997). van Walraven C., Austind P., J. Clin. Epidemiol., 65, 126 131 (2012). Chubak J., Pocobelli G., Weiss N. S., J. Clin. Epidemiol., 65, 343 349 (2012). Nakhai-Pour H. R., Broy P., Sheehy O., B áer1720 (2011). ard A., CMAJ, 183, 1713 Nakajo K., Nojiri S., Meghan J., Taketsuna M., Maeda R., Abstracts of papers, the 30th International Conference on Pharmacoepidemiology & Therapeutic Risk Management, Taipei, October 2014. van Walraven C., Bennett C., Forster A. J., J. Clin. Epidemiol., 64, 1054 1059 (2011). Wilchesky M., Tamblyn R. M., Huang A., J. Clin. Epidemiol., 57, 131 141 (2004). Carnahan R. M., Pharmacoepidemiol. Drug Saf., 21, 90 99 (2012). Nordstrom B. L., Norman H. S., Dube T. J., Wilcox M. A., Walker A. M., Pharmacoepidemiol. Drug Saf., 16, 289 296 (2007). Okubo S., Nojiri S., Motsko S., Yan Y., Taketsuna M., Maeda R., Abstracts of papers, the 30th International Conference on Pharmacoepidemiology & Therapeutic Risk Management, Taipei, October 2014. Benchimol E. I., Manuel D. G., To T., Gri‹ths A. M., Rabeneck L., Guttmann A., J. Clin. Epidemiol., 64, 821 829 (2011). Stricker B. H., Stijnen T., Eur. J. Epidemiol., 251 (2010). 25, 245 Brookhart M. A., St äurmer T., Glynn R. J.,

Vol. 135 No. 6 (2015)

57) 58)

59)

60) 61) 62)

63) 64) 65) 66) 67)

68) 69) 70) 71) 72)

73) 74) 75)

YAKUGAKU ZASSHI

Rassen J., Schneeweiss S., Med. Care, 48, S114 S120 (2010). Walker A. M., Epidemiology, 7, 335 336 (1996). Schneeweiss S., Rassen J. A., Glynn R. J., Myers J., Daniel G. W., Singer J., Solomon D. H., Kim S. Y., Rothman K. J., Liu J., Avorn J., BMC Med. Res. Methodol., 12, 180 (2012). Vellinga A., Murphy A. W., Hanahoe B., Bennett K., Cormican M., J. Antimicrob. Chemother., 65, 1514 1520 (2010). Austin P. C., Goel V., van Walraven C., Can. J. Public Health, 92, 150 154 (2001). Liang K. Y., Zeger S. L., Biometrika, 73, 13 22 (1986). Twisk J. W. R., ``Applied Longitudinal Data Analysis for Epidemiology,'' Cambridge University Press, Cambridge, 2003. Snijders T. A. B., Bosker R. J., ``Multilevel Analysis,'' Sage, London, 1999. Etminan M., Pharmacotherapy, 24, 1105 1109 (2004). Langholz B., Clayton D., Environ. Health Perspect., 102, 47 51 (1994). Ernster V. L., Prev. Med., 23, 587 590 (1994). Essebag V., Platt R. W., Abrahamowiczand M., Pilote L., BMC Med. Res. Methodol., 5, 5 (2005). Suissa S., Garbe E., Nat. Clin. Pract. Rheumatol., 3, 725 732 (2007). Maclure M., Am. J. Epidemiol., 133, 144 153 (1991). Delaney J. A., Suissa S., Stat. Methods Med. Res., 18, 53 65 (2009). Jackson R., Scragg R., Beaglehole R., Am. J. Epidemiol., 136, 819 824 (1992). Rothman K. J., Greenland S., Lash T. L., ``Modern Epidemiology, Chap. 15, Introduction to stratiˆed analysis,'' Lippincott Williams & Wilkins, Philadelphia, 2012, pp. 258 282. Rosenbaum P. R., Rubin D. B., Biometrika, 55 (1983). 70, 41 Rosenbaum P. R., Rubin D. B., J. Am. Stat. Assoc., 79, 516 524 (1984). Guo S. Y., Fraser M. W., ``Propensity Score Analysis: Statistical Methods and Applica-

76) 77)

78) 79) 80)

81) 82)

83) 84) 85)

86) 87) 88)

89)

90) 91)

92)

93) 94)

807

tions (Advanced Quantitative Techniques in the Social Sciences),'' SAGE Publications, Thousand Oaks, 2009. Shah B. R., Laupacis A., Hux J. E., Austin P. 559 (2005). C., Epidemiology, 58, 550 Austin P. C., Mamdani M. M., Stukel T. A., Anderson G. M., Tu J. V., Stat. Med., 24, 1578 (2005). 1563 St äurmer T., Joshi M., Glynn R. J., J. Clin. Epidemiol., 59, 437 447 (2006). Drake C., Biometrics, 49, 1231 1236 (1993). Schonberger R. B., Gilbertsen T., Dai F., J. Cardiothorac. Vasc. Anesth., 28, 247 254 (2014). Sato T., Matsuyama Y., Jpn. J. Biomet., 32, S49 (2011). S35 Amari S., Sato T., Takeuchi K., Karino Y., Matsuyama Y., Ishiguro M., ``Tahenryo Kaiseki no Tenkai,'' Iwanami Shoten, Tokyo, 2002. Greenland S., Int. J. Epidemiol., 29, 722 729 (2000). Hern áan M. A., Robins J. M., Epidemiology, 372 (2006). 17, 360 Martens E. P., Pestman W. R., de Boer A., Belitser S. V., Klugel O. H., Epidemiology, 267 (2006). 17, 260 Kuroki M., Miyakawa M., Kawata R., Jpn. J. Appl. Statist., 32, 89 100 (2003). McClellan M., McNeil B. J., Newhouse J. P., JAMA, 272, 859 866 (1994). Stukel T. A., Fisher E. S., Wennberg D. E., Alter D. A., Gottlieb D. J., Vermeulen M. J., JAMA, 297, 278 285 (2007). Brookhart M. A., Wang P., Solomon D. H., 275 Schneeweiss S., Epidemiology, 17, 268 (2006). Elixhauser A., Steiner C., Harris D. R., 27 (1998). CoŠey R. M., Med. Care, 36, 8 Shwartz M., Iezzoni L. I., Moskowitz M. A., 782 Ash A. S., Sawitz E., Med. Care, 34, 767 (1996). Naessens J. M., Leibson C. L., Krishan I., Ballard D. J., Mayo Clin. Proc., 67, 1140 1149 (1992). Deyo R. A., Cherkin D. C., Ciol M. A., J. Clin. Epidemiol., 45, 613 619 (1992). Charlson M. E., Pompei P., Ales K. L., MacKenzie C. R., J. Chronic Dis., 40, 373

808

YAKUGAKU ZASSHI

383 (1987). Bennett C. L., Greenˆeld S., Aronow H., Ganz P., Vogelzang N. J., ElashoŠ R. M., Cancer, 67, 2633 2641 (1991). 96) Greenˆeld S., Apolone G., McNeil B. J., Clea154 (1993). ry P. D., Med. Care, 31, 141 97) Litwin M. S., Kahn K. L., Reccius N., J. Urol., 149, 84 88 (1993). 98) Roos L. L., Sharp S. M., Cohen M. M., Waj1206 da A., J. Clin. Epidemiol., 42, 1193 (1989). 99) Schneeweiss S., Seeger J. D., Maclure M., Wang P. S., Avorn J., Glynn R. J., Am. J. Epidemiol., 154, 854 864 (2001). 100 ) Schneeweiss S., Maclure M., Int. J. Epidemiol., 29, 891 898 (2000). 101) Robins J. M., Mathematical Modelling, 7, 1512 (1986). 1393 102) Robins J. M., Blevins D., Ritter G., Wulfsohn 336 (1992). M., Epidemiology, 3, 319 103) Robins J. M., Hern áan M. A., Brumback B., 95)

104)

105)

106)

107)

108)

Vol. 135 No. 6 (2015)

Epidemiology, 11, 550 560 (2000). Robins J. M., Hern áan M. A., ``Longitudinal Data Analysis,'' ed. by Fitzmaurice G., Davidian M., Verbeke G., Molenberghs G., Chapman and Hall/CRC Press, New York, 2009, 599. pp. 553 Daniel R. M., Cousens S. N., De Stavola B. L., Kenward M. G., Sterne J. A., Stat. Med., 1618 (2013). 32, 1584 Cole S. R., Hern áan M. A., Robins J. M., Anastos K., Chmiel J., Detels R., Ervin C., Feldman J., Greenblatt R., Kingsley L., Lai S., Young M., Cohen M., Mu ãnoz A., Am. J. Epidemiol., 158, 687 694 (2003). Sanni Ali M., Groenwold R. H., Pestman W. R., Belitser S. V., Hoes A. W., de Boer A., Klungel O. H., Eur. J. Epidemiol., 28, 291 299 (2013). Platt R. W., Delaney J. A., Suissa S., Eur. J. Epidemiol., 27, 77 83 (2012).

[Bias and confounding: pharmacoepidemiological study using administrative database].

The provision of health care frequently creates digitalized data such as hospital-based electronic data, medication prescription records, and claims d...
552KB Sizes 0 Downloads 10 Views