Leitthema Bundesgesundheitsbl 2014 DOI 10.1007/s00103-014-2104-3 © Springer-Verlag Berlin Heidelberg 2014

Einleitung Die Bewertung des Nutzens medizinischer Interventionen ist aus der wissenschaftlichen, klinischen, ökonomischen und gesundheitspolitischen Diskussion unseres Gesundheitssystems nicht mehr wegzudenken. Sie ist vielmehr in das Zentrum vieler Diskussionen gerückt. Betroffen davon sind die Markteinführung von Arzneimitteln und Medizinprodukten, die frühe Nutzenbewertung, die Erprobungsregelung gem. § 137e SGB V, die Arbeit an Leitlinien, die Diskussionen um Über-, Unter- und Fehlversorgung, die Priorisierungsdebatte sowie weitere Themen, die mit der gesundheitlichen Versorgung zusammenhängen.

Nutzen – ein Definitionsversuch Die Frage nach dem gesundheitsbezogenen Nutzen einer Intervention, sei es ein Arzneimittel, eine Operation, eine Physio- oder Psychotherapie, eine diagnostische Untersuchung oder eine Präventions- oder Früherkennungsmaßnahme, ist die Frage, ob und inwieweit Betroffene einen gesundheitlichen Vorteil durch die Intervention haben. Zum weiteren Verständnis ist eine wenigstens kursorische Betrachtung einzelner Aspekte dieses Definitionsversuchs notwendig. Ein gesundheitsbezogener Nutzen wird im Sozialgesetzbuch V (SGB V), dem zentralen Gesetz für Leistungen der Gesetzlichen Krankenversicherung, mit der Verbesserung patientenrelevanter

Jürgen Windeler · Stefan Lange Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG), Köln, Deutschland

Nutzenbewertung medizinischer Leistungen im deutschen Gesundheitswesen – rechtlicher Rahmen, historische und internationale Perspektive Endpunkte operationalisiert, wobei Aspekte der Mortalität, Morbidität und Lebensqualität genannt werden (§ 35b). Je nach konkreter Fragestellung oder Anwendungssituation werden dabei unterschiedliche Kombinationen und Gewichtungen dieser Endpunkte für die Bewertung eine Rolle spielen. Betroffene können Patienten oder Gesunde sein, Letztere etwa bei Präventionsmaßnahmen. Der Begriff umfasst keinerlei Kostenaspekte. Für entsprechend erweiterte Bewertungen ist der Begriff der KostenNutzen-Bewertung üblich. Im Gegensatz zu einer weit verbreiteten Meinung spielen solche Bewertungen und damit die explizite Berücksichtigung von Kostendimensionen im deutschen Gesundheitssystem bisher so gut wie keine Rolle. Der Begriff Nutzen wird im Sinne positiver Auswirkungen oft den Begriffen Risiko oder Schaden gegenübergestellt und es ist von Nutzen-Risiko- oder Nutzen-Schaden-Abwägung die Rede. Solange mit diesen Begriffen nur Richtungen beschrieben werden, Schaden also als negativer Nutzen verstanden wird, ist eine solche Kombination unproblematisch und für das Verständnis förderlich (streng genommen würde der Begriff Nutzen ausreichen). Die Belegung von Nutzen und Schaden mit Eigenschaften wie „intendiert“ und „nicht intendiert“ führt jedoch zu Interpretations- und Abgrenzungsproblemen und sollte vermieden werden. Die Frage nach dem Nutzen betrifft eine Entscheidungsgrundlage. Sie ist damit für den einzelnen Patienten grund-

sätzlich prospektiv und prinzipiell unsicher. Aussagen wie „Der Patient hat von der Maßnahme profitiert“ sind keine Aussagen zum Nutzen und streng genommen sinnfrei (Ausnahme deterministische Verläufe, s. u.). Zentrales Element eines Nutzenbegriffs ist – ausgedrückt in den Worten „durch die Intervention“ – die kausale Verbindung von Intervention und Auswirkung. Diese Kausalitätsanforderung, die die Nutzenfrage von anderen Fragestellungen in der Medizin unterscheidet, führt zu speziellen Anforderungen an die für ihre valide Beantwortung notwendigen Studiendesigns. Die eigentlich interessierende Aussage zu den Auswirkungen, den Effekten einer Intervention lässt sich mit einem Zitat von Stephen Senn so komprimieren: „The effect of any treatment for a given patient is the difference between what happened to the patient as the result of giving him the treatment and what would have happened had treatment been denied“ [1]. Das Kernproblem dieser Aussage liegt in der konditionalen Formulierung „would have happened“. Diese Vergleichssituation ist für einen einzelnen Patienten nicht herzustellen (der Spezialfall von Cross-over-Studien wird hier nicht betrachtet). Ein Vergleich ist zwar zwingend erforderlich, eine einzige Situation unter zwei verschiedenen Bedingungen zu beobachten, ist aber grundsätzlich nicht möglich. Ein Vorher-Nachher-Vergleich leistet dies offensichtlich (!) nicht. Der in Studien, die Fragen des Nutzens von Interventionen beantworten sollen,

Bundesgesundheitsblatt - Gesundheitsforschung - Gesundheitsschutz X · 2014 

| 1

Leitthema beschrittene „Ausweg“ besteht in dem Vergleich verschiedener Patienten unter gleichen Ausgangsbedingungen. Dieses führt zum Konzept vergleichender Interventionsstudien als angemessenem Forschungsdesign, um Aussagen über Effekte und damit Aussagen über den Nutzen zu machen. Die vom Konzept her fehlerärmsten und damit verlässlichsten sind randomisierte, kontrollierte Studien [2]. Geeignete Studien zu Nutzenfragen lassen Aussagen derart zu, dass (bezogen auf bestimmte Endpunkte) die Erfolgswahrscheinlichkeit mit einer Intervention höher (oder nicht höher) ist als ohne diese Intervention. Da die Studien so konzipiert werden (müssen), dass ein Unterschied in den Erfolgen der geprüften Intervention zuverlässig zugeschrieben werden kann, ist die Interpretation zulässig, dass dieser Unterschied „durch die Intervention“ zustande kommt. Die Anforderungen an solche Studien sind hoch. Dies hängt vor allem damit zusammen, dass Effekte häufig eher klein sind und ihre Ermittlung daher leicht von Störfaktoren beeinträchtigt werden kann. Bewegt man sich dagegen in Interventionen bzw. Situationen mit „dramatischen Effekten“ [3], so können auch die Anforderungen an die Nachweismethoden, sprich Studien, geringer sein. Bei den sehr seltenen Situationen mit deterministischen Effekten, z. B. bei der Behandlung von Patienten im hypoglykämischen Koma mit Glucose, kann man ganz auf vergleichende Studien verzichten. Hier stellt der implizite Vergleich mit einem sicher vorhersagbaren Spontanverlauf eine verlässliche Basis dar. Aussagen über Effekte einer Intervention, gleichgültig, ob man sie mit dem Begriff Wirksamkeit, Nutzen, Schaden, Efficacy, Effectiveness oder Comparative Effectiveness belegt, sind also immer Ergebnis einer vergleichenden Betrachtung, wobei dieser Vergleich möglichst nicht durch andere Einflussfaktoren gestört werden darf.

Geschichte Die Ursprünge für eine mehr als anekdotenhafte, systematische Bewertung des Nutzens medizinischer Maßnahmen werden teilweise bis in biblische Zeiten datiert (Buch Daniel 1, 1–21). Besser greifbar sind

die Anfänge empirischer Forschung im England des 17. Jahrhunderts, einer Zeit, in der auch die ersten vergleichenden, placebokontrollierten Studien durchgeführt worden sind [4]. Eine Idee für eine Studie zu einer Nutzenfrage (mit patientenrelevantem Endpunkt) skizziert z. B. van Helmont 1648: „Let us take out of the hospitals… 200 or 500 poor people, that have fevers, pleurisies. Let us divide them into halves, let us cast lots, that one half of them may fall to my share, and the other to yours; I will cure them without bloodletting and sensible evacuation; but you do, as ye know…. We shall see how many funerals both of us shall have.“ [5]. Zu Beginn des 19. Jahrhunderts sind dann sowohl Publikationen über Placebos [6] und auch einzelne klinische Studien [7] zu finden. In der folgenden Zeit bis zum Beginn des 20. Jahrhundert geriet allerdings diese empirische Denkweise – möglicherweise wegen der sehr dominierend aufblühenden naturwissenschaftlichen Forschung – wieder in den Hintergrund, um Anfang des 20. Jahrhunderts langsam wiederentdeckt zu werden. Meilensteine in Deutschland sind dabei die berühmte Schrift von Eugen Bleuler „Das autistisch-undisziplinierte Denken in der Medizin und seine Überwindung“, die 1919 erschien [8], sowie die 1932 erschienene Erstauflage von Paul Martinis „Methodenlehre der therapeutisch-klinischen Forschung“ ([9]; Titel ab der 2. Aufl.). Eine Reihe von klinischen Studien zu Nutzenfragestellungen aus den 1930er- und 1940er-Jahren führten in den 1950er-Jahren zu einem gewissen „Hype“ in der Beschäftigung mit Placebos und ihren „Effekten“, der in die berühmte Arbeit von Beecher „The powerful placebo“ mündete [10]. Immer noch war allerdings die Beschäftigung mit Fragen der empirischen Forschung zu medizinischem Nutzen eine akademische Beschäftigung, die wenig Verbindung zur medizinischen Praxis hatte. Wie in anderen Bereichen des Lebens auch, führte erst eine dramatische, negative Erfahrung zu einer intensiveren allgemeinen Diskussion (in Deutschland, die USA waren hier wesentlich schneller) und mündete schließlich in die Formulierung von gesetzlichen Regelungen, die zum ersten Mal in Deutschland die Idee einer studiengestützten Abwägung von

2 |  Bundesgesundheitsblatt - Gesundheitsforschung - Gesundheitsschutz X · 2014

Vor- und Nachteilen von Interventionen etablierten. Gemeint ist der Thalidomid (Contergan)-Skandal, der beginnend Ende der 1950er-Jahre über die Marktrücknahme Ende 1961 entscheidend dazu beitrug, dass 1976 ein komplett überarbeitetes Arzneimittelgesetz (AMG) verabschiedet wurde, das 1978 in Kraft trat. Die Vorgeschichte macht es leicht verständlich, dass es sich beim AMG vor allem um ein „Schadenabwehr“-Gesetz handelte und bis heute handelt. Dies wird aus Detailregelungen deutlich, aber vor allem daraus, dass es bei dem Leitgedanken der „Unbedenklichkeit“ darum geht, ob der Vermarktung eines Arzneimittels etwas entgegensteht, nämlich bis dahin abschätzbare Risiken die Vorteile (Wirksamkeit) überwiegen. Auch der Umstand, dass der Entzug der Zulassung nur wegen neuer Erkenntnisse zum Risiko, nicht aber bei neuen Erkenntnissen zu einem fehlenden Nutzen möglich ist, illustriert diese Grundrichtung des Gesetzes. Die durch die damaligen Diskussionen und insbesondere die gesetzlichen Regelungen stimulierte wissenschaftliche Diskussion mit zahllosen Fachartikeln und vielen, überwiegend durch fachliche Bewertungserfordernisse stimulierten wissenschaftlichen Weiterentwicklungen kann gar nicht hoch genug geschätzt werden. Sie hat bis heute zu einem umfassend ausgestalteten und teilweise sehr detaillierten, internationalen Regelwerk geführt, das zwar Anforderungen an die Bewertung von Arzneimitteln beschreibt, jedoch in weiten Teilen problemlos auf die Bewertung von anderen Interventionen übertragbar ist. Es ist sicherlich nicht ganz fern liegend anzunehmen, dass ohne die stürmische Entwicklung, die durch dieses und andere Ereignisse stimuliert worden ist, die heutige evidenzbasierte Medizin so nicht entstanden wäre. Während sich, wie beschrieben, die Arzneimittelregulierung als ein „Schadenabwehr“ Gesetz darstellt, stellte sich im Rahmen der weiteren Diskussionen zunehmend die Frage nach dem Nutzen von Arzneimitteln und anderen medizinischen Maßnahmen. Dabei kann man z. B. feststellen, dass bereits in den 1970erJahren die Frage des Nutzens von Früherkennungsmaßnahmen intensiv diskutiert und in Studien bearbeitet worden ist

Zusammenfassung · Abstract (die HIP-Studie, eine randomisierte Studie zur Bewertung der Mammografie, begann 1963), lange bevor überhaupt eine ernsthafte Diskussion über den Nutzen von diagnostischen Verfahren eingesetzt hatte. Deren Beginn kann man in Deutschland Mitte der 1980er-Jahre feststellen. Auch im Bereich der Arzneimittel stellte sich im Laufe der Zeit heraus, dass die Zulassungsanforderungen für eine angemessene Arzneimittelversorgung nicht ausreichend waren und so wurden Initiativen der Arzneimitteltransparenz gestartet und zwei Versuche unternommen, Positivlisten zu etablieren, bei denen es um die Bewertung des Nutzens von Arzneimitteln, auch im Vergleich untereinander, ging. Beide Versuche scheiterten, wie bekannt, auf der allerletzten Wegstrecke an politischen Rücksichtnahmen oder, anders ausgedrückt, an erfolgreichem Wirtschaftslobbyismus. Das Konzept einer evidenzbasierten Medizin (EbM) entwickelte sich Mitte und Ende der 1980er-Jahre in Kanada aus der Klinischen Epidemiologie, die mit dem Namen Alvan Feinstein verbunden werden muss – sein 1985 erschienenes Buch trägt übrigens die Widmung „for a new generation“ [11]. Die schnelle Verbreitung von EbM führte zu einem Meilenstein in der Etablierung einer Nutzenbewertung in Deutschland, als das Konzept 1990 Eingang in die Verfahrensordnung des Bundesausschuss Ärzte und Krankenkassen (Vorläufer des heutigen Gemeinsamen Bundesausschusses, G-BA) fand. Dort wurde im Rahmen der Bewertung von sogenannten NUBs (neue Untersuchungs- und Behandlungsverfahren) festgelegt, dass diese auf der Basis der Standards evidenzbasierter Medizin (EbM) erfolgen solle und es wurden in die Verfahrensordnung die für therapeutische und diagnostische Verfahren angemessenen Evidenzhierarchien aufgenommen. Etwas süffisant ist damals kommentiert worden, dass nur ein Land wie Deutschland gleich so weit gehen würde, EbM rechtsverbindlich zu machen. Aber diese weitsichtige Entscheidung hat den Weg dafür bereitet, dass auf der Basis einer Reihe folgender gesetzlicher Regelungen heute die Nutzenbewertung aus dem System der GKV nicht mehr wegzudenken ist. 1997 wurden die Aufgaben des Bundes-

ausschusses von „neuen“ auch auf schon etablierte Methoden ausgedehnt. Im Jahr 2000 erfolgte bei der Schaffung sogenannter Disease-Management-Programme (DMP) eine gesetzliche Festlegung auf „evidenzbasierte Leitlinien“. Die Arzneimittel- und Methodenbewertung wurde immer weiter ausgebaut, was die Konstituierung des G-BA als gemeinsames, oberstes Beschlussgremium von bis dahin fünf nebeneinander tätigen Ausschüssen sinnvoll machte, und immer stärker auf eine evidenzbasierte Nutzenbewertung umgestellt, was mit der Gründung des Instituts für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) 2004 flankiert wurde. Mit der Verabschiedung des Arzneimittelmarkt-Neuordnungsgesetzes (AMNOG) wurde 2011 die vorläufig letzte Ausbaustufe einer rechtlich gestützten Nutzenbewertung erreicht. Neben diesen rechtlichen Entwicklungen und gewissermaßen als Voraussetzung für die DMP-Regelung aus 2000 wurde die Nutzenbewertung im Sinne einer evidenzbasierten Vorgehensweise gleichzeitig im Zuge der Entwicklung von Leitlinien etabliert, wobei sich in Deutschland insbesondere die AWMF (Arbeitsgemeinschaft der wissenschaftlich-medizinischen Fachgesellschaften) und die in ihr organisierten Fachgesellschaften mit ihren methodisch ambitionierten Leitlinien hervorgetan haben. Sicher grundsätzlich kritisch zu kommentieren ist, dass die Entwicklung einer evidenzbasierten Nutzenbewertung eher „top-down“ als „bottom-up“ erfolgt ist ,mit der Nebenwirkung, dass sie heute eher als Regulierungsinstrument denn als praktische Entscheidungsunterstützung angesehen wird. Dementsprechend (aber sicher ist dies nicht der einzige Grund) begrenzt ist die tatsächliche Verbreitung und Wertschätzung in der medizinischen Versorgung.

Derzeitige Situation Das AMG kennt zwar den Begriff des Nutzens, aber dort wird er nicht definiert und findet sich zudem in zwei völlig unterschiedlichen Sinnzusammenhängen. In § 4 wird nach einer langen Reihe von „Sonstigen Begriffsbestimmungen“ unter der Nummer 28 und nach

Bundesgesundheitsbl 2014 DOI 10.1007/s00103-014-2104-3 © Springer-Verlag Berlin Heidelberg 2014 J. Windeler · S. Lange

Nutzenbewertung medizinischer Leistungen im deutschen Gesundheitswesen – rechtlicher Rahmen, historische und internationale Perspektive Zusammenfassung Nutzen in einem medizinischen Kontext beschreibt die (positiven) kausalen patientenrelevanten Folgen einer medizinischen Intervention, sei es Diagnostik oder Behandlung. Nutzenbewertungen bilden die Grundlage für rationale Entscheidungen über Leistungen in einem Gesundheitssystem. Sie basieren auf aussagefähigen Studien, die valide Aussagen zu relevanten gesundheitlichen Vor- und Nachteilen von Interventionen anstreben und liefern. Im deutschen GKV-System ist eine wissenschaftliche, evidenzbasierte Nutzenbewertung fest verankert. Ihr Anwendungsbereich könnte jedoch erweitert und ihre praktische Relevanz gestärkt werden. Schlüsselwörter Nutzen · Nutzenbewertung · Evidenzbasierte Medizin · Diagnostik · Therapie

Benefit assessment of medical services in German health service – legal framework, historical and international perspective Abstract The term benefit describes the (positive) causal, patient-relevant consequences of medical interventions, whether diagnostic or therapeutic. Benefit assessments form the basis of rational decision-making within a health care system. They are based on clinical trials that are able to provide valid answers to the question regarding the relevant benefit or harm that can be caused by an intervention. In Germany, evidence-based benefit assessments are fixed by law, i.e., the Social Code Book V. The application and the practical impact of these assessments could be improved. Keywords Benefit · Benefit assessment · Evidence-based medicine · Diagnostic · Therapy

Bundesgesundheitsblatt - Gesundheitsforschung - Gesundheitsschutz X · 2014 

| 3

Leitthema einer Definition des „mit der Anwendung des Arzneimittels verbundenen Risikos“ (27) ein „Nutzen-Risiko-Verhältnis“ beschrieben. Aus der Formulierung ist erkennbar, dass unter Nutzen die „positiven therapeutischen Wirkungen“ eines Arzneimittels verstanden werden sollen. Eine explizite Definition des Nutzens findet sich aber ebenso wenig wie eine Definition von „Wirkungen“, die etwa klar stellen könnte, wie sich diese von dem ansonsten im AMG dominanten Begriff der Wirksamkeit unterscheiden. Nur Letzterer findet sich in § 1 „Zweck des Gesetzes“ und aus der Aufzählung in § 8 2a „Wirksamkeit oder Wirkungen“ wird deutlich, dass das AMG offenbar zwischen den beiden Begriffen unterscheidet. In den §§ 29, 36, 62 und 63 findet sich eine Verwendung des Begriffes „Nutzen“ in gleichem Zusammenhang sowie in § 24b die Erwähnung eines „klinischen Nutzens“ in Zusammenhang mit der Zulassung eines Generikums, dort allerdings als abstrakter, allgemeiner Begriff. Ein gänzlich anderes Verständnis des Begriffes Nutzen enthält die Formulierung in § 40 zu Klinischen Prüfungen. „Eine klinische Prüfung eines Arzneimittels darf bei Menschen nur durchgeführt werden, wenn und solange … 2. die vorhersehbaren Risiken und Nachteile gegenüber dem Nutzen für die Person, bei der sie durchgeführt werden soll … ärztlich vertretbar sind, …“. Hier geht es also nicht um den Nutzen eines Arzneimittels, sondern um die Vorteile der Prüfungsumstände für eine individuelle Person (s. auch § 40 (4) 3) in Zusammenhang mit der Aufklärung Minderjähriger „über die Prüfung, die Risiken und den Nutzen aufzuklären, …“). Auch aus der Verwendung des Begriffes „Nutzen“ in § 41 (1) 2 wird deutlich, dass es hier nicht um den Nutzen eines Arzneimittels gehen kann: „… sie [vermutlich ist hier ‚die klinische Prüfung‘ gemeint, s. (2) 2a] muss für die Gruppe der Patienten, die an der gleichen Krankheit leiden wie diese Person, mit einem direkten Nutzen verbunden sein.“ Gesetzliche Regelungen zur Bewertung des Nutzens medizinischer Interventionen finden sich vor allem im SGB V. Untergesetzliche Regelungen, die durch die Verfahrensordnung des G-BA oder

durch Rechtsverordnungen des BMG geschaffen wurden, leiten sich aus diesem Gesetz ab. Auch das SGB V enthält keine explizite Definition des Nutzens. Die Kernanforderung (§ 2), dass „Qualität und Wirksamkeit der Leistungen dem allgemein anerkannten Stand der medizinischen Erkenntnisse zu entsprechen“ haben sowie die Bezugnahme auf EbM setzen allerdings einen unmissverständlichen Rahmen. Die Verwendung des Begriffes „Nutzen“ ist zudem konsistent mit Vorteilen einer Intervention, die sich in bestimmten Endpunktkategorien, die man mit Mortalität, Morbidität und Lebensqualität zusammenfassen kann, abbilden. Dieser Nutzen wird – teilweise ergänzt um die Attribute „Patienten-“, „therapeutisch“, „diagnostisch“ oder „medizinisch“ – thematisiert in Zusammenhang mit Früherkennungsuntersuchungen (§ 25), ausgeschlossenen Arznei-, Heil- und Hilfsmitteln (§ 34), Bewertung von Arzneimitteln (§ 35), den Aufgaben des G-BA (§ 91), den Anforderungen an Methoden (§ 92), die Bewertung von Untersuchungs- und Behandlungsmethoden (§§ 135, 137c) oder ihrer Erprobung (§ 137e), Hilfsmitteln (§§ 138, 139) sowie den Aufgaben des IQWiG (§ 139a–c). Speziell für (neue) Arzneimittel wird in Zusammenhang mit der Festsetzung von Festbeträgen als auch in der frühen Nutzenbewertung ausdrücklich die Anforderung eines „therapierelevanten höheren Nutzens“ (§ 35) bzw. eines Zusatznutzens (§ 35a) formuliert, für die Potenzialbewertung (§ 137e) ist diese Anforderung aus der Begründung ableitbar. Für Arzneimittel gibt es also zusätzlich zu den Anforderungen, die durch die Zulassung gestellt werden, Anforderungen an einen Beleg des Nutzens oder Zusatznutzens laut SGB V. Diese inhaltlichen werden noch durch zahlreiche ergänzende Regelungen zur Bildung von Erstattungspreisen sowie zu Verordnungsmöglichkeiten ergänzt. Mit dem AMNOG wurde 2011 eine tief reichende und längst überfällige Reform in der Erstattung neuer Arzneimittel eingeführt. Alle ab 2011 neu zugelassenen Arzneimittel müssen (auch bei folgenden Indikationserweiterungen) einer Bewertung unterzogen werden. In der Be-

4 |  Bundesgesundheitsblatt - Gesundheitsforschung - Gesundheitsschutz X · 2014

wertung wird geprüft, ob das neue Arzneimittel einen Zusatznutzen im Vergleich zu einer sogenannten „zweckmäßigen Vergleichstherapie“ hat. Dieser Vergleichsmaßstab wird vom Gemeinsamen Bundesausschuss festgelegt und kann als derzeitiger evidenzbasierter Versorgungsstandard verstanden werden. Falls hier, wie in der großen Mehrzahl der Fälle, Arzneimittel benannt werden, ist die Nebenbedingung zu erfüllen, dass es sich um zugelassene Arzneimittel handeln muss. Ein – vielleicht weitverbreiteter – OffLabel-Gebrauch kann also nicht als Vergleich herangezogen werden, es sei denn, es liegen positive Bewertungen gem. § 35c SGB V vor. Eine systematische Nutzenbewertung aller Arzneimittel findet jedoch weiterhin nicht statt. Nachdem zwei Versuche, Positivlisten für auf dem Markt befindliche Arzneimittel zu erarbeiten, nach Abschluss der vorbereitenden fachlichen Arbeiten an politischem Widerstand gescheitert sind, wurde Anfang 2014 auch der neueste Versuch, einen Teil dieses Marktes, nämlich noch patentgeschützte, vor 2011 auf den Markt gekommene Arzneimittel einer Bewertung zu unterziehen, abgebrochen. Als wesentlicher Grund wurden juristische Bedenken, die insbesondere auf Eingriffe in den Wettbewerb zielten, genannt. Für andere Interventionen sind die Regelungen bzgl. eines notwendigen Nutzennachweises sowohl uneinheitlich als auch in vielen Bereichen weniger streng. Dies beginnt bei „Methoden“, also den meisten nicht medikamentösen Interventionen. Für diese gilt im ambulanten, genauer vertragsärztlichen Bereich, dass sie nicht als GKV-Leistung angewendet werden dürfen, bis der G-BA diesen Gebrauch ausdrücklich erlaubt (Erlaubnisvorbehalt; § 135 SGB V). Im stationären Bereich gilt dagegen die Regel, dass solche Methoden von jedem Krankenhaus angewendet werden dürfen, solange sie nicht vom G-BA ausgeschlossen sind, d. h. ihre Anwendung in der GKV untersagt wird (Verbotsvorbehalt; § 137c SGB V). Die Begründung des Gesetzgebers für die im Jahre 2000 eingeführte Regelung im stationären Bereich umfasste die Zielsetzung, dass so im kontrollierten Setting der Klinik Erkenntnisse zu einer neuen Metho-

de gesammelt werden könnten, die der weiteren Bewertung und Einführung dieser Methode dienen könnten. Unabhängig von anderen Gründen für diese Regelung kann man feststellen, dass dieses Ziel insofern verfehlt wurde als mögliche Erkenntnisse bisher weder die notwendige Qualität noch die notwendige Verbreitung gehabt haben, um Auswirkungen im System zu zeigen. Statt einer „kontrollierten Weiterentwicklung“, so die Vorstellung des Gesetzgebers, findet faktisch eine unkontrollierte breite Anwendung statt. Für Methoden, die bestimmten Zwecken dienen (diagnostische Verfahren, hier insbesondere Laboruntersuchungen) oder die bestimmte Kriterien erfüllen, z. B. Heil- und Hilfsmittel sowie Psychotherapie, gibt es spezielle Regelungen und spezielle Bewertungsprozesse, die teilweise im G-BA selbst, teilweise auch in anderen Institutionen erfolgen. So wird die Bewertung von Hilfsmitteln für einen Eintrag in das Hilfsmittelverzeichnis vom Medizinischen Dienst der Krankenkassen vorgenommen. Neben dem Hauptweg durch den G-BA bietet das deutsche System allerdings auch für Methoden weitere Nebenwege, die z. B. über den Bewertungsausschuss oder durch die vielfältigen Möglichkeiten von Selektivverträgen führen. Mit wenigen Ausnahmen werden im Gemeinsamen Bundesausschuss Methoden auf Antrag behandelt. Antragsberechtigt sind die Organisationen der Selbstverwaltung im G-BA, die Patientenvertreter sowie die Unparteiischen – Vorsitzende und Mitglieder – selbst. Die Ausnahmen betreffen vor allem die frühe Nutzenbewertung (§ 35a) sowie die Potenzialbewertung (§ 137e). Hier hängt die Bearbeitung von Entscheidungen der Hersteller bzw. Antragssteller ab. In allen Verfahren nach § 35a und § 137e sowie in vielen anderen Bewertungsverfahren, darunter in fast allen Verfahren zu Methodenbewertungen (§§ 135, 137c), beauftragt der G-BA das IQWiG mit der wissenschaftlichen Bearbeitung. In dieser Weise sind im Gegensatz zu anderen Ländern (z. B. England) die beiden Teilaspekte solcher Entscheidungen, assessment und appraisal, auf zwei Institutionen aufgeteilt, was sich in der Praxis durchaus bewährt hat.

Das IQWiG bearbeitet diese Aufträge selbst, bindet aber in diese Arbeit externe Sachverständige ein, die im Sinne eines gemeinsamen Projekts insbesondere klinischen und methodischen Input geben. Die Auswahl der Sachverständigen erfolgt in einem sorgfältig strukturierten Prozess, um eine hohe Sachkompetenz zu gewährleisten und mögliche Interessenkonflikte zu bewerten. In diesem Verfahren werden übrigens etwa 10 % der Bewerber wegen gravierender Interessenkonflikte in Bezug auf ein bestimmtes Thema abgelehnt. Das IQWiG führt zu einem Großteil seiner Produkte selbst öffentliche Stellungnahmeverfahren durch und veröffentlicht alle Stellungnahmen zu seinen Produkten sowie die zugehörige Würdigung der Argumente durch das Institut ebenso wie alle anderen berichtsrelevanten Dokumente. Das Institut leitet seine Ergebnisse als Empfehlungen an den G-BA weiter, der diese in seinen Beratungen „zu berücksichtigen … hat“ (§ 139b). Je nach Verfahrensart erfolgt auch durch den G-BA selbst ein Stellungnahmeverfahren, sodass durch die derzeitigen Regelungen weitreichende Beteiligungsmöglichkeiten für Betroffene und Interessierte bestehen.

ziter Kosten-Nutzen-Bewertungen einbezogen und können sogar unmittelbar entscheidungsleitend sein. So hat das englische NICE (National Institute for Health and Care Excellence) gerade die Einführung eines Medikaments zur Behandlung von Prostatakrebs wegen eines ungünstigen Kosten-Nutzen-Verhältnisses abgelehnt – wohlgemerkt: bei attestiertem Nutzen, aber zu hohen Kosten. Diese Situation ist in Deutschland kaum denkbar. Allein schon die unterschiedlichen Mandate der Institutionen, die rechtliche Einbindung der Prozesse, aber auch die Grundlagen und Kriterien von Entscheidungen machen deutlich, dass Gesundheitssysteme, vielleicht vergleichbar mit Schulsystemen, eine sehr enge Einbindung in die gesellschaftlichen Werte und Haltungen eines Landes haben und hiervon, im Gegensatz etwa zu abstrakten Entscheidungen über die Marktfähigkeit von Arzneimitteln und Medizinprodukten, kaum zu trennen sind. Dies anerkennend, versuchen die europäischen Institutionen, ihre methodischen Grundlagen im Sinne wissenschaftlicher Standards gemeinsam zu formulieren, ein Prozess, der aber noch nicht abgeschlossen ist.

Internationale Einordnung

Übertragbarkeit – externe Validität

Wie in Deutschland findet auch in fast allen entwickelten Ländern, teilweise schon viel länger, eine Form von Nutzenbewertung im System einer sozialen oder staatlichen Krankenversicherung statt. Die Aufgaben und Mandate der beteiligten Institutionen sind dabei durchaus unterschiedlich und reichen von einer beratenden Funktion bis hin zu Organisationsformen in Finnland, Schweden und Großbritannien, wo die bewertenden Institutionen auch Entscheidungsbefugnis haben [12]. Viele Länder weisen jedoch gegenüber dem deutschen Regelungssystem zwei wesentliche Unterschiede auf: Die Bewertung ist Voraussetzung für ein „Reimbursement“, also – unter verschiedenen Bedingungen – für die Einführung einer Leistung in das System. Das Bewertungsverfahren stellt also eine (sogenannte vierte) Hürde im eigentlichen Sinn dar, die es in Deutschland nicht gibt. Zudem werden in vielen Ländern bei dieser Entscheidung Kostenaspekte im Sinne expli-

Das IQWiG und alle anderen Einrichtungen mit ähnlichen Aufgaben erarbeiten Nutzenbewertungen als systematische Reviews auf der Basis durchgeführter – publizierter und möglichst auch nicht publizierter – klinischer Studien. Die Fragestellung gibt vor, hier möglichst randomisierte Studien mit ausreichender Durchführungs- und Berichtsqualität heranzuziehen. Immer wieder wurden in den letzten Jahren Diskussionen darüber geführt, dass die Patienten und die Bedingungen in den für die Nutzenbewertung herangezogenen Studien nicht den Anwendungssituationen entsprechen, in denen Ärztinnen und Ärzte ihre Patienten antreffen. Unter anderem werden Zweifel damit begründet, dass von den möglichen Patienten nur ein sehr kleiner Teil in Studien zur Nutzenbewertung einbezogen werde. Vor allem aber seien gerade die Patienten, an denen man eigentlich interessiert sei, systematisch aus den Studien ausgeschlossen

Bundesgesundheitsblatt - Gesundheitsforschung - Gesundheitsschutz X · 2014 

| 5

Leitthema worden, etwa ältere, besonders gefährdete oder multimorbide Patienten. Es sei daher bedeutsam, den Nutzen „im Alltag“, in der „Versorgungsrealität“, zu untersuchen. In der Regel wird diese Forderung damit verbunden, dass die angeblichen Defizite randomisierter Studien betont und auf die vielversprechenden Möglichkeiten hingewiesen wird, mit Versorgungsdaten oder Daten aus Registern Informationen zum Nutzen zu bekommen. Die überzogenen Erwartungen, die mit Registern verbunden werden, sind nicht zu erfüllen und bergen zudem die Gefahr, auch den sinnvollen Einsatz für spezifische Zwecke zu diskreditieren. Die Frage, ob Patienten in klinischen Studien „anders“ sind als diejenigen, die Ärztinnen und Ärzte in einer konkreten Behandlungssituation antreffen, ist selbstverständlich mit „ja“ zu beantworten. Patienten in Studien unterscheiden sich schon alleine dadurch von Patienten außerhalb der Studien, weil sie zum einen ihr Einverständnis (in die Studie!) nach umfassender Aufklärung gegeben haben. Sie unterscheiden sich zum anderen, weil es sich bei den Studienpatienten um Patienten von gestern und heute, bei den zu behandelnden Patienten aber um solche von morgen und übermorgen handelt. Eine Frage könnte also höchstens sein, wie stark und bedeutsam sich die Patienten innerhalb von Studien von denen außerhalb von Studien unterscheiden. Das Kriterium für „bedeutsam“ ist aber der Unterschied in den Effekten der Therapien, wie an anderer Stelle ausführlich erläutert [13]. Es kommt also nicht auf die Unterschiede der Patienten, sondern auf die Unterschiede der Therapieeffekte an. Die Empirie dazu, dass es relevante Unterschiede gibt, ist rar und wenig überzeugend [14, 15] – was das Problem wahlweise sehr groß oder eher klein macht. Es ist dabei auch keineswegs sicher, in welche Richtung die Einflüsse der praktischen Versorgung wirken könnten, ob es hier also zu „Effektivitätsverlusten“ kommt oder, wie die Diskussion um RCTs vermuten lassen könnte, davon ausgegangen wird, dass die Effekte von Interventionen in der Versorgung ausgeprägter sind als in den Settings, in denen Studien üblicherweise durchgeführt werden.

Die Frage der „Anwendbarkeit“, der „Übertragbarkeit“ oder, abstrakter formuliert, der externen Validität liegt im Kern der gesamten Diskussion um den „Nutzen im Alltag“ zugrunde. Die Idee, den „Nutzen im Alltag“ ermitteln zu wollen, also Studien im „Alltag“ zu benötigen, rührt daher, dass man den Ergebnissen dieser Studien eine sehr hohe externe Validität zuschreibt, da hier Ergebnisse generiert werden, die direkt aus der Anwendung kommen und damit auch für die zukünftige Anwendung unmittelbar gültig sein sollen. Der Begriff Versorgungsrealität drückt dies sehr plastisch aus. Bemühungen, den „Nutzen im Alltag“ zu ermitteln, lösen aber das Problem der Übertragbarkeit grundsätzlich nicht. Dies wird bereits ausgedrückt in der Zielsetzung auf „zukünftige Patienten“. Eine Studie, die versucht, die derzeitigen tatsächlichen Rahmenbedingungen der Patientenversorgung genau abzubilden mit dem Argument, eine Abweichung von diesen Rahmenbedingungen werfe Probleme in der externen Validität und damit in der Anwendbarkeit der Studienergebnisse auf, amputiert sich selbst insofern als sie nur für diese derzeit tatsächlichen Rahmenbedingungen Gültigkeit haben kann. Jede Änderung dieser Bedingungen, jede Änderung des „Alltags“ also, würde nach dem Argument, das diese Studien für so bedeutungsvoll erklärt, unmittelbar zu ihrer Bedeutungslosigkeit führen. Wenn aber irgendetwas im Gesundheitssystem und in der Medizin generell sicher ist, dann der Umstand, dass sich die Rahmenbedingungen verändern, durch neue wissenschaftliche Erkenntnisse, durch neue Gesetze und Regeln, durch die Zulassung neuer Interventionen und vieles mehr. Eine Studie, die im derzeitigen tatsächlichen Versorgungsalltag begonnen würde, hätte, wenn die Argumente für ihre Durchführung konsequent durchgehalten würden, schon keine Bedeutung mehr, wenn ihre Ergebnisse vorliegen, da sich bereits dann die Rahmenbedingungen geändert haben werden. Es gibt auch nicht, wie die Forderung nach „Nutzen im Alltag“ suggeriert, einen Alltag, sondern viele Alltage. Studien, die in einem bestimmten Alltag durchgeführt werden, beseitigen das Übertragungsproblem, dass sich für andere Alltage ergibt,

6 |  Bundesgesundheitsblatt - Gesundheitsforschung - Gesundheitsschutz X · 2014

grundsätzlich nicht. Genauer betrachtet lösen sie das Problem nicht nur nicht, sondern sie verschärfen es noch, weil in der Blackbox des „Alltags“ noch nicht einmal die Möglichkeit besteht, kritische Rahmenbedingungen zu identifizieren und ihre Übertragbarkeit auf andere Alltage zu prüfen. Die Problematik wird noch deutlicher, wenn man sich vergegenwärtigt, dass der derzeitige Alltag alle möglichen Fehler auf allen möglichen Ebenen der Versorgung umfasst, z. B. falsche Indikationsstellungen [16]. Entscheidungen, die auf Studien beruhen, die ausdrücklich in diesem fehlerbehafteten „Alltag“ aufgesetzt werden, um den „Nutzen im Alltag“ festzustellen, müssten eigentlich eine Beibehaltung aller dieser Fehler sicherstellen, weil sonst – bei einer verbesserten Versorgung – die Nutzenaussagen hinfällig würden. Der „Alltag“ interessiert sehr, soweit dies die Umstände betrifft, unter denen Interventionen angewendet werden. Es ist auch wichtig zu untersuchen, welche dieser Umstände zu relevanten Änderungen des Nutzens führen, welches also relevante Effektmodifikatoren sind. Ohne diese Erkenntnisse ist die Messung des „Nutzens im Alltag“ irrelevant, mit diesen Erkenntnissen braucht man den Nutzen nicht mehr zu erheben. Man wird einer Forderung zustimmen, dass neue Interventionen nicht nur gegen Placebo, sondern selbstverständlich auch gegen den aktuellen Versorgungsstandard in einem Gesundheitssystem geprüft werden müssen. Man mag auch einer Forderung zuneigen, dass Studien unter gesetzten (!) Rahmenbedingungen durchgeführt werden sollten, die eine gewisse Nähe zur Versorgungsrealität haben. Man kann dies auch so interpretieren, dass Rahmenbedingungen zumindest keine Aspekte enthalten, die einerseits für die Effekte wichtig sein könnten und andererseits im „Alltag“ nie vorkommen (z. B. sogenannte Run-in-Phasen). Viele klinische Studien werden heute so durchgeführt, dass sie diese Anforderungen mehr oder weniger gut erfüllen. Nutzenbewertungen sind auf dieser Basis möglich. Dass dabei Fragen offenbleiben, ist selbstverständlich. Sie sind mit gezielten Studien zu beantworten. Der Ruf nach „Alltag“ hilft hier nicht weiter. Mehr

noch, er ist geeignet, die valide Beantwortung relevanter Fragen zu blockieren.

Fazit/Ausblick Die Nutzenbewertung medizinischer Interventionen als Grundlage für Systementscheidungen ist aus dem deutschen Gesundheitswesen nicht mehr wegzudenken. Damit sind die Prinzipien der EbM in der medizinischen Versorgung in Deutschland zwar angekommen, aber noch nicht heimisch, wie es jüngst Christopher Baethge, Schriftleiter der Medizinisch-Wissenschaftlichen Redaktion des Deutschen Ärzteblatts, auf dem Parlamentarischen Abend des IQWiG anlässlich des 10-jährigen Jubiläums der gleichnamigen Stiftung formuliert hat [17]. Dies hat vielfältige Ursachen, und es wird eine der zukünftigen Herausforderungen sein, all denjenigen, die an einem rationalen, gerechten und nachhaltigen Gesundheitssystem interessiert sind, ein wohliges Gefühl zu vermitteln, wenn von evidenzbasierter Medizin die Rede ist. Wenn das gelingt, dürften vermeintlich notwendige Rationierungsdebatten der Vergangenheit angehören. Das heißt nicht, dass nicht KostenNutzen-Bewertungen ein hilfreiches Instrument für eine faire Preisbildung darstellen können und es erscheint sinnvoll, hierzu bald in eine konstruktive Diskussion einzutreten. Weiterhin gilt es, Voraussetzungen und Strukturen dafür zu schaffen, dass auch bei nicht medikamentösen Untersuchungs- und Behandlungsmethoden gute klinische Studien mit patientenrelevanten Ergebnissen nicht mehr die Ausnahme, sondern eine Selbstverständlichkeit sind. Eine Herausforderung wird in der Ausgestaltung gemeinsamer Methoden und Standards für die Nutzenbewertung im Rahmen des europäischen HTA-Netzwerks liegen, und zwar nicht im Sinne eines kleinsten gemeinsamen Nenners, sondern auf höchstem Niveau. Dies bedarf auch politischer Unterstützung. Das Arzneimittelgesetz von 1976 hat gezeigt, dass auch dicke Bretter durch geduldiges, beständiges Bohren zu bewältigen sind.

Korrespondenzadresse Prof. Dr. J. Windeler Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG), Im Mediapark 8 50670 Köln [email protected]

Einhaltung ethischer Richtlinien Interessenkonflikt.  J. Windeler und S. Lange geben an, dass kein Interessenkonflikt besteht.

15. Zink A, Strangfeld A, Schneider M et al (2006) Effectiveness of tumor necrosis factor inhibitors in rheumatoid arthritis in an observational cohort study: comparison of patients according to their eligibility for major randomized clinical trials. Arthritis Rheum 54:3399–3407 16. Wu J, Zhu S, Yao GL, Mohammed MA, Marshall T (2013) Patient factors influencing the prescribing of lipid lowering drugs for primary prevention of cardiovascular disease in UK general practice: a national retrospective cohort study. PLoS One 8:e67611 17. Baethge C (2014) Evidenzbasierte Medizin: In der Versorgung angekommen, aber noch nicht heimisch. Dtsch Ärztebl 111:A-1636

Dieser Beitrag beinhaltet keine Studien an Menschen oder Tieren.

Literatur   1. Senn S (1997) Statistical issues in drug development. Wiley, Chichester   2. Windeler J, Antes, G, Behrens J, Donner-Banzhoff, N, Lelgemann M (2008) Randomisierte kontrollierte Studien. Kritische Evaluation ist ein Wesensmerkmal ärztlichen Handelns. Dtsch Ärztebl 105:A565–A570   3. Glasziou PP, Chalmers I, Rawlins M, McCulloch P (2007) When are randomised trials unnecessary? Picking signal from noise BMJ 334:349–351   4. Tröhler U (2000) To improve the evidence of medicine. The 18th century British origins of a critical approach. Royal College of Physicians, Edinburgh   5. Silverman WA, Chalmers I (2002) Casting and drawing lots: a time-honoured way of dealing with uncertainty and for ensuring fairness. JLL Bulletin: Commentaries on the history of treatment evaluation. The James Lind Library. www.jameslindlibrary.org. Zugegriffen: 3. Sept. 2014   6. Tröhler U (1992) Die therapeutische „Erfahrung“ – Geschichte ihrer Bewertung zwischen subjektiv sicherem Wissen und objektiv wahrscheinlichen Kenntnissen. In: Köbberling J (Hrsg) Die Wissenschaft in der Medizin. Schattauer, Stuttgart, S 65– 82   7. Louis PCA (1835) Recherches sur les effets de la saignée dans quelques maladies inflammatoires et sur l‘action de l’émétique et des vésicatoires dans la pneumonie. Librairie de l’Académie royale de medicine, Paris   8. Bleuler E (1919) Das autistisch-undisziplinierte Denken in der Medizin und seine Überwindung. Springer, Berlin   9. Martini P (1932) Methodenlehre der therapeutischen Untersuchung. Springer, Berlin 10. Beecher HK (1955) The powerful placebo. JAMA 159:1602–1606 11. Feinstein AR (1985) Clinical epidemiology: the architecture of clinical research. Saunders, Philadelphia 12. Bertelsmann H, Roters D, Bronner D (2007) Vom Nutzen der Nutzenbewertung: Die Prinzipien der evidenzbasierten Medizin und des Health Technology Assessments als Entscheidungsgrundlage des Gemeinsamen Bundesausschusses. Z Evid Fortbild Qual Gesundhwes 101:455–462 13. Windeler J (2008) Externe Validität. Z Evid Fortbild Qual Gesundhwes 102:253–260 14. Price D, Musgrave SD, Shepstone L et al (2011) Leukotriene antagonists as first-line or add-on asthma-controller therapy. N Engl J Med 364:1695– 1707

Bundesgesundheitsblatt - Gesundheitsforschung - Gesundheitsschutz X · 2014 

| 7

[Benefit assessment of medical services in German health service - legal framework, historical and international perspective].

The term benefit describes the (positive) causal, patient-relevant consequences of medical interventions, whether diagnostic or therapeutic. Benefit a...
139KB Sizes 2 Downloads 8 Views