Praxisberichte 5 – Trügerische Surrogate: Messen, was gut aussieht

Nicht jedes erfolgreich getestete Medikament bringt Patienten tatsächlich auch einen Nutzen. Das liegt daran, dass Mediziner den Erfolg immer wieder anhand so genannter Surrogatparametern testen. Cholesterinspiegel, Blutdruck, Herzrhythmus und andere physiologische Parameter lassen sich leicht messen, ihre Verbesserung bedeutet aber nicht zwangsläufig, dass Patienten auch länger leben. Martina Keller erklärt, wann Journalist*innen aufpassen müssen.

Von Martina Keller

Der Fall ist ein medizinischer Klassiker: Infarktpatienten mit einer bestimmten Form von Herzrhythmusstörungen wurden jahrzehntelang mit so genannten Klasse I-Antiarrhythmika behandelt. Diese Medikamente sollten die Überlebenschancen der gefährdeten Patient*innen verbessern, indem sie den Herzrhythmus normalisierten. „Das habe ich selber in den 1980er Jahren tun müssen“, erinnert sich der Mediziner Peter Sawicki an seine Zeit als junger Arzt: „Man dachte, man nützt den Patienten damit.“ Doch das Gegenteil war der Fall, wie sich später herausstellte: Die Patient*innen starben häufiger als andere Kranke, die in Studien lediglich ein Scheinmedikament bekommen hatten. Als dies zweifelsfrei nachgewiesen wurde, war es für viele Betroffene zu spät. „Zigtausende von Patienten sind gestorben“, sagt Sawicki, der später das Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) in Köln aufbaute und nun an der Universität Köln lehrt.

Was war falsch gelaufen? Bei der klinischen Prüfung der Antiarrhythmika hatte man sich damit begnügt, deren Wirkung auf ein Ersatzkennzeichen („Ersatzendpunkt“ oder „Surrogatparameter“) zu untersuchen: die Normalisierung des Herzschlags. Da ein unregelmäßiger Herzschlag bei Infarktpatienten ein erhöhtes Risiko zu sterben bedeutet, nahm man wie selbstverständlich an, Patienten würden generell länger leben, wenn es nur gelänge, ihr Herz wieder in Takt zu bringen. Erst eine Studie namens „Cardiac Arrhythmia Suppression Trial“ untersuchte das, was für betroffene Patienten wirklich zählt – ob die Medikamente tatsächlich das Leben verlängern.

Surrogatparameter sind praktisch

Solche Ersatzkennzeichen oder Surrogatparameter in Studien sind Vorstufen von Krankheitsereignissen wie beispielsweise Schlaganfall, Herzinfarkt, Verlust der Sehkraft, Nierenversagen oder Tod. Meist handelt es sich bei diesen Parametern um physiologische oder biochemische Marker, deren Veränderung für den Patienten nicht unmittelbar spürbar ist. Man merkt ja nicht gleich, ob der Cholesterinspiegel oder der Blutdruck steigt. Forscher*innen bieten diese Ersatzkennzeichen einige Vorteile: Sie lassen sich leicht messen und in relativ kurzer Beobachtungszeit ist feststellbar, ob sich etwas verändert hat.

Ersatzkennzeichen werden daher häufig durch statistische Korrelation gefunden, etwa in großen epidemiologischen Studien: Ein erhöhter Blutdruck geht mit einem erhöhten Schlaganfallrisiko einher; erhöhte LDL-Cholesterinwerte sind ein Risikofaktor für Herzinfarkt; verringerte Knochendichte deutet auf Osteoporose hin; die Anzahl der CD4-Zellen, eine Form der weißen Blutkörperchen, sagt etwas über das Risiko aus, an Aids zu sterben; ein erhöhter Blutzuckerwert ist ein Anzeichen für Diabetes; vermehrte Eiweißausscheidung im Urin deutet auf ein erhöhte Risiko für Nierenversagen hin.

In frühen Stadien der Arzneimittelentwicklung sind solche Ersatzkennzeichen wichtig, um Hypothesen zu bilden und Anhaltspunkte für Wirkzusammenhänge zu finden. Wenn man aus – durchaus plausiblen – physiologischen Zusammenhängen jedoch vorschnell Behandlungsstrategien ableitet, kann es gefährlich werden. Viele fatale Irrtümer in der Medizingeschichte beruhen auf falschen Annahmen über die Bedeutung eines Surrogatparameters:

  • Lungenkrebs geht mit einem erniedrigten Vitaminspiegel einher. Als man Hochrisikopatienten vorsorglich Vitamin E oder Beta-Carotin gab, stieg zwar der Vitaminspiegel im Blut, doch die Probanden bekamen im Durchschnitt sogar häufiger Lungenkrebs und starben vermehrt (1).
  • Um die Knochendichte von Frauen nach der Menopause zu erhöhen, gab man ihnen Natriumfluorid. Tatsächlich wurden die Knochen dichter, doch die Zahl der Knochenbrüche – die man damit eigentlich vermeiden wollte – nahm ebenfalls zu (1).
  • Die Medikamente Tolbutanid und Phenformin, die den Blutzuckerspiegel (einen Risikofaktor für Herzerkrankungen) senken sollten, haben genau dies getan. Bloß stieg gleichzeitig mit der Behandlung die Rate an Herztoten (1).
  • Um Herzkreislauferkrankungen vorzubeugen, gab man Patienten mit erhöhtem Blutdruck Doxazosin oder ein Vergleichspräparat. Daraufhin stieg die Rate der von Herzschwäche Betroffenen in der Doxazosin-Gruppe (1).
  • Bei Blutarmut, ausgelöst durch Nierenerkrankungen, hat man durch das Hormon EPO den Hämoglobinwert erhöht. Auf die Sterblichkeit hatte das keinen Einfluss – im Gegenteil, es gibt Hinweise für eine erhöhte Sterblichkeit (2).
  • Das Festhalten an einem Ersatzkennzeichen kann auch dazu führen, dass man therapeutische Chancen nicht nutzt. So hat man Patienten mit Herzschwäche lange Zeit keine Betablocker gegeben. Betablocker verlangsamen den Herzschlag. Auf Grund von Annahmen über die Physiologie des Herzens dachte man, dies schade Herzpatienten. Tatsächlich ist mittlerweile nachgewiesen, dass Betablocker das Leben der Betroffenen verlängern können (2).

Einer der folgenreichsten Irrtümer im Umgang mit Surrogatparametern war bisher wohl die Hormonbehandlung von Frauen während oder nach den Wechseljahren. In epidemiologischen Studien hatte man zahlreiche vermeintlich schützende Wirkungen von Östrogen-Hormonen entdeckt: Sie senken den Cholesterin- und Blutzuckerspiegel und wirken als Antioxidans. Sie sind wichtig für das Gehirn, verbessern beispielsweise den Blutfluss und beeinflussen die Neurotransmitter. Schließlich verbessern sie die Zellfunktion der Schleimhäute im Genitalbereich.

All diese Beobachtungen hielt man für Kausalzusammenhänge; man vermutete also, dass Östrogen diese Faktoren direkt beeinflusst, und schloss daraus auf einen therapeutischen Nutzen. Man nahm an, die Östrogengabe führe bei Frauen in der Menopause zu weniger Herzinfarkten, Schlaganfällen und Lungenembolien, sie vermindere Alzheimer und Demenz und wirke Inkontinenz entgegen. Das Gegenteil war letztlich der Fall: Die Zahl der Herzinfarkte, Schlaganfälle und Lungenembolien war unter der Hormontherapie deutlich erhöht, Demenz und Alzheimer traten vermehrt auf, ebenso Inkontinenz (1).

Heute weiß man, warum es bei der Hormonersatztherapie zu Fehlschlüssen kam. Epidemiologische Studien sind nur selten geeignet, um kausale Zusammenhänge zu entdecken. So hatte man in den Studien Frauen mit einem besonders hohen Risiko für Herzkreislauf-Erkrankungen von der Östrogenbehandlung ausgeschlossen. Das erklärte die geringere Zahl der Herzinfarkte und Schlaganfälle in der Gruppe. Zudem waren die Frauen, die sich für eine Östrogenbehandlung entschieden, durchschnittlich gesünder und gesundheitsbewusster und gehörten einer höheren sozialen Schicht an als jene Frauen, die nicht mit Hormonen behandelt wurden. All dies sind Faktoren, die mit einer deutlich niedrigeren Erkrankungshäufigkeit und Sterblichkeit einhergehen und somit die Ergebnisse verzerrten.

Aus den in den vergangenen 30 Jahren bekannt gewordenen Fehlschlägen haben Mediziner in der Krebsbehandlung offenbar wenig gelernt. Eigentlich sollen Krebstherapien zeigen, dass die Patient*innen infolge der Behandlung länger leben oder doch eine deutlich bessere Lebensqualität haben. Doch Studien, in denen diese Parameter untersucht werden, dauern lange und sind teuer. Hersteller, aber auch Selbsthilfegruppen argumentieren oft, man dürfe Patienten in verzweifelter Lage ein hoffnungsvolles Medikament nicht so lange vorenthalten, bis ein solcher Nutzen definitiv erwiesen sei. Deshalb lassen Zulassungsbehörden wie European Medicines Agency (EMA) oder ihr amerikanisches Pendant, die Food and Drug Administration (FDA), Krebsmedikamente oft eben doch auf der Basis von Surrogatparametern zu. In den betreffenden Studien wird dann beispielsweise untersucht, ob der Tumor durch die Behandlung kleiner wird oder sogar vorübergehend verschwindet.

Ob man den Patient*innen damit wirklich etwas Gutes tut, ist eine andere Frage. Beispiel Nierenzellkrebs. Gleich ein halbes Dutzend neue, sehr teure Mittel sind seit 2006 gegen diese im fortgeschrittenen Stadium schwer behandelbare Erkrankung auf den Markt gekommen. Nur für eines der Präparate – und dort für eine kleine Patientengruppe – ist bislang jedoch belegt, dass die Betroffenen aufgrund der Therapie tatsächlich länger leben.

Was ist entscheidend: länger leben oder Tumorwachstum?

Wie sehr sich Hersteller gegen die langwierige und mühsame Untersuchung eines wirklich wichtigen Endpunkts sträuben, zeigt das Beispiel Everolimus gegen Nierenzellkrebs. Dabei hatte der Hersteller des Mittels (Novartis) zunächst vorbildlich gehandelt und im Vorfeld der entscheidenden Zulassungsstudie den Rat des wissenschaftlichen Komitees der europäischen Arzneimittelagentur EMA eingeholt. Novartis wollte wissen, was als Ziel der Studie festgelegt werden solle. Die Antwort des Komitees lautete, Novartis solle die Studie so anlegen, dass am Ende klar wäre: Die Patienten leben mit Everolimus länger – oder eben nicht (3).

Ein kluger Rat – im Sinne unseres Themas. Bindend ist so eine Empfehlungen allerdings nicht. Novartis setzte sich prompt darüber hinweg und legte seine Untersuchung auf einen Ersatzparameter aus: die Frist bis zum Fortschreiten der Krebserkrankung, das sogenannte progressionsfreie Überleben (engl. progression free survival). Als bei einer Zwischenanalyse belegt war, dass die Behandlung mit Everolimus das Weiterwachsen des Nierenzellkrebs um drei Monate hinausschob, brachen die Forscher die Studie ab. Was aber ist für die Patienten durch den Krankheitsaufschub gewonnen? Leben sie länger, weil ihre Krankheit unter der Behandlung drei Monate länger Ruhe gibt?

„Dass ein Krebs so zurückgedrängt wird, ist zwar ein gutes Zeichen“, sagt Stefan Lange, stellvertretender Institutsleiter des IQWIG, „es ist aber keine Garantie dafür, dass eine Therapie einen Nutzen hat.“ (4) Nur für fortgeschrittenen Darmkrebs (und hier für ein anderes Medikament) ist bislang bewiesen, dass ein zeitweiliger Stopp des Tumorwachstums das Leben verlängert – wenngleich nicht in dem Ausmaß, den der Effekt auf den Ersatzmarker erwarten ließ.

Aus Patientensicht ist das Resultat der Everolimus-Studie also unbefriedigend. Für Hersteller Novartis hatte das Studiendesign hingegen gleich mehrere Vorteile: Die Frist, bis eine Krebserkrankung fortschreitet, ist kürzer als die Zeitspanne bis zum Tod eines Patienten. Die Studie wird schneller beendet, kommt aus statistischen Gründen mit einer geringeren Zahl von Probanden aus und ist somit deutlich preiswerter. Zudem riskierte Novartis nicht, dass die guten Zwischenergebnisse am Ende noch widerlegt wurden. Wie stünde es schließlich um das Marketing für ein neues Medikament , wenn am Ende nur eine minimale Lebensverlängerung bewiesen worden wäre? Die EMA stellt in ihrem Bewertungsbericht zu Everolimus folgerichtig fest, der Aufschub der Krankheit sei möglicherweise »nicht klinisch relevant«. Es sei nicht nachgewiesen, dass die Patienten länger lebten (5).

Warum hat die EMA als Zulassungsbehörde Everolimus dann trotzdem zugelassen? Unter vernünftigen Annahmen und bei Betrachtung aller Daten sei ein klinischer Nutzen „reasonably likely“, also ziemlich wahrscheinlich, so der Pressesprecher der Agentur auf Anfrage. Die Diskrepanz lässt sich jedoch auch so interpretieren: Offenbar nimmt die EMA erhebliche Unsicherheiten in Kauf und hält sich nicht an ihre eigenen Standards, die sie den Pharmaherstellern zuvor empfohlen hat.

Unklar, welche Surrogatparameter geeignet sind

In Deutschland hat das IQWIG im Auftrag des Gemeinsamen Bundesausschusses (G-BA) untersucht, ob sich die Aussagekraft eines Ersatzkennzeichens bei Krebstherapien verlässlich einschätzen lässt. Das Institut kommt zu einem zwiespältigen Ergebnis: Einerseits gibt es geeignete statistische Methoden, mit denen die Aussagekraft von Ersatzendpunkten beurteilt werden kann (6). Die positive Beeinflussung des Ersatzendpunkts wäre in diesem Fall eine gute Prognose für den weiteren Krankheitsverlauf. Am Beispiel Brust- und Darmkrebs hat das IQWIG aber gezeigt, dass diese Methoden bislang noch nicht konsequent eingesetzt wurden. „Bei diesen häufigen Krebsarten ist deshalb heute unklar, welche Surrogatendpunkte sich zur Vorhersage eines Nutzens eignen“, so IQWIG-Forscher Lange.

Ob Krebstherapie oder andere Behandlungen: Wer beweisen will, dass ein Ersatzendpunkt aussagekräftig ist, muss viel forschen. Es reicht nicht zu zeigen, dass der Zusammenhang zwischen Ersatzmarker und tatsächlichem Ziel (Endpunkt) biologisch plausibel ist. Auch eine einzelne hochwertige Untersuchung nach dem Goldstandard für Studien (RCT, siehe Folge 1 und 2 unserer Serie) ist nicht genug. Am besten gelingt der Nachweis für die Aussagekraft eines Ersatzkennzeichens durch eine zusammenfassende Analyse verschiedener kontrollierter randomisierter Studien, die jeweils beides untersucht haben: den Ersatzmarker und den wirklich wichtigen Endpunkt. Übertragen lassen sich solche Ergebnisse aber nicht – für jeden einzelnen Wirkstoff und jede Behandlung muss die Aussagekraft eines Ersatzparameters gesondert geprüft werden.

Und was heißt das alles für Medizinjournalisten, die täglich mit Studien konfrontiert werden, in denen nur Surrogatparameter und Risikofaktoren untersucht werden, anstatt die für Patienten wirklich wichtigen Faktoren? Oft finden sich in den Publikationen zu einer Studie selbst Hinweise auf die Begrenzungen der Aussagekraft. Im Zweifel sollte man mit unabhängigen Experten besprechen, was sich aus einer Untersuchung folgern lässt. Grundsätzlich ist bei Surrogatparametern immer Skepsis angebracht, findet Gary Schwitzer, Herausgeber von HealthNewsReview, des amerikanischen Pendant zum Medien-Doktor: „Wir müssen den Kollegen helfen die Studien aufzuspüren, die nur Ergebnisse von Testskalen, Ersatzmarkern, Zwischenanalysen zeigen – Studien, die scheinbar nahelegen, dass Risikofaktoren für eine Krankheit selbst schon Krankheiten sind. Wir müssen den Kollegen helfen darüber nachzudenken, welche Ergebnisse für das Leben der Menschen tatsächlich einen Unterschied machen.“(7)

QUELLEN:

1. Ingrid Mühlhauser, Gabriele Meyer: Evidence Based Medicine: Widersprüche zwischen Surrogatergebnissen und klinischen Endpunkten. Psychother Psychosom Med Psychol 2006;56:193-2011

2. Sandra Mangiapane, Marcial Velasco Garrido: Surrogatendpunkte als Parameter der Nutzenbewertung. (pdf), HTA-Bericht 91 in der Schriftenreihe Health Technology Assessment (HTA) in der Bundesrepublik Deutschland

3. Martina Keller, Der Preis des Lebens, in: Die Zeit, Heft 04/2011 vom 20.1.2001

4. IQWiG: Wie man früh erkennen kann, ob eine neue Krebstherapie das Leben verlängert, Pressemitteilung, 28.2.2011, https://www.iqwig.de/presse/pressemitteilungen/pressemitteilungen-detailseite_10866.html

5. EMA (2009): CHMP Assesment Report For Afinitor International Nonproprietary Name: Everolimus (pdf), http://www.ema.europa.eu/docs/en_GB/document_library/EPAR_- _Public_assessment_report/human/001038/WC500022817.pdf

6. IGWiG-Berichte (2011): Aussagekraft von Surrogatendpunkten in der Onkologie (pdf), https://www.iqwig.de/download/A10-5_Rapid_Report_Version_1-1_Surrogatendpunkte_in_der_Onkologie.pdf

7. HealthNewsReview (2011): Advertising a different way to fight cholesterol – but without evidence on big outcomes, http://www.healthnewsreview.org/2011/04/advertising-a-different-way-tofight-cholesterol-but-without-evidence-on-big-outcomes/


Alle Folgen unserer Medizinjournalismus-Serie finden sich auf unserer Specials-Seite.