„Große Zahlen liefern ein statistisch gesehen genaues Ergebnis, von dem man nicht weiß, auf wen es zutrifft. Kleine Zahlen liefern ein statistisch gesehen unbrauchbares Ergebnis, von dem man aber besser weiß, auf wen es zutrifft. Schwer zu entscheiden, welche dieser Arten von Unwissen die nutzlosere ist.“ (1) Diese Aussage stammt von keinem homöopathischen Nobody sondern von Prof. Dr. Hans-Peter Beck-Bornholdt und PD Dr. Hans-Hermann Dubben vom Universitätsklinikum Hamburg-Eppendorf. Beide haben erhebliche Zweifel an der Aussagekraft unserer derzeitigen statistischen Medizin. Man könnte sagen, sie berechnen nicht nur Statistiken. Sie fragen sich auch, wie aussagekräftig diese Berechnungen eigentlich sind.

Kritik ist nicht neu

Obgleich ein solches Nachdenken eher ungewöhnlich ist, so ist es nicht neu. Bereits vor etwa 150 Jahren formulierte Claude Bernard, einer der Väter der wissenschaftlichen Medizin, in ganz ähnlicher Weise:

Es heißt, dass der Zufall so bedeutsam für statistische Fehler ist, dass unsere Schlussfolgerungen nur auf großen Zahlen basieren sollten. Aber Ärzte haben nichts mit dem zu tun, was man das Gesetzt der großen Zahlen nennt, ein Gesetz, das nach dem Ausspruch eines großen Mathematikers, im Generellen immer richtig und  Speziellen immer falsch ist.“ (2)

Beispielsweise machte sich Bernard über einen Kollegen lustig, der auf den Toiletten in Postkutschen-Raststätten Urin sammelte, um einen durchschnittlichen Urin eines Europäers zu erhalten. Bernards Kritikpunkt war, dass ein solcher Urin nicht aussagekräftig sei, weil er in dieser Form in der Realität nicht vorkomme. Heute würde man sagen: Ein solches Ergebnis hat keine semantische Relevanz. Das klassische Beispiel der Statistik für dieses Phänomen ist die Geburtenrate, die bei einer deutschen Frau 1,37 beträgt. Eine solche Zahl mag vielleicht für die Planung der Kindergärten eine gewisse Bedeutung haben. Sie ist jedoch bedeutungslos für die einzelne Frau, da sie niemals 1,37 Kinder gebären wird.

Die Verhältnisse in der Medizin sind absolut vergleichbar. Zwar geben Statistiken einen gewissen Hinweis darauf, was bei einem bestimmten Patienten in etwa passieren könnte. Sie sagen aber mit „an Wahrscheinlichkeit grenzender Sicherheit“ (3) nichts darüber aus, wie ein realer Patienten reagieren wird.

Ich habe dieses Phänomen als Praktiker-Paradox bezeichnet. Dieser Begriff meint, dass ein praktizierender Arzt Wissen über physiologische und biochemische Einzelvorgänge und Wissen über Kollektive besitzt, sich aber einem einzelnen Patienten gegenüber befindet, für den es letztlich keinerlei Evidenz gibt.

Zur Illustration folgende Studie:
Kovacs et al. führten eine randomisierte Doppelblindstudie über den Einfluss der Matratzenhärte bei chronischem Rückenschmerz durch (4). Die Matratzenhärte wird bei vielen Patienten mit chronischem Rückenschmerz als wesentlicher Faktor betrachtet. Die Studie bewies, dass im Durchschnitt die mittelharte Matratze zu den wenigsten Beschwerden führte. Sollen nun alle Patienten auf einer mittelharten Matratze schlafen? Auch die 10 Prozent, die vermehrt Schmerzen hatten? Der Statistik zuliebe, sozusagen. Oder auch diejenigen, die auf härteren und weicheren Matratzen bessere Ergebnisse hatten?

Wir müssen also den Patienten beobachten und das therapeutische Schema anhand unserer Beobachtung anpassen. Aber hier versagt unsere statistische Medizin vollständig. Es gibt keine Methode, individuelle Reaktionen des Patienten zu beurteilen, außer dem gesunden Menschenverstand, der leider zu oft eher zu ungesunden Resultaten führt. Dieser völlige Mangel an einer Methodik zur individuellen Beurteilung und Prognostik ist ein wesentliches Charakteristikum der derzeitigen statistischen Medizin.

Lassen sich „Tailored Medicine“ und „statistische Evidenz“ vereinbaren?

Sobald wir nämlich unsere Therapie dem Patienten entsprechend anpassen, was man derzeit als ‚tailored medicine’ bezeichnet, haben wir den sicheren Boden der ‚statistischen Evidenz’ verlassen. Das heißt, je individueller wir eine Therapie gestalten, desto sicherer wird sie ein gutes Ergebnis aufweisen. Aber desto sicherer wird sie aber auch zu einer wenig verlässlichen Statistik führen. Das ist es, was Beck-Bornholdt und Dubben sagen. Das ist es auch, was alle Studien zur Homöopathie und Akupunktur zeigen: Je maßgeschneiderter und folglich statistisch unzuverlässig eine Studie ist, desto sicherer wird sie ein positives Ergebnis zeigen. Je statistisch zuverlässiger eine Studie ist und folglich für einen realen Patienten wenig relevant, desto sicherer werden Homöopathie und Akupunktur nicht besser abschneiden als ein Placebo. Dennoch werden beide Verfahren besser wirken als eine orthodoxe medikamentöse Standardtherapie. Dieses Wirksamkeits-Pradox gilt es an anderer Stelle genauer zu untersuchen.

Hier soll das Gesagte nochmals mit einer anderen Studie illustriert werden:
In einer Studie zu Rückenschmerzen wurde eine standardisierte Physiotherapie (Massage, Kälte- und Wärmeapplikationen usw.) mit der standardisierten Empfehlung ‚weiter aktiv zu bleiben’ verglichen (5). Dieses Studiendesign mag zwar den statistischen Erfordernissen entsprechen. Aber wer nur ein wenig Ahnung von Physiotherapie hat, weiß, dass das, was einer Person nutzt, einer anderen schaden kann. Physiotherapeutische Anwendungen müssen sehr individuell verordnet und nach der Reaktion des Patienten angepasst werden. Es ist also nicht erstaunlich, dass die Physiotherapie in der obigen Studie kein besseres Ergebnis erbrachte als die Empfehlung, aktiv zu bleiben.

Physiotherapie muss, wie jede regulative Therapie maßgeschneidert sein. Aber das mögen die Statistiker gar nicht. Und genau damit haben wir in der Homöopathie zu kämpfen, denn es scheint irgendwie nicht möglich zu sein, dieses Problem den Statistikern und EBM‘lern verständlich zu machen.

Im Grunde gilt: Je statistisch solider eine Studie ist, desto schlechter ist die praktizierte Medizin. Das ist besonders auffällig bei regulativen Verfahren. Es trifft aber auch bei jeder anderen Form der klassischen medikamentösen Therapie zu.

Ich denke, es ist an der Zeit, sich ein wenig mehr über die Reaktionsmuster und –fähigkeiten der Patienten Gedanken zu machen. Dazu muss man auch die Semantik der Statistiken genauer unter die Lupe zu nehmen. Und genau hier könnte die orthodoxe Medizin einiges von den regulativen Therapien lernen.

(1) Beck-Bornholdt HP, Dubben HH (2003): Der Schein der Weisen. Rowohlt, Reinbek bei Hamburg, S. 218

(2) Bernard (1865): Introduction à l’étude de la médecine expérimentale, meine Übersetzung nach der englischen Fassung An Introduction to the Study of Experimental Medicine. Dover, New York 1957, S. 158

(3) Dubben HH, Beck-Bornholdt HP (2005): Mit an Wahrscheinlichkeit grenzender Sicherheit, Fischer, Reinbek bei Hamburg

(4) Kovacs FM, Abraira V, Peña A, Martín-Rodríguez JG, Sánchez-Vera M, Ferrer E, Ruano D, Guillén P, Gestoso M, Muriel A, Zamora J, del Real MTG, Mufraggi N (2003): Effect of firmness of mattress on chronic non-specific low-back pain: randomised, double-blind, controlled, multicentre trial. Lancet 362: 1599-604

(5) Frost H, Lamb SE, Doll HA, Carver PT, Stewart-Brown S (2004): Randomised controlled trial of physiotherapy compared with advice for low back pain, BMJ  329:708

Über Georg Ivanovas:

Ivanovas
Jahrgang 1953, russisch-deutscher Abstammung, Abitur 1972, Studium der Medizin in Müchen und Bonn, 1979 Approbation, klinische Tätigkeit in Chirurgie, Gynäkologie und Rheumatologie, Zusatztitel Balneologie, Naturheilverfahren, Homöopathie, gestalttherapeutische Ausbildung, homöopathische Allgemeinpraxis in Bad Wurzach ab 1989-1992, seit 1993 homöopathische Allgemeinpraxis in Heraklion/Kreta, ab 2000 Forschung zur Systemtheorie in der Medizin an der Universität Heraklion, 2010 PhD mit dem Titel  „Contributions of Systems – Theory to the Understanding of Therapy and Health“

Links zum Thema:

PhD Georg Ivanovas: Doppelblind bei alternativen Heilverfahren (Deutsches Ärzteblatt, Jg. 98, Heft 13, 30. März 2001)

EBM-Kritik: Prof. Harald Walach und das Problem mit der „Integrativen Medizin“

Beitragsbild: ©Pixabay