Datenanalyse/

Simpson-Paradoxon: Warum eine Gruppe alle Teilrunden verliert, aber insgesamt gewinnt

Das Simpson-Paradoxon zeigt, wie sich Statistiken je nach Gruppierung scheinbar umkehren. Ein verständliches Beispiel erklärt den Effekt.

Aktualisiert am 21. Mai 2026
Teilen
Simpson-Paradoxon: Warum eine Gruppe alle Teilrunden verliert, aber insgesamt gewinnt

Das Simpson-Paradoxon ist eines der spannendsten Phänomene in der Statistik: Eine Gruppe kann in mehreren Teilvergleichen schlechter abschneiden und dennoch insgesamt besser sein. Auf den ersten Blick wirkt das widersprüchlich. In Wahrheit zeigt das Paradoxon, wie stark Ergebnisse von der Zusammensetzung der Daten abhängen.

Diagramm zum Simpson-Paradoxon mit zwei Teilgruppen und einem umgekehrten Gesamtergebnis
Diagramm zum Simpson-Paradoxon mit zwei Teilgruppen und einem umgekehrten Gesamtergebnis

Gerade in Bereichen wie A/B-Tests, Medizin, Recruiting, Sport oder Produktanalysen kann dieses Phänomen zu falschen Schlussfolgerungen führen, wenn man nur auf einfache Durchschnittswerte schaut. Wer Daten richtig interpretieren will, muss deshalb immer auch die Gruppenstruktur und mögliche Störfaktoren berücksichtigen.

Was ist das Simpson-Paradoxon?

Das Simpson-Paradoxon beschreibt eine Situation, in der sich ein Trend in mehreren Teilgruppen zeigt, in der Gesamtbetrachtung aber umkehrt. Das bedeutet: Eine Option kann in jeder einzelnen Gruppe schlechter sein, insgesamt aber besser abschneiden – oder umgekehrt.

Der Effekt entsteht meist dann, wenn die verglichenen Gruppen nicht gleich groß sind oder wenn ein dritter Faktor das Ergebnis stark beeinflusst. Genau deshalb ist das Paradoxon so tückisch: Die Zahlen sind nicht falsch, aber ihre Interpretation kann irreführend sein.

Ein einfaches Beispiel

Stellen wir uns zwei Teams vor, Team A und Team B, die in zwei Spielkategorien antreten: leichte Spiele und schwere Spiele.

TeamLeichte SpieleSchwere SpieleGesamt
Team A8 Siege von 101 Sieg von 109 Siege von 20
Team B7 Siege von 102 Siege von 209 Siege von 30

Auf den ersten Blick hat Team A in den leichten Spielen eine bessere Quote als Team B. In den schweren Spielen sieht es ebenfalls besser aus. Aber die Gesamtwerte können je nach Verteilung der Spiele täuschen. Wenn Team A viel öfter in den schwierigen Spielen eingesetzt wird, kann der Gesamtdurchschnitt trotz besserer Teil-Ergebnisse niedriger ausfallen.

Genau darin liegt die Essenz des Simpson-Paradoxons: Die Mischung der Fälle beeinflusst das Gesamtergebnis stärker als die Leistung in den Teilgruppen.

Warum passiert das?

Das Paradoxon entsteht, weil ein versteckter Einflussfaktor die Daten verzerrt. In der Statistik spricht man oft von einer Konfundierung: Eine dritte Variable hängt sowohl mit der Gruppenzugehörigkeit als auch mit dem Ergebnis zusammen.

Typische Ursachen sind:

  • Ungleiche Gruppengrößen: Eine Gruppe tritt häufiger in einer schwierigen Situation auf als die andere.
  • Unterschiedliche Ausgangsbedingungen: Zum Beispiel andere Patientengruppen, andere Marktsegmente oder andere Spielstärken.
  • Falsche Aggregation: Teilgruppen werden zusammengefasst, obwohl sie nicht direkt vergleichbar sind.

Dadurch kann ein Gesamtmittelwert eine Richtung anzeigen, obwohl die Teilwerte etwas anderes sagen. Das ist kein Rechenfehler, sondern ein Interpretationsproblem.

Ein Beispiel aus der Praxis

Besonders bekannt ist das Simpson-Paradoxon in der Medizin. Ein Behandlungsmittel kann in getrennten Patientengruppen bessere Überlebensraten zeigen, während der Gesamtdatensatz scheinbar das Gegenteil aussagt. Der Grund ist oft, dass die behandelten Patienten schwerer erkrankt waren oder häufiger aus einer Risikogruppe stammten.

Auch im digitalen Marketing kommt das Phänomen häufig vor. Ein neues Design kann in Desktop-Tests besser konvertieren, auf Mobilgeräten aber schlechter. Wenn die Nutzerverteilung zwischen den Varianten unterschiedlich ist, kann der Gesamt-Conversion-Rate-Eindruck irreführend sein.

Im E-Commerce kann ein Produkt in jeder Ländergruppe mehr Umsatz pro Besuch erzielen, im Gesamtergebnis aber schlechter aussehen, wenn es besonders oft in Regionen mit niedriger Kaufkraft angezeigt wurde.

Wie erkennt man das Simpson-Paradoxon?

Das Paradoxon lässt sich nicht immer sofort erkennen, aber einige Fragen helfen bei der Analyse:

  1. Gibt es eine versteckte Einflussvariable, die die Ergebnisse erklärt?
  2. Sind die Gruppen vergleichbar oder unterscheiden sie sich strukturell?
  3. Ist das Gesamtbild vielleicht nur durch eine ungleiche Verteilung verzerrt?
  4. Ändert sich der Trend, wenn man die Daten nach Segmenten aufteilt?

Eine gute Datenanalyse betrachtet daher nicht nur den Durchschnitt, sondern auch Median, Verteilungen, Teilgruppen und Kontext. Gerade bei Entscheidungen mit hoher Tragweite ist das wichtig.

Wie kann man Fehlinterpretationen vermeiden?

Wer mit Statistiken arbeitet, sollte einige Grundregeln beachten:

  • Daten segmentieren: Ergebnisse nach relevanten Gruppen getrennt auswerten.
  • Kontext prüfen: Welche Faktoren beeinflussen die Verteilung?
  • Keine vorschnellen Schlüsse: Ein Gesamtwert reicht selten aus.
  • Visualisierungen nutzen: Diagramme helfen, Muster und Verzerrungen zu sehen.
  • Methodisch sauber testen: Bei Experimenten auf gleiche Bedingungen achten.

In der Praxis bedeutet das: Erst Teilgruppen verstehen, dann das Gesamtergebnis bewerten. Nur so lässt sich vermeiden, dass man einen scheinbaren Effekt für die Wahrheit hält.

Warum ist das für Unternehmen wichtig?

Für Unternehmen ist das Simpson-Paradoxon besonders relevant, weil falsche Dateninterpretationen direkte Folgen haben können. Ein Team könnte eine Kampagne als erfolgreich bewerten, obwohl sie nur in einem bestimmten Segment funktioniert. Oder eine Produktänderung wirkt insgesamt positiv, obwohl sie eine wichtige Nutzergruppe benachteiligt.

Deshalb sollten Entscheidungen nicht nur auf einen KPI gestützt werden. Sinnvoll ist eine Kombination aus Segmentanalysen, Kohortenbetrachtung und einem klaren Verständnis der Zielgruppe. So werden bessere Entscheidungen möglich.

Fazit

Das Simpson-Paradoxon zeigt eindrucksvoll, dass Statistik ohne Kontext leicht in die Irre führen kann. Eine Gruppe kann in jeder Teilanalyse verlieren und trotzdem im Gesamtergebnis gewinnen – oder umgekehrt. Entscheidend ist nicht nur was die Zahlen zeigen, sondern wie sie zusammengesetzt sind.

Wer Daten analysiert, sollte deshalb immer die Frage stellen: Welche verdeckten Faktoren könnten das Ergebnis beeinflussen? Genau diese Denkweise macht aus reinen Zahlen eine belastbare Entscheidungshilfe.

Teilen

Ähnliche Artikel