Korrelation heißt nicht Kausalität. Wer das verstanden hat, liest Nachrichten anders. Journalisten machen diesen Fehler so häufig, dass es eigentlich schon lustig ist. Doch erstmal zu den Begriffen.

Was ist "Korrelation"?

Von Korrelation spricht man, wenn zwei Datensätze sich "ähnlich verhalten". Als Beispiel kann man die beiden Linien im folgenden Diagram nehmen. Blau und Orange korrellieren:

Zwei korrellierende Datensätze

Was ist "Kausalität"?

Kausalität ist das Prinzip von Ursache und Wirkung. Das bedeutet es gibt eine Richtung. Weil die Pizza zu lange im Ofen war ist sie verbrannt. Weil Blau steigt, steigt auch Orange im obigen Diagramm.

Der beliebte Irrtum

Es ist leicht Korrelationen zu entdecken. Häufig vermutet man dann eine Kausalität wo keine ist. Ich habe behauptet, dass Orange steigt, weil Blau steigt. Aber vielleicht ist es ja auch anders herum? Weil Orange steigt, steigt Blau. Als dritte Alternative könnte es auch noch sein, dass es etwas anderes ist und beide steigen deswegen, ohne dass es eine Verbindung zwischen Blau und Orange gibt.

Nun zu den Nachrichten. Ein Beispiel: Reichtum schützt vor Herzinfarkt. Wenn man also die Kluft zwischen Arm und Reich verkleinert, wären die Menschen gesünder ist die Interpretation.

Ein kleiner Test: Einfach mal die Aussage umdrehen. Hört sich das auch sinnvoll an? Gesündere Menschen sind reicher. Klingt nachvollziehbar, schließlich bedeutet Gesundheit Leistungs­fähigkeit. Daraus würde man schließen, wenn die Leute gesünder wären, würde die Kluft zwischen Arm und Reich verkleinert. Bevor wir also Handlungsbedarf anmelden, sollten wir nochmal genauer hinsehen, in welche Richtung die Kausalität geht.

Kevin und Chantal sind schlecht in der Schule. Sind sie nun schlecht, weil sie so heißen? Oder heißen schlechter Schüler häufiger so? Meine Vermutung wäre der Einfluss eines dritten Faktors. Sozial schwache Eltern haben Kinder, die oft schlecht in der Schule sind und nennen sie häufiger Kevin oder Chantal.

Der Graph von oben sind übrigens die Google Grippe-Trends von Deutschland. Eine Linie zeigt die Zahl der gemeldeten Grippe­erkrankungen, die andere Linie die Zahl entsprechender Such­anfragen. Welche Farbe was bedeutet sieht man dem Graphen aber nicht an.

Correlation doesn't imply causation, but it does waggle its eyebrows suggestively and gesture furtively while mouthing 'look over there'.
© xkcd

"Früher glaubte ich 'Korrelation bedeutet auch Kausalität'. Dann habe ich einen Kurs in Statistik gemacht."

"Hört sich so an, als ob der Kurs geholfen hat."

"Hm, vielleicht."

© 2012-03-29
qznc