Interpretation des Korrelationskoeffizienten
Da bei der Interpretation des Korrelationskoeffizienten häufig Fehler gemacht werden, widmen wir uns diesem Themengebiet in aller Ausführlichkeit.
Das oberste Gebot bei der Interpretation des Korrelationskoeffizienten lautet: Es handelt sich lediglich um ein Maß für den Zusammenhang zweier Variablen
Kausale Aussagen (Ursache-Wirkungs-Aussagen) sind nicht zulässig!
Beispiel zur Verdeutlichung:
Empirische Untersuchungen haben gezeigt, dass ein Zusammenhang besteht zwischen der Anzahl von Feuerwehrautos am Brandort und der Höhe des Brandschadens.
Daraus ließe sich nun folgender (kausaler) Schluss ziehen: je mehr Feuerwehrautos bei einem Brand im Einsatz sind, desto höher der Schaden.
Das ist natürlich Unfug, verdeutlicht aber die Schwierigkeit der Interpretation.
Außerdem ist es möglich, dass die beiden Variablen lediglich über eine andere, dritte Variable zusammenhängen. Man spricht dann von einer so genannten Scheinkorrelation.
Dazu ein weiteres Beispiel:
Eine Analyse über die letzten 50 Jahre hat ergeben, dass die Besiedlung durch Störche im Norden Baden-Württembergs positiv mit der dortigen Geburtenzahl korreliert. Das bedeutet natürlich noch lange keinen kausalen Zusammenhang - weder bringen Störche Kinder noch umgekehrt. Trotzdem ist ein statistischer Zusammenhang gegeben. Dieser leitet sich aber aus einem dritten Faktor ab, wie z.B. der Verstädterung, die sowohl Nistplätze vernichtet als auch Kleinfamilien fördert.
Für die Interpretation des Korrelationskoeffizienten ist also stets Vorsicht geboten!
Bei Zusammenhangsmaßen für sozialwissenschaftliche Daten gelten folgende Faustregeln:
r =1--> perfekter Zusammenhang
0,7 <r < 0,99--> sehr starker Zusammenhang
0,5 <r < 0,69--> starker Zusammenhang
0,3 <r < 0,59--> mittelstarker Zusammenhang
0,2 <r < 0,29--> schwacher Zusammenhang
r <=0,19--> kein Zusammenhang
Das Quadrat des Korrelationskoeffizienten r² nennt man Bestimmtheitsmaß (= Determinationskoeffizient). Es gibt in erster Näherung an, wie viel % der Varianz durch die untersuchte Beziehung erklärt werden. Beispiel: Bei r = 0,3 bzw. 0,8 werden 9% bzw. 64% der gesamten auftretenden Varianz im Hinblick auf einen statistischen Zusammenhang erklärt.