Statistische Analyse: Pearson-Koeffizient und Korrelation
Eingeordnet in Mathematik
Geschrieben am in
Deutsch mit einer Größe von 3,95 KB
| Intervall | Notation (Xi) | Mittelwert (X) | Momentum (n) | Pearson |
|---|---|---|---|---|
| Linf lsup | Lymph-lsup / 2 | (xi-X) (xi-X) ENFI | b2 = momento4 / (wo die Varianz der Grundgesamtheit oder 2) |
Pearson-Koeffizient (B2) und Tabellen
Der Pearson-Koeffizient basiert auf dem vierten Moment um den Mittelwert.
Interpretation der Verteilung (Beispiel n=40):
- S2 < -0,587: Negative Asymmetrie
- -0,587 < S2 < 0,587: Symmetrische Verteilung
- S2 > 0,587: Positive Asymmetrie
Kurtosis-Interpretation:
- B2 > 3: Leptokurtisch (steiler als normal)
- B2 = 3: Mesokurtisch (normalverteilt)
- B2 < 3: Platykurtisch (flacher als normal)
Für eine Stichprobe von 40 Studenten mit B2 = 2,84 (bei n=50) lässt sich bei einem Fehlerrisiko von 10 % auf eine Normalverteilung schließen.
Standardisierung von Variablen
Die Standardisierung ermöglicht den Vergleich unterschiedlicher Datensätze:
- a) Leistungsvergleich: Die Gruppe mit dem höchsten Durchschnitt (Statistik: 5,6) zeigt die beste Leistung, während Informatik (3,1) als schwieriger wahrgenommen wurde.
- b) Variabilität: Individuelle Leistungen können trotz identischer Durchschnittswerte (z. B. 4,5) stark variieren.
- c) Z-Werte: Standardisierte Z-Werte zeigen die relative Leistung im Vergleich zum Durchschnitt. Ein positiver Z-Wert liegt über dem Durchschnitt, ein negativer darunter.
- d) Zusammenfassung: Der Vergleich der durchschnittlichen Z-Werte erlaubt eine objektive Bewertung der Gesamtleistung.
Standardnormalverteilung und Perzentile
Standardisierte Werte können über Tabellen der kumulativen Wahrscheinlichkeit (Z-Tabelle) in Perzentile umgerechnet werden. Die Tabelle deckt Werte von Z = -3,90 bis Z = 3,90 ab. Beispiel: Für Z = 1,62 ergibt sich eine kumulative Wahrscheinlichkeit von 0,9474.
Eigenschaften des Pearson-Korrelationskoeffizienten
- Der Wert liegt im Bereich von -1 bis 1.
- r > 0: Direkte lineare Beziehung; r = 0: Kein linearer Zusammenhang; r < 0: Umgekehrt proportionale Beziehung.
- r = 1: Alle Punkte liegen exakt auf der Regressionsgeraden.
- Je höher der Absolutwert von r, desto stärker der lineare Zusammenhang.
- Der Wert ist unabhängig von den Maßeinheiten.
- r ist symmetrisch (X zu Y entspricht Y zu X).
- r erkennt nur lineare Zusammenhänge.
Bedeutung und Signifikanz der Korrelation
Bei einer Stichprobe aus einer Grundgesamtheit stellt sich die Frage, ob der berechnete Korrelationskoeffizient r signifikant von Null verschieden ist. Hierfür werden Freiheitsgrade (df = n - 2) und Signifikanzniveaus (z. B. 5 %) herangezogen.
Beispiel: Bei n = 5 (df = 3) und einem Signifikanzniveau von 5 % liegt der kritische Wert bei 0,878. Da der beobachtete Wert r = 0,9254 größer als 0,878 ist, wird die Nullhypothese abgelehnt – es besteht eine signifikante lineare Beziehung.