Statistische Analyse: Pearson-Koeffizient und Korrelation

Eingeordnet in Mathematik

Geschrieben am in Deutsch mit einer Größe von 3,95 KB

IntervallNotation (Xi)Mittelwert (X)Momentum (n)Pearson
Linf lsupLymph-lsup / 2(xi-X)
(xi-X) ENFI
b2 =
momento4 /
Formel
(wo die Varianz der Grundgesamtheit oder 2)

Pearson-Koeffizient (B2) und Tabellen

Der Pearson-Koeffizient basiert auf dem vierten Moment um den Mittelwert.

Interpretation der Verteilung (Beispiel n=40):

  • S2 < -0,587: Negative Asymmetrie
  • -0,587 < S2 < 0,587: Symmetrische Verteilung
  • S2 > 0,587: Positive Asymmetrie

Kurtosis-Interpretation:

  • B2 > 3: Leptokurtisch (steiler als normal)
  • B2 = 3: Mesokurtisch (normalverteilt)
  • B2 < 3: Platykurtisch (flacher als normal)

Für eine Stichprobe von 40 Studenten mit B2 = 2,84 (bei n=50) lässt sich bei einem Fehlerrisiko von 10 % auf eine Normalverteilung schließen.

Standardisierung von Variablen

Die Standardisierung ermöglicht den Vergleich unterschiedlicher Datensätze:

  • a) Leistungsvergleich: Die Gruppe mit dem höchsten Durchschnitt (Statistik: 5,6) zeigt die beste Leistung, während Informatik (3,1) als schwieriger wahrgenommen wurde.
  • b) Variabilität: Individuelle Leistungen können trotz identischer Durchschnittswerte (z. B. 4,5) stark variieren.
  • c) Z-Werte: Standardisierte Z-Werte zeigen die relative Leistung im Vergleich zum Durchschnitt. Ein positiver Z-Wert liegt über dem Durchschnitt, ein negativer darunter.
  • d) Zusammenfassung: Der Vergleich der durchschnittlichen Z-Werte erlaubt eine objektive Bewertung der Gesamtleistung.

Standardnormalverteilung und Perzentile

Standardisierte Werte können über Tabellen der kumulativen Wahrscheinlichkeit (Z-Tabelle) in Perzentile umgerechnet werden. Die Tabelle deckt Werte von Z = -3,90 bis Z = 3,90 ab. Beispiel: Für Z = 1,62 ergibt sich eine kumulative Wahrscheinlichkeit von 0,9474.

Eigenschaften des Pearson-Korrelationskoeffizienten

  1. Der Wert liegt im Bereich von -1 bis 1.
  2. r > 0: Direkte lineare Beziehung; r = 0: Kein linearer Zusammenhang; r < 0: Umgekehrt proportionale Beziehung.
  3. r = 1: Alle Punkte liegen exakt auf der Regressionsgeraden.
  4. Je höher der Absolutwert von r, desto stärker der lineare Zusammenhang.
  5. Der Wert ist unabhängig von den Maßeinheiten.
  6. r ist symmetrisch (X zu Y entspricht Y zu X).
  7. r erkennt nur lineare Zusammenhänge.

Bedeutung und Signifikanz der Korrelation

Bei einer Stichprobe aus einer Grundgesamtheit stellt sich die Frage, ob der berechnete Korrelationskoeffizient r signifikant von Null verschieden ist. Hierfür werden Freiheitsgrade (df = n - 2) und Signifikanzniveaus (z. B. 5 %) herangezogen.

Beispiel: Bei n = 5 (df = 3) und einem Signifikanzniveau von 5 % liegt der kritische Wert bei 0,878. Da der beobachtete Wert r = 0,9254 größer als 0,878 ist, wird die Nullhypothese abgelehnt – es besteht eine signifikante lineare Beziehung.

Verwandte Einträge: