Statistik-Aufgaben: Wahrscheinlichkeiten, Hypothesentests und Konfidenzintervalle
Eingeordnet in Mathematik
Geschrieben am in
Deutsch mit einer Größe von 13,9 KB
Statistische Analyse und Wahrscheinlichkeitsberechnungen
Aufgabe zur Wahrscheinlichkeit bei Defekten
Aus einer Gesamtmenge wurden 4 Rechner als Stichprobe extrahiert. Davon waren 36 defekt und 28 entsprachen nicht dem Standard. Wie hoch ist die Wahrscheinlichkeit, dass alle vier ausgewählten Rechner defekt sind?
Lösungsvorschlag: .1001
Hypothesentest zur elterlichen Verantwortung (Kalifornien)
Ein Zeitschriftenartikel der Soziologie besagt, dass mindestens 66% der Amerikaner die Verantwortung für die Überwachung der Hausaufgaben ihrer Kinder mit ihren Frauen teilen. In einer Stadt in Kalifornien wurde eine Stichprobe von 234 zufällig ausgewählten Personen untersucht. Dabei gaben 138 an, diese Verantwortung mit ihren Frauen zu teilen. Ein Test mit einem Signifikanzniveau von $\alpha = 0,05$ wurde durchgeführt. Die Ergebnisse waren:
- Teststatistik: -2,2687
- Kritischer Wert: -1,6449
- P-Wert: 0,0116
Welche Hypothesen testen diese Ergebnisse in Bezug auf die Behauptung des Artikels?
Korrekte Hypothesen: D) $H_0: p = 0,66$, $H_1: p < 0,66$
Interpretation des Korrelationskoeffizienten
Eine zufällige Gruppe von 20 Studenten schloss ihr erstes Schuljahr ab. Es liegen Daten zu ihren Aufnahme-Prüfungswerten und dem erreichten Notendurchschnitt (GPA) im ersten Jahr vor. Der Korrelationskoeffizient ist signifikant. Welche Aussage zur Interpretation des Korrelationskoeffizienten ist richtig?
- Die Beziehung zwischen den Variablen ist einfach (linear).
- Ein höherer Wert bei der Aufnahme-Prüfung lässt einen höheren GPA im ersten Jahr erwarten.
- Ein höherer Wert bei der Aufnahme-Prüfung lässt einen niedrigeren GPA im ersten Jahr erwarten.
Richtige Aussage: E) I und II
Vergleich der Kraftstoffeffizienz mittels Boxplots
Die Kilometerleistung pro Liter (bzw. Gallone) von drei verschiedenen Autos wurde mittels Boxplots dargestellt. Welche Aussagen sind korrekt bezüglich der Werte?
- I. Die drei Fahrzeuge haben den gleichen Interquartilsabstand (IQR).
- II. Auto B hat eine annähernd symmetrische Verteilung.
- III. Auto B hat einen kleineren Bereich (Range).
Korrekte Aussage: E) Nur II
Hypothesen für die Lebensdauer von Waschmaschinen
Ein Hersteller behauptet, die durchschnittliche Nutzungsdauer seiner Waschmaschinen betrage $\mu$. Eine Stichprobe von 50 Geräten ergab eine durchschnittliche Lebensdauer von 2,1 Jahren. Wenn man diese Daten vergleichen möchte, welche Hypothesen repräsentieren die Null- und Alternativhypothesen?
Hypothesen: A) $H_0: \mu = 7,1$, $H_1: \mu < 7,1$
Form der Umsatzverteilung
Die Umsätze (in Tausend Dollar) einer Gruppe von Anbietern im letzten Monat wurden deskriptiv zusammengefasst. Basierend auf den Ergebnissen (Mittelwert: 21,3906) – weitere Daten fehlen, aber die Antwort deutet auf eine Tendenz hin – welche Form hat die Verteilung der Umsätze?
Antwort: B) schief links (linkssteil)
Interpretation eines Konfidenzintervalls für einen Anteil
Der Leiter der Universitätsbibliothek möchte den Anteil der Studierenden schätzen, die Lehrbücher für Statistik kaufen. Eine Stichprobe von 600 Studierenden ergab, dass 320 das Buch kauften. Bei einem Konfidenzniveau von 95% liegt der Bereich für den tatsächlichen Anteil zwischen 0,493 und 0,573.
Was ist die angemessene Interpretation dieses Ergebnisses?
Interpretation: A) Wir können mit 95%iger Sicherheit sagen, dass der tatsächliche Prozentsatz der Studierenden, die Lehrbücher für Statistik kaufen, im Bereich von 49,3% bis 57,3% liegt.
Art der Studie: Scheidungsraten
Ein Soziologe möchte die jährliche Scheidungsrate in einer bestimmten Stadt feststellen. Er plant, die Datensätze von 1950 bis heute zu analysieren.
Welche Art von Studie beschreibt diese Vorgehensweise?
Studientyp: B) Beobachtende Retrospektive
Interpretation eines Konfidenzintervalls für den Mittelwert
Es wurde eine Stichprobe von 150 Studierenden befragt, wie viel Zeit sie wöchentlich für Hausaufgaben in einem Mathematik-Kurs aufwenden. Das 98%-Konfidenzintervall für den Populationsmittelwert liegt zwischen 5,2 und 8,3 Stunden.
Was ist die beste Interpretation dieses Ergebnisses?
Interpretation: A) Es besteht eine 98%-ige Sicherheit, dass die durchschnittliche Zeit, die Studierende dieses Mathematik-Kurses für die Erledigung der Aufgaben benötigen, zwischen 5,2 und 8,3 Stunden pro Woche liegt.
Parameter vs. Statistik
Ein Hersteller behauptet, dass nur 5% der von ihm hergestellten Produkte defekt sind. Diese Aussage beschreibt einen:
Begriff: C) Parameter (da es sich um eine Behauptung über die gesamte Population handelt)
Regel der seltenen Ereignisse
Nach der Regel der seltenen Ereignisse, welcher Wahrscheinlichkeitswert wird mit einem seltenen oder ungewöhnlichen Ereignis in Verbindung gebracht?
- I. $P(A) = 0,018$
- II. $P(A) = 0,0078$
- III. $P(A) = 0,078$
Antwort: B) I und II (typischerweise Werte unter 0,05 oder 0,01)
Konfidenzintervall für den Mittelwert (Glockenkurve)
Ein Test zur Einstellung gegenüber öffentlichen Verkehrsmitteln folgt einer glockenförmigen Verteilung. Eine Stichprobe von $n=27$ Erwachsenen ergab einen Mittelwert von $\bar{x} = 76,2$ und eine Standardabweichung von $s = 21,4$. Konstruieren Sie ein 95%-Konfidenzintervall für den Populationsmittelwert.
Ergebnis (Intervall): b) $74,6 < \mu < 77,8$
Schlussfolgerung aus Hypothesentest (Kalifornien-Studie, detailliert)
Bezugnehmend auf die kalifornische Studie (mindestens 66% teilen Verantwortung): Teststatistik $t = -2,2687$, kritischer Wert $t_{krit} = -1,6449$, $P$-Wert $= 0,0116$ bei $\alpha = 0,05$.
Schlussfolgerung: C) Die Stichprobe liefert signifikante Beweise, um die Behauptung des Artikels als falsch zu widerlegen. Deshalb können wir schlussfolgern, dass weniger als 66% der Amerikaner (in dieser Stadt) die Verantwortung mit ihren Frauen teilen.
Anteil der Gärten mit mindestens 25 m²
Eine Baumschule erfasste die Größen von Vorgärten in Quadratmetern:
| Abmessungen (in m²) | Anzahl der Häuser |
|---|---|
| 0 bis 14 | 2 |
| 15 bis 19 | 12 |
| 20 bis 24 | 20 |
| 25 bis 29 | 21 |
| 30 bis 34 | 13 |
| 35 bis 39 | 2 |
Welcher Anteil der Wohnungen hat einen Garten mit einer Fläche von mindestens 25 Quadratmetern?
Gesamtzahl der Häuser: $2+12+20+21+13+2 = 70$.
Anzahl der Häuser $\ge 25$ m²: $21 + 13 + 2 = 36$.
Anteil: $36 / 70 \approx 0,5143$
Antwort: D) 51,43%
Ungewöhnlich hohes Einkommen
Das monatliche Einkommen hat einen Populationsmittelwert von $\mu = 5300$ und eine Standardabweichung von $\sigma = 450$. Welches Einkommen wäre ungewöhnlich hoch?
Ungewöhnlich hoch bedeutet typischerweise mehr als 2 Standardabweichungen über dem Mittelwert (für eine Normalverteilung).
Grenze: $\mu + 2\sigma = 5300 + 2 \times 450 = 5300 + 900 = 6200$.
Antwort: B) $6200$ (Interpretation: $5300 + 2 \times 450$)
Statistik vs. Parameter (Stichprobenanteil)
In einer Stichprobe von 500 Schülern stellten 45% fest, dass sie ihre Lehrbücher kauften. Diese Aussage beschreibt eine:
Begriff: A) Statistik (da sie aus einer Stichprobe stammt)
Vergleich der Servicezeiten (Varianz)
Servicezeiten für zwei Fast-Food-Restaurants (A und B):
| Maß | Restaurant A | Restaurant B |
|---|---|---|
| Mittelwert | 186,3 | 262,5 |
| Median | 184 | 262,5 |
| Varianz | 4081,7 | 16644,3 |
| Range | 195 | 407 |
| Minimum | 92 | 74 |
| Maximum | 287 | 481 |
| n | 60 | 60 |
In welchem Restaurant gibt es eine größere Kohärenz (geringere Streuung) in der Servicezeit?
Kohärenz wird durch geringere Varianz angezeigt. $4081,7 < 16644,3$.
Antwort: A) Restaurant A
Wahl der Verteilung für Konfidenzintervall (Verzerrte Daten)
Ein Forscher möchte die durchschnittliche wöchentliche Fernsehzeit für Sechstklässler schätzen. $n=25$, $\bar{x} = 10,5$ Std., $\sigma = 4,0$ Std. Die Verteilung ist links verzerrt (schief). Für ein 99%-Konfidenzintervall sollte er verwenden:
Antwort: B) Weder die Z- noch die t-Verteilung. Es müssten andere Schätzmethoden angewendet werden (da $n < 30$ und die Verteilung nicht normal ist).
Art der Variablen: Anhalteweg
Die zurückgelegte Strecke bis zum Stillstand eines Autos beim Bremsen ist ein Beispiel für eine Variable:
Variablentyp: A) Quantitative kontinuierliche
Situation für die Verwendung der Normalverteilung (Mittelwert)
Die monatlichen Einkommen sind normalverteilt mit $\mu = 3500$ und $\sigma = 30$. Ein Forscher zieht eine Stichprobe von $n=25$ Männern und möchte die Wahrscheinlichkeit für einen Stichprobenmittelwert $\bar{X} > 4000$ finden.
Um diesen Wert zu finden, welche Situation liegt vor?
Situation: C) Man kann die Normalverteilung verwenden, da die Standardabweichung der Grundgesamtheit bekannt ist und die Grundgesamtheit eine glockenförmige Verteilung hat.
Art der Variablen: Gewicht einer Dose
Das Gewicht einer Dose eines Produkts zeigt eine Variable:
Variablentyp: C) Quantitative kontinuierliche
Hypothesen für die Leistung eines Autos
Die Carter Motor Company behauptet, dass die neue Limousine eine durchschnittliche Ausgangsleistung von über 23 Meilen pro Gallone (MPG) in der Stadt hat.
Welche Hypothesen testen den Anspruch des Unternehmens?
Hypothesen: C) $H_0: \mu = 23$, $H_1: \mu > 23$
Bestimmung des Konfidenzintervalls (Fehlende Information)
Der Bibliotheksleiter möchte den Anteil der Studierenden schätzen, die Statistik-Lehrbücher kaufen. Stichprobe $n=600$, $320$ kauften das Buch. Welches Konfidenzniveau soll für ein 90%-Intervall verwendet werden?
Anmerkung: Die Frage ist unklar formuliert, scheint aber nach der Notwendigkeit von Informationen zu fragen.
Antwort: D) Kann nicht bestimmt werden, aufgrund des Mangels an Informationen (vermutlich ist gemeint, dass die Berechnung des Intervalls selbst nicht möglich ist, wenn die Frage nach dem 90%-Intervall fragt, aber die Antwortmöglichkeiten sich auf die Verteilung beziehen).
Art der Studie: Urlaubsplanung
Ein Marktforscher möchte den Anteil der Bürger bestimmen, die planen, dieses Jahr in den Urlaub zu fahren.
Studientyp: B) Querschnitt (Cross-Sectional)
Ausreißer-Test (Münzgewicht)
Die Gewichte von 25-Cent-Münzen sind normalverteilt mit $\mu = 5,67$ g und $\sigma = 0,07$ g. Ein Automat lehnt Münzen ab, deren Gewichte außerhalb von 5,48 g und 5,82 g liegen. Welcher Prozentsatz der 25-Cent-Münzen würde abgelehnt werden?
Grenzen in Standardabweichungen: $Z_{unten} = (5,48 - 5,67) / 0,07 = -0,19 / 0,07 \approx -2,71$. $Z_{oben} = (5,82 - 5,67) / 0,07 = 0,15 / 0,07 \approx 2,14$.
Anmerkung: Die Antwort C) 1,96% deutet auf die Ablehnung basierend auf $\pm 2\sigma$ hin, was $1 - 0,9545 = 0,0455$ (4,55%) wäre, oder es bezieht sich auf einen spezifischen Z-Wert. Wenn die Grenzen $5,67 \pm 2 \times 0,07 = 5,67 \pm 0,14$ wären, also 5,53 bis 5,81, dann wäre die Ablehnung geringer. Die Antwort 1,96% ist ungewöhnlich, aber wir übernehmen die gegebene Antwort.
Antwort: C) 1,96%
Art der Studie: Wahlbeteiligung
Ein Soziologe möchte den Anteil der Bürger feststellen, die im letzten Jahr in einem Bundesstaat an Wahlen teilgenommen haben.
Studientyp: B) Beobachtende Querschnittsstudie
Art der Stichprobe: Strafen für Trunkenheit am Steuer
Ein Forscher befragt Erwachsene an verschiedenen Orten mit höherem Wohlstand, die zufällig ausgewählt wurden, um Meinungen zu härteren Strafen für Trunkenheit am Steuer zu sammeln.
Stichprobenart: Konglomerat (Cluster-Stichprobe, wenn die Orte die Cluster sind, oder möglicherweise Gelegenheitsstichprobe, aber Konglomerat ist die angegebene Antwort).
Fehlermarge (E)
Das Konfidenzintervall für den Anteil der Studierenden, die Statistik-Lehrbücher kaufen, ist $0,842 < p < 0,880$. Wie groß ist die Fehlermarge $E$?
Die Fehlermarge ist die Hälfte der Breite des Intervalls: $E = (Obergrenze - Untergrenze) / 2$.
$E = (0,880 - 0,842) / 2 = 0,038 / 2 = 0,019$.
Antwort: A) 0,019
Quantil (Ersatzzeit Waschmaschinen)
Die Ersatzzeiten für Waschmaschinen sind verteilt mit $\mu = 10,8$ Jahren und $\sigma = 1,2$ Jahren (angenommen, die angegebene Standardabweichung von 12 ist ein Tippfehler und sollte 1,2 sein, um die Antwort zu ermöglichen). Welcher Wert entspricht dem 87. Perzentil?
Wir suchen $x$ sodass $P(X < x) = 0,87$. Der Z-Wert für 0,87 ist ungefähr $Z \approx 1,126$.
$x = \mu + Z\sigma = 10,8 + 1,126 \times 1,2 \approx 10,8 + 1,35 = 12,15$ Jahre.
Anmerkung: Die gegebene Antwort C) 11,9 Jahre impliziert einen anderen Z-Wert oder eine andere Standardabweichung. Wir übernehmen die gegebene Antwort.
Antwort: C) 11,9 Jahre