Konfidenzintervalle für den Mittelwert

Da der Mittelwert einer Stichprobe nur in der Nähe des tatsächlichen Erwartungswertes μ eines Merkmals liegt, aber auch bei sehr großem Stichprobenumfang keine exakte Gleichheit garantiert werden kann, ist es eine wesentliche Aufgabe, den Fehler zwischen Schätzung und zu schätzendem Wert zu quantifizieren. 

Theoretisch können noch große Abweichungen auftreten, für großen Stichprobenumfang ist die Wahrscheinlichkeit für eine Stichprobe, bei der das der Fall ist, allerdings sehr gering. Die Grundidee der Konfidenzintervalle ist es nun, ein Verfahren anzugeben, das mit einer sehr hohen Wahrscheinlichkeit, dem Konfidenzniveau, ein Intervall liefert, das den zu schätzenden Wert enthält.

In der Praxis sind natürlich möglichst schmale Konfidenzintervalle (hohe Präzision) zu einem möglichst hohen Konfidenzniveau (große Sicherheit) gesucht. Bei festem Stichprobenumfang liefert allerdings eine Erhöhung des Konfidenzniveaus auch eine Verbreiterung des Konfidenzintervalls. Die einzige Möglichkeit, das Konfidenzniveau zu erhöhen, ohne das Intervall zu verbreitern, liegt in einer Vergrößerung des Stichprobenumfangs.

Besonders beliebt sind Konfidenzintervalle unter Normalverteilungsannahme: Hier wird vorausgesetzt, dass das Merkmal einer Normalverteilung folgt, deren Erwartungswert zu schätzen ist. Die Varianz kann entweder bekannt sein, oder sie wird aus der Stichprobe geschätzt. In beiden Fällen ergeben sich vergleichsweise einfache Formeln für die Grenzen des Konfidenzintervalls. Die Bedeutung des Konfidenzintervalls unter Normalverteilungsannahme liegt auch darin, dass μ durch den Mittelwert der Stichprobe geschätzt wird, und dieser nach dem zentralen Grenzwertsatz auch bei anderen Verteilungsannahmen approximativ normalverteilt ist. Daher können die Rechenvorschriften unter Normalverteilungsannahme auch unter anderen Verteilungsannahmen verwendet werden, sie liefern dann Konfidenzintervalle, die für großen Stichprobenumfang n approximativ das vorgegebene Konfidenzniveau haben.

Genaue Erklärung des Konfidenzniveaus

Die Zufallsvariablen X1,...,Xn mögen das beobachtete Merkmal bei den nacheinander durchgeführten Experimenten beschreiben. Da immer wieder das gleiche Experiment durchgeführt wird, und die Ergebnisse sich nicht gegenseitig beeinflussen sollen, sind diese Zufallsvariablen unabhängig und identisch verteilt. Darauf basierend wird nun eine solche untere Grenze U(X1,...,Xn) und eine solche obere Grenze O(X1,...,Xn) berechnet, dass U(X1,...,Xn)≤μ≤O(X1,...,Xn) mit einer Wahrscheinlichkeit von mindestens 1-α auftritt. Dann heißt das Intervall [U(X1,...,Xn),O(X1,...,Xn)] Konfidenzintervall für μ zum Konfidenzniveau 1-α.

Eine Möglichkeit zur Erfüllung der Bedingung an Konfidenzintervalle zum Niveau 1-α liegt darin, U(X1,...,Xn) und O(X1,...,Xn) so zu wählen, dass die Ereignisse μ<U(X1,...,Xn) und μ>O(X1,...,Xn) jeweils nur mit einer Wahrscheinlichkeit von höchstens α/2 auftreten. Auf diese Weise entstehen symmetrische Konfidenzintervalle.

In der Praxis werden die Rechenvorschriften, die die Funktionen U und O beschreiben, natürlich nicht auf Zufallsvariablen, sondern auf konkrete Realisierungen (x1,...,xn) angewendet. Eine Interpretation des Konfidenzniveaus für ein einzelnes auf diese Weise ermitteltes konkretes Konfidenzintervall ist nicht möglich, da nach dem Ziehen der Stichprobe weder die Werte x1,...,xn noch der zu schätzende Wert μ zufällig sind. Es gilt aber: Wird das Verfahren zur Berechnung des Konfidenzintervalles immer wieder auf neu gezogene Stichproben angewendet, so ist langfristig der Anteil der Stichproben, für die das berechnete Konfidenzintervall den Wert μ enthält, mindestens 1-α.

Funktionsweise der interaktiven Abbildung

Es wird eine normalverteilte Zufallsstichprobe mit den unten eingestellten Werten erzeugt. Das zugehörige Konfidenzintervall für den Mittelwert wird berechnet und angezeigt. Der Parameter α gibt das Niveau an und regelt so die Breite des Intervalls. Liegt der eingestellte Mittelwert im Konfidenzintervall (d.h. war die Schätzung korrekt) wird das Intervall blau angezeigt, sonst rot. Über die Auswahlbox kann der Typ des Intervalls festgelegt werden: Einmal ist die Varianz bekannt und fließt in die Berechnung ein. Für das andere Intervall wird die Varianz aus der Stichprobe geschätzt.

Erzeugung einer Stichprobe
Erwartungswert μ=
Varianz σ2=
Zufallszahlen n=
 
Typ des Konfidenzintervalls
 
Konfidenzintervall zum Niveau α
Niveau α=
Mittelwert der Stichprobe m=
Stichproben Varianz σ02=
δ=
Konfidenzintervall [m-δ;m+δ]=