So berechnen sie ein binomiales konfidenzintervall in python


Ein Konfidenzintervall für eine Binomialwahrscheinlichkeit wird mit der folgenden Formel berechnet:

Konfidenzintervall = p +/- z*(√ p(1-p) / n )

Gold:

  • p: Anteil „Erfolge“
  • z: der gewählte z-Wert
  • n: Stichprobengröße

Der einfachste Weg, diese Art von Konfidenzintervall in Python zu berechnen, ist die Verwendung der Funktion proportion_confint() aus dem Paket statsmodels :

 proportion_confint ( count , nobs , alpha = 0.05 , method = ' normal ' )

Gold:

  • count : Anzahl der Erfolge
  • nobs : Gesamtzahl der Versuche
  • Alpha : Signifikanzniveau (Standard ist 0,05)
  • Methode : Methode zur Verwendung für das Konfidenzintervall (Standard ist „normal“)

Das folgende Beispiel zeigt, wie Sie diese Funktion in der Praxis nutzen können.

Beispiel: Berechnen Sie das binomiale Konfidenzintervall in Python

Angenommen, wir möchten den Anteil der Einwohner eines Landkreises schätzen, die ein bestimmtes Gesetz befürworten.

Wir beschließen, eine Zufallsstichprobe von 100 Einwohnern auszuwählen und stellen fest, dass 56 von ihnen das Gesetz befürworten.

Wir können die Funktion proportion_confint() verwenden, um das 95 %-Konfidenzintervall für den tatsächlichen Anteil der Einwohner im gesamten Landkreis zu berechnen, die dieses Gesetz haben:

 from statsmodels. stats . proportion import proportion_confint

#calculate 95% confidence interval with 56 successes in 100 trials
proportion_confint(count= 56 , nobs= 100 )

(0.4627099463758483, 0.6572900536241518)

Das 95 %-Konfidenzintervall für den tatsächlichen Anteil der Kreisbewohner, die das Gesetz unterstützen, beträgt [.4627, .6573] .

Standardmäßig verwendet diese Funktion die asymptotische Normalnäherung, um das Konfidenzintervall zu berechnen. Wir können jedoch das Methodenargument verwenden, um eine andere Methode zu verwenden.

Beispielsweise ist die Standardfunktion, die in der Programmiersprache R zur Berechnung eines binomialen Konfidenzintervalls verwendet wird, das Wilson-Score-Intervall.

Wir können die folgende Syntax verwenden, um diese Methode bei der Berechnung des Konfidenzintervalls in Python anzugeben:

 from statsmodels. stats . proportion import proportion_confint

#calculate 95% confidence interval with 56 successes in 100 trials
proportion_confint(count= 56 , nobs= 100 , method=' wilson ')

(0.4622810465167698, 0.6532797336983921)

Dies zeigt uns, dass das 95 %-Konfidenzintervall für den tatsächlichen Anteil der Kreisbewohner, die das Gesetz unterstützen , [.4623, .6533] beträgt.

Dieses Konfidenzintervall unterscheidet sich geringfügig von dem mit der Normalnäherung berechneten.

Beachten Sie, dass wir den Alpha- Wert auch anpassen können, um ein anderes Konfidenzintervall zu berechnen.

Beispielsweise können wir Alpha auf 0,10 setzen, um ein 90 %-Konfidenzintervall zu berechnen:

 from statsmodels. stats . proportion import proportion_confint

#calculate 90% confidence interval with 56 successes in 100 trials
proportion_confint(count= 56 , nobs= 100 , alpha= 0.10 , method=' wilson ')

(0.47783814499647415, 0.6390007285095451)

Dies zeigt uns, dass das 90 %-Konfidenzintervall für den tatsächlichen Anteil der Kreisbewohner, die das Gesetz unterstützen , [.4778, .6390] beträgt.

Hinweis : Die vollständige Dokumentation zur Funktion proportion_confint() finden Sie hier .

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere gängige Vorgänge in Python ausführen:

So zeichnen Sie ein Konfidenzintervall in Python auf
So verwenden Sie die Binomialverteilung in Python

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert