So finden sie konfidenzintervalle in r (mit beispielen)


EinKonfidenzintervall ist ein Wertebereich, der wahrscheinlich einen Populationsparameter mit einem bestimmten Konfidenzniveau enthält.

Die Berechnung erfolgt nach folgender allgemeiner Formel:

Konfidenzintervall = (Punktschätzung) +/- (kritischer Wert)* (Standardfehler)

Diese Formel erstellt ein Intervall mit einer Untergrenze und einer Obergrenze, das wahrscheinlich einen Populationsparameter mit einem gewissen Maß an Konfidenz enthält:

Konfidenzintervall = [untere Grenze, obere Grenze]

In diesem Tutorial wird erklärt, wie die folgenden Konfidenzintervalle in R berechnet werden:

1. Konfidenzintervall für einen Mittelwert

2. Konfidenzintervall für einen Mittelwertunterschied

3. Konfidenzintervall für einen Anteil

4. Konfidenzintervall für einen Unterschied in den Proportionen

Lass uns gehen!

Beispiel 1: Konfidenzintervall für einen Mittelwert

Wir verwenden die folgende Formel, um ein Konfidenzintervall für einen Mittelwert zu berechnen:

Konfidenzintervall = x +/- t n-1, 1-α/2 *(s/√n)

Gold:

  • x : Stichprobenmittel
  • t: der t-kritische Wert
  • s: Stichprobenstandardabweichung
  • n: Stichprobengröße

Beispiel: Angenommen, wir sammeln eine Zufallsstichprobe von Schildkröten mit den folgenden Informationen:

  • Stichprobengröße n = 25
  • Durchschnittliches Probengewicht x = 300
  • Stichprobenstandardabweichung s = 18,5

Der folgende Code zeigt, wie ein 95 %-Konfidenzintervall für das tatsächliche Durchschnittsgewicht der Schildkrötenpopulation berechnet wird:

 #input sample size, sample mean, and sample standard deviation
n <- 25
xbar <- 300 
s <- 18.5

#calculate margin of error
margin <- qt(0.975,df=n-1)*s/sqrt(n)

#calculate lower and upper bounds of confidence interval
low <- xbar - margin
low

[1] 292.3636

high <- xbar + margin
high

[1] 307.6364

Das 95 %-Konfidenzintervall für das tatsächliche mittlere Gewicht der Schildkrötenpopulation beträgt [292,36, 307,64] .

Beispiel 2: Konfidenzintervall für eine Mittelwertdifferenz

Wir verwenden die folgende Formel, um ein Konfidenzintervall für einen Unterschied in den Mittelwerten der Grundgesamtheit zu berechnen:

Konfidenzintervall = ( x 1x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))

Gold:

  • x 1 , x 2 : Mittelwert von Stichprobe 1, Mittelwert von Stichprobe 2
  • t: der t-kritische Wert basierend auf dem Konfidenzniveau und den Freiheitsgraden (n 1 + n 2 -2).
  • s p 2 : gepoolte Varianz, berechnet als ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
  • t: der t-kritische Wert
  • n 1 , n 2 : Stichprobengröße 1, Stichprobengröße 2

Beispiel: Angenommen, wir möchten den Unterschied im Durchschnittsgewicht zwischen zwei verschiedenen Schildkrötenarten schätzen. Wir sammeln daher eine Zufallsstichprobe von 15 Schildkröten aus jeder Population. Hier sind die zusammenfassenden Daten für jede Probe:

Probe 1:

  • x1 = 310
  • s 1 = 18,5
  • n 1 = 15

Probe 2:

  • x2 = 300
  • s2 = 16,4
  • n2 = 15

Der folgende Code zeigt, wie ein 95 %-Konfidenzintervall für den wahren Unterschied in den Mittelwerten der Grundgesamtheit berechnet wird:

 #input sample size, sample mean, and sample standard deviation
n1 <- 15
xbar1 <- 310 
s1 <- 18.5

n2 <- 15
xbar2 <- 300
s2 <- 16.4

#calculate pooled variance
sp = ((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n2-2)

#calculate margin of error
margin <- qt(0.975,df=n1+n2-1)*sqrt(sp/n1 + sp/n2)

#calculate lower and upper bounds of confidence interval
low <- (xbar1-xbar2) - margin
low

[1] -3.055445

high <- (xbar1-xbar2) + margin
high

[1] 23.05544

Das 95 %-Konfidenzintervall für die wahre Differenz zwischen den Grundgesamtheitsmittelwerten beträgt [-3,06, 23,06] .

Beispiel 3: Konfidenzintervall für einen Anteil

Wir verwenden die folgende Formel, um ein Konfidenzintervall für einen Anteil zu berechnen:

Konfidenzintervall = p +/- z*(√ p(1-p) / n )

Gold:

  • p: Stichprobenanteil
  • z: der gewählte z-Wert
  • n: Stichprobengröße

Beispiel: Angenommen, wir möchten den Anteil der Einwohner eines Landkreises schätzen, die ein bestimmtes Gesetz befürworten. Wir wählen eine Zufallsstichprobe von 100 Einwohnern aus und fragen sie, wie sie zum Gesetz stehen. Hier sind die Ergebnisse:

  • Stichprobengröße n = 100
  • Anteil der Befürworter des Gesetzes p = 0,56

Der folgende Code zeigt, wie ein 95 %-Konfidenzintervall für den tatsächlichen Anteil der landesweiten Einwohner berechnet wird, die das Gesetz befürworten:

 #input sample size and sample proportion
n <- 100
p <- .56

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p*(1-p)/n)

#calculate lower and upper bounds of confidence interval
low <- p - margin
low

[1] 0.4627099

high <- p + margin
high

[1] 0.6572901

Das 95 %-Konfidenzintervall für den tatsächlichen Anteil der Einwohner im gesamten Landkreis, die das Gesetz befürworten, beträgt [.463, .657] .

Beispiel 4: Konfidenzintervall für einen Unterschied in den Proportionen

Wir verwenden die folgende Formel, um ein Konfidenzintervall für einen Unterschied in den Proportionen zu berechnen:

Konfidenzintervall = (p 1p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )

Gold:

  • p 1 , p 2 : Anteil von Probe 1, Anteil von Probe 2
  • z: der z-kritische Wert basierend auf dem Konfidenzniveau
  • n 1 , n 2 : Stichprobengröße 1, Stichprobengröße 2

Beispiel: Angenommen, wir möchten den Unterschied zwischen dem Anteil der Einwohner, die ein bestimmtes Gesetz in Kreis A unterstützen, und dem Anteil, der das Gesetz in Kreis B unterstützt, schätzen. Hier sind die zusammenfassenden Daten für jede Stichprobe:

Probe 1:

  • n 1 = 100
  • p 1 = 0,62 (d. h. 62 von 100 Einwohnern unterstützen das Gesetz)

Probe 2:

  • n2 = 100
  • p 2 = 0,46 (d. h. 46 von 100 Einwohnern unterstützen das Gesetz)

Der folgende Code zeigt, wie ein 95 %-Konfidenzintervall für den tatsächlichen Unterschied im Anteil der Einwohner, die das Gesetz unterstützen, zwischen den Landkreisen berechnet wird:

 #input sample sizes and sample proportions
n1 <- 100
p1 <- .62

n2 <- 100
p2 <- .46

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p1*(1-p1)/n1 + p2*(1-p2)/n2)

#calculate lower and upper bounds of confidence interval
low <- (p1-p2) - margin
low

[1] 0.02364509


high <- (p1-p2) + margin
high

[1] 0.2963549

Das 95 %-Konfidenzintervall für den tatsächlichen Unterschied im Anteil der Einwohner, die das Gesetz zwischen den Landkreisen unterstützen, beträgt [0,024, 0,296] .

Weitere R-Tutorials finden Sie hier .

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert