So finden sie konfidenzintervalle in r (mit beispielen)
EinKonfidenzintervall ist ein Wertebereich, der wahrscheinlich einen Populationsparameter mit einem bestimmten Konfidenzniveau enthält.
Die Berechnung erfolgt nach folgender allgemeiner Formel:
Konfidenzintervall = (Punktschätzung) +/- (kritischer Wert)* (Standardfehler)
Diese Formel erstellt ein Intervall mit einer Untergrenze und einer Obergrenze, das wahrscheinlich einen Populationsparameter mit einem gewissen Maß an Konfidenz enthält:
Konfidenzintervall = [untere Grenze, obere Grenze]
In diesem Tutorial wird erklärt, wie die folgenden Konfidenzintervalle in R berechnet werden:
1. Konfidenzintervall für einen Mittelwert
2. Konfidenzintervall für einen Mittelwertunterschied
3. Konfidenzintervall für einen Anteil
4. Konfidenzintervall für einen Unterschied in den Proportionen
Lass uns gehen!
Beispiel 1: Konfidenzintervall für einen Mittelwert
Wir verwenden die folgende Formel, um ein Konfidenzintervall für einen Mittelwert zu berechnen:
Konfidenzintervall = x +/- t n-1, 1-α/2 *(s/√n)
Gold:
- x : Stichprobenmittel
- t: der t-kritische Wert
- s: Stichprobenstandardabweichung
- n: Stichprobengröße
Beispiel: Angenommen, wir sammeln eine Zufallsstichprobe von Schildkröten mit den folgenden Informationen:
- Stichprobengröße n = 25
- Durchschnittliches Probengewicht x = 300
- Stichprobenstandardabweichung s = 18,5
Der folgende Code zeigt, wie ein 95 %-Konfidenzintervall für das tatsächliche Durchschnittsgewicht der Schildkrötenpopulation berechnet wird:
#input sample size, sample mean, and sample standard deviation n <- 25 xbar <- 300 s <- 18.5 #calculate margin of error margin <- qt(0.975,df=n-1)*s/sqrt(n) #calculate lower and upper bounds of confidence interval low <- xbar - margin low [1] 292.3636 high <- xbar + margin high [1] 307.6364
Das 95 %-Konfidenzintervall für das tatsächliche mittlere Gewicht der Schildkrötenpopulation beträgt [292,36, 307,64] .
Beispiel 2: Konfidenzintervall für eine Mittelwertdifferenz
Wir verwenden die folgende Formel, um ein Konfidenzintervall für einen Unterschied in den Mittelwerten der Grundgesamtheit zu berechnen:
Konfidenzintervall = ( x 1 – x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))
Gold:
- x 1 , x 2 : Mittelwert von Stichprobe 1, Mittelwert von Stichprobe 2
- t: der t-kritische Wert basierend auf dem Konfidenzniveau und den Freiheitsgraden (n 1 + n 2 -2).
- s p 2 : gepoolte Varianz, berechnet als ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
- t: der t-kritische Wert
- n 1 , n 2 : Stichprobengröße 1, Stichprobengröße 2
Beispiel: Angenommen, wir möchten den Unterschied im Durchschnittsgewicht zwischen zwei verschiedenen Schildkrötenarten schätzen. Wir sammeln daher eine Zufallsstichprobe von 15 Schildkröten aus jeder Population. Hier sind die zusammenfassenden Daten für jede Probe:
Probe 1:
- x1 = 310
- s 1 = 18,5
- n 1 = 15
Probe 2:
- x2 = 300
- s2 = 16,4
- n2 = 15
Der folgende Code zeigt, wie ein 95 %-Konfidenzintervall für den wahren Unterschied in den Mittelwerten der Grundgesamtheit berechnet wird:
#input sample size, sample mean, and sample standard deviation n1 <- 15 xbar1 <- 310 s1 <- 18.5 n2 <- 15 xbar2 <- 300 s2 <- 16.4 #calculate pooled variance sp = ((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n2-2) #calculate margin of error margin <- qt(0.975,df=n1+n2-1)*sqrt(sp/n1 + sp/n2) #calculate lower and upper bounds of confidence interval low <- (xbar1-xbar2) - margin low [1] -3.055445 high <- (xbar1-xbar2) + margin high [1] 23.05544
Das 95 %-Konfidenzintervall für die wahre Differenz zwischen den Grundgesamtheitsmittelwerten beträgt [-3,06, 23,06] .
Beispiel 3: Konfidenzintervall für einen Anteil
Wir verwenden die folgende Formel, um ein Konfidenzintervall für einen Anteil zu berechnen:
Konfidenzintervall = p +/- z*(√ p(1-p) / n )
Gold:
- p: Stichprobenanteil
- z: der gewählte z-Wert
- n: Stichprobengröße
Beispiel: Angenommen, wir möchten den Anteil der Einwohner eines Landkreises schätzen, die ein bestimmtes Gesetz befürworten. Wir wählen eine Zufallsstichprobe von 100 Einwohnern aus und fragen sie, wie sie zum Gesetz stehen. Hier sind die Ergebnisse:
- Stichprobengröße n = 100
- Anteil der Befürworter des Gesetzes p = 0,56
Der folgende Code zeigt, wie ein 95 %-Konfidenzintervall für den tatsächlichen Anteil der landesweiten Einwohner berechnet wird, die das Gesetz befürworten:
#input sample size and sample proportion n <- 100 p <- .56 #calculate margin of error margin <- qnorm(0.975)*sqrt(p*(1-p)/n) #calculate lower and upper bounds of confidence interval low <- p - margin low [1] 0.4627099 high <- p + margin high [1] 0.6572901
Das 95 %-Konfidenzintervall für den tatsächlichen Anteil der Einwohner im gesamten Landkreis, die das Gesetz befürworten, beträgt [.463, .657] .
Beispiel 4: Konfidenzintervall für einen Unterschied in den Proportionen
Wir verwenden die folgende Formel, um ein Konfidenzintervall für einen Unterschied in den Proportionen zu berechnen:
Konfidenzintervall = (p 1 – p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )
Gold:
- p 1 , p 2 : Anteil von Probe 1, Anteil von Probe 2
- z: der z-kritische Wert basierend auf dem Konfidenzniveau
- n 1 , n 2 : Stichprobengröße 1, Stichprobengröße 2
Beispiel: Angenommen, wir möchten den Unterschied zwischen dem Anteil der Einwohner, die ein bestimmtes Gesetz in Kreis A unterstützen, und dem Anteil, der das Gesetz in Kreis B unterstützt, schätzen. Hier sind die zusammenfassenden Daten für jede Stichprobe:
Probe 1:
- n 1 = 100
- p 1 = 0,62 (d. h. 62 von 100 Einwohnern unterstützen das Gesetz)
Probe 2:
- n2 = 100
- p 2 = 0,46 (d. h. 46 von 100 Einwohnern unterstützen das Gesetz)
Der folgende Code zeigt, wie ein 95 %-Konfidenzintervall für den tatsächlichen Unterschied im Anteil der Einwohner, die das Gesetz unterstützen, zwischen den Landkreisen berechnet wird:
#input sample sizes and sample proportions n1 <- 100 p1 <- .62 n2 <- 100 p2 <- .46 #calculate margin of error margin <- qnorm(0.975)*sqrt(p1*(1-p1)/n1 + p2*(1-p2)/n2) #calculate lower and upper bounds of confidence interval low <- (p1-p2) - margin low [1] 0.02364509 high <- (p1-p2) + margin high [1] 0.2963549
Das 95 %-Konfidenzintervall für den tatsächlichen Unterschied im Anteil der Einwohner, die das Gesetz zwischen den Landkreisen unterstützen, beträgt [0,024, 0,296] .
Weitere R-Tutorials finden Sie hier .