Come calcolare il valore p di una statistica f in r

Di Benjamin anderson Luglio 29, 2023 Guida 0 commenti

Un test F produce una statistica F. Per trovare il valore p associato a una statistica F in R, puoi utilizzare il seguente comando:

pf(fstat, df1, df2, lower.tail = FALSO)

fstat – il valore della statistica f
df1 – gradi di libertà 1
df2 – gradi di libertà 2
lower.tail – se restituire o meno la probabilità associata alla coda inferiore della distribuzione F. Questo è VERO per impostazione predefinita.

Ad esempio, ecco come trovare il valore p associato a una statistica F pari a 5, con gradi di libertà 1 = 3 e gradi di libertà 2 = 14:

 pf(5, 3, 14, lower.tail = FALSE)

#[1] 0.01457807

Uno degli usi più comuni di un test F è testare la significatività complessiva di un modello di regressione . Nell’esempio seguente mostriamo come calcolare il valore p della statistica F per un modello di regressione.

Esempio: calcolo del valore p dalla statistica F

Supponiamo di avere un set di dati che mostra il numero totale di ore studiate, il numero totale di esami preparatori sostenuti e il voto dell’esame finale per 12 studenti diversi:

 #create dataset
data <- data.frame(study_hours = c(3, 7, 16, 14, 12, 7, 4, 19, 4, 8, 8, 3),
prep_exams = c(2, 6, 5, 2, 7, 4, 4, 2, 8, 4, 1, 3),
final_score = c(76, 88, 96, 90, 98, 80, 86, 89, 68, 75, 72, 76))

#view first six rows of dataset
head(data)

# study_hours prep_exams final_score
#1 3 2 76
#2 7 6 88
#3 16 5 96
#4 14 2 90
#5 12 7 98
#6 7 4 80

Quindi possiamo adattare un modello di regressione lineare a questi dati utilizzando le ore di studio e gli esami preparatori come variabili predittive e il punteggio finale come variabile di risposta. Quindi possiamo visualizzare il risultato del modello:

 #fit regression model
model <- lm(final_score ~ study_hours + prep_exams, data = data)

#view output of the model
summary(model)

#Call:
#lm(formula = final_score ~ study_hours + prep_exams, data = data)
#
#Residuals:
# Min 1Q Median 3Q Max 
#-13,128 -5,319 2,168 3,458 9,341 
#
#Coefficients:
#Estimate Std. Error t value Pr(>|t|)    
#(Intercept) 66,990 6,211 10,785 1.9e-06 ***
#study_hours 1.300 0.417 3.117 0.0124 *  
#prep_exams 1.117 1.025 1.090 0.3041    
#---
#Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#
#Residual standard error: 7.327 on 9 degrees of freedom
#Multiple R-squared: 0.5308, Adjusted R-squared: 0.4265 
#F-statistic: 5.091 on 2 and 9 DF, p-value: 0.0332

Nell’ultima riga del risultato, possiamo vedere che la statistica F per il modello di regressione complessivo è 5.091 . Questa statistica F ha 2 gradi di libertà per il numeratore e 9 gradi di libertà per il denominatore. R calcola automaticamente che il valore p per questa statistica F è 0,0332 .

Per calcolare noi stessi questo valore p equivalente, potremmo utilizzare il seguente codice:

 pf(5.091, 2, 9, lower.tail = FALSE)

#[1] 0.0331947

Tieni presente che otteniamo la stessa risposta (ma con più cifre decimali visualizzate) dell’output della regressione lineare sopra.

Informazioni sull'autore

Benjamin anderson

Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di più

Esempio: calcolo del valore p dalla statistica F

Informazioni sull'autore

Benjamin anderson

Aggiungi un commento