La multicollinearità nell’analisi di regressione si verifica quando due o più variabili predittive sono altamente correlate tra loro, in modo tale da non fornire informazioni univoche o indipendenti nel modello di regressione. Se il grado di correlazione tra le variabili è...
Questo tutorial fornisce una guida completa ai migliori temi ggplot2, tra cui: Come modificare l’aspetto delle trame utilizzando i temi ggplot2 integrati. Come modificare l’aspetto delle trame utilizzando temi predefiniti dalla libreria ggthemes . Come modificare componenti specifici del tema, inclusi...
Questa guida mostra un esempio di come eseguire una regressione lineare multipla in R, tra cui: Esaminare i dati prima di adattare il modello Regolazione del modello Verifica delle ipotesi del modello Interpretare l’output del modello Valutazione della bontà dell’adattamento del...
La distanza di Cook , spesso indicata con D i , viene utilizzata nell’analisi di regressione per identificare punti dati influenti che potrebbero influenzare negativamente il modello di regressione. La formula per la distanza di Cook è: d i = (r...
Una tabella di frequenza bidirezionale è una tabella che visualizza le frequenze (o “conteggi”) per due variabili categoriali. Ad esempio, la seguente tabella a due vie mostra i risultati di un sondaggio in cui è stato chiesto a 100 persone quale...
Molti test statistici (come l’ ANOVA unidirezionale o l’ANOVA bidirezionale ) presuppongono che la varianza tra più gruppi sia uguale. Un modo per verificare formalmente questa ipotesi è utilizzare il test di Levene , che verifica se la varianza tra due...
Un grafico QQ , abbreviazione di “quantile-quantile”, è un tipo di grafico che possiamo utilizzare per determinare se un set di dati proviene potenzialmente o meno da una distribuzione teorica. Molti test statistici presuppongono che un set di dati segua una...
Questo tutorial fornisce una semplice spiegazione su come interpretare la statistica C di un modello di regressione logistica. Cos’è la regressione logistica? La regressione logistica è un metodo statistico che utilizziamo per adattare un modello di regressione quando la variabile di...
L’ ennesimo percentile di un set di dati è il valore che elimina il primo n % dei valori dei dati quando tutti i valori vengono ordinati dal più piccolo al più grande. Ad esempio, il 90° percentile di un set...
Un t-test per campioni appaiati è un test statistico che confronta le medie di due campioni quando ciascuna osservazione di un campione può essere abbinata a un’osservazione dell’altro campione. Ad esempio, supponiamo di voler sapere se un determinato curriculum ha un...