Il test esatto di Fisher viene utilizzato per determinare se esiste o meno un’associazione significativa tra due variabili categoriali. Viene generalmente utilizzato come alternativa al test di indipendenza chi quadrato quando uno o più conteggi di celle in una tabella 2...
È possibile utilizzare la seguente sintassi di base per modificare gli intervalli degli assi su un grafico base R: #create plot with no axis intervals plot(x, y, xaxt=' n ', yaxt=' n ') #specifty x-axis interval axis(side= 1 , at=c(1, 5,...
Puoi utilizzare l’argomento theme() in ggplot2 per modificare le aree di margine di una trama: ggplot(df, aes(x=x)) + geom_histogram() + theme(plot. margin =unit(c(5,1,1,1), ' cm ')) Tieni presente che l’ordine dei margini della trama è il seguente: unità(c(alto, destra, basso, sinistra),...
È possibile utilizzare le seguenti funzioni del pacchetto lubrificanti in R per trovare rapidamente il giorno della settimana: Metodo 1: trovare il giorno numerico della settimana (supponendo che la settimana inizi di domenica) wday(df$date_column) Metodo 2: trovare il giorno numerico della...
Molti test statistici presuppongono che i set di dati siano distribuiti normalmente. Esistono quattro modi comuni per verificare questa ipotesi in R: 1. (Metodo visivo) Creare un istogramma. Se l’istogramma ha approssimativamente la forma di una “campana”, si presuppone che i...
La V di Cramer è una misura della forza dell’associazione tra due variabili nominali. Va da 0 a 1 dove: 0 indica nessuna associazione tra le due variabili. 1 indica una perfetta associazione tra le due variabili. Viene calcolato come segue:...
L’ errore standard della pendenza di regressione è un modo per misurare l'”incertezza” nella stima della pendenza di regressione. Viene calcolato come segue: Oro: n : dimensione totale del campione y i : valore reale della variabile di risposta ŷ i...
I modelli di regressione vengono utilizzati per quantificare la relazione tra una o più variabili predittive e una variabile di risposta . Ogni volta che adattiamo un modello di regressione, vogliamo capire quanto bene il modello è in grado di utilizzare...
Esistono due scenari comuni in cui ha senso utilizzare una scala logaritmica durante la creazione di grafici: Scenario 1: alcuni valori sono significativamente più alti di tutti gli altri valori. Utilizzando una scala logaritmica è più semplice visualizzare i valori più...
Un grafico semi-logaritmico è un tipo di grafico che utilizza una scala lineare sull’asse x e una scala logaritmica sull’asse y. Usiamo spesso questo tipo di grafico quando i valori della variabile y hanno una variabilità molto maggiore rispetto ai valori...