“Detendere” i dati delle serie temporali significa rimuovere una tendenza sottostante nei dati. Il motivo principale per cui vogliamo farlo è visualizzare più facilmente le tendenze sottostanti nei dati stagionali o ciclici. Ad esempio, considera i seguenti dati della serie temporale...
Possiamo utilizzare la seguente sintassi per tracciare una linea di regressione di gruppo utilizzando il pacchetto di visualizzazione R ggplot2 : ggplot(df, aes (x = x_variable, y = y_variable, color = group_variable)) + geom_point() + geom_smooth(method = " lm ", fill...
Uno dei presupposti principali della regressione lineare è che non vi sia alcuna correlazione tra residui consecutivi. In altre parole, assumiamo che i residui siano indipendenti. Quando questa ipotesi viene violata, è probabile che gli errori standard dei coefficienti in un...
Nelle statistiche, la varianza dei cluster si riferisce semplicemente alla media di due o più varianze dei cluster. Usiamo la parola “pool” per indicare che stiamo “raggruppando” due o più varianze di gruppo per ottenere un unico numero per la varianza...
Winsorizzare i dati significa impostare valori anomali estremi pari a un percentile specificato dei dati. Ad esempio, una winsorizzazione del 90% imposta tutte le osservazioni al di sopra del 95° percentile pari al valore al 95° percentile e tutte le osservazioni...
Winsorizzare i dati significa impostare valori anomali estremi pari a un percentile specificato dei dati. Ad esempio, una winsorizzazione del 90% imposta tutte le osservazioni al di sopra del 95° percentile pari al valore al 95° percentile e tutte le osservazioni...
Un diagramma a punti in pila è un tipo di diagramma che visualizza le frequenze utilizzando punti. Esistono due metodi che è possibile utilizzare per creare un grafico di punti in pila in R: Metodo 1: la funzione stripchart() in base...
Centrare un set di dati significa sottrarre il valore medio di ogni singola osservazione nel set di dati. Ad esempio, supponiamo di avere il seguente set di dati: Risulta che il valore medio è 14. Quindi, per centrare questo set di...
Possiamo usare la seguente sintassi per aggiungere righe specifiche di un frame di dati in R: with (df, sum (column_1[column_2 == ' some value '])) Questa sintassi trova la somma delle righe della colonna 1 in cui la colonna 2 è...
La funzione ifelse() in base R può essere utilizzata per scrivere istruzioni if-else rapide. Questa funzione utilizza la seguente sintassi: ifelse(prova, sì, no) Oro: test: un test logico sì: il valore da restituire se il test logico è Vero no: il...