Quando eseguiamo una regressione lineare semplice in R, è facile visualizzare la linea di regressione adattata perché stiamo lavorando solo con una singola variabile predittrice e una singola variabile di risposta . Ad esempio, il codice seguente mostra come adattare un...
La distanza di Cook viene utilizzata per identificare le osservazioni influenti in un modello di regressione. La formula per la distanza di Cook è: d i = (r i 2 / p*MSE) * (h ii / (1-h ii ) 2 )...
La frequenza cumulativa è una misura delle frequenze totali fino a un certo punto in un elenco di valori di dati. Per calcolare la frequenza cumulativa di un elenco di valori di dati, è sufficiente inserire i valori separati da virgole...
Una tabella di frequenza è una tabella che visualizza informazioni sulle frequenze. Le frequenze ci dicono semplicemente quante volte si è verificato un determinato evento. Ad esempio, la tabella seguente mostra il numero di articoli venduti da un negozio in diverse...
Un’ANOVA unidirezionale viene utilizzata per determinare se esiste o meno una differenza statisticamente significativa tra le medie di tre o più gruppi indipendenti. Se il valore p complessivo della tabella ANOVA è inferiore a un certo livello di significatività, allora abbiamo...
Uno dei parametri più comunemente utilizzati per misurare l’accuratezza delle previsioni di un modello è MAPE , che sta per errore percentuale assoluto medio . La formula per calcolare il MAPE è la seguente: MAPE = (1/n) * Σ(|effettivo – previsto|...
Una previsione ingenua è quella in cui la previsione per un dato periodo è semplicemente uguale al valore osservato nel periodo precedente. Ad esempio, supponiamo di avere le seguenti vendite di un determinato prodotto durante i primi tre mesi dell’anno: Le...
Un coefficiente di variazione , spesso abbreviato in CV , è un modo per misurare la diffusione dei valori in un set di dati rispetto alla media. Viene calcolato come segue: CV = σ/μ Oro: σ: la deviazione standard del set...
Un coefficiente di variazione , spesso abbreviato in CV , è un modo per misurare la diffusione dei valori in un set di dati rispetto alla media. Viene calcolato come segue: CV = σ/μ Oro: σ: la deviazione standard del set...
Una funzione di massa di probabilità , spesso abbreviata PMF , ci dice la probabilità che una variabile casuale discreta assuma un certo valore. Ad esempio, supponiamo di lanciare un dado una volta. Se indichiamo con x il numero su cui...