Il clustering è una tecnica di apprendimento automatico che tenta di trovare gruppi di osservazioni all’interno di un set di dati. L’obiettivo è trovare cluster tali che le osservazioni all’interno di ciascun cluster siano abbastanza simili tra loro, mentre le osservazioni...
La varianza è un modo per misurare quanto bene i valori dei dati sono distribuiti attorno alla media. La formula per trovare la varianza di una popolazione è: σ 2 = Σ (x i – μ) 2 / N dove μ...
Il clustering è una tecnica di apprendimento automatico che tenta di trovare gruppi o cluster di osservazioni all’interno di un set di dati. L’obiettivo è trovare cluster tali che le osservazioni all’interno di ciascun cluster siano abbastanza simili tra loro, mentre...
Un residuo di studente è semplicemente un residuo diviso per la sua deviazione standard stimata. In pratica, generalmente diciamo che qualsiasi osservazione in un set di dati il cui residuo di studenti è maggiore di un valore assoluto di 3 è...
Un residuo di studente è semplicemente un residuo diviso per la sua deviazione standard stimata. In pratica, generalmente diciamo che qualsiasi osservazione in un set di dati il cui residuo di studenti è maggiore di un valore assoluto di 3 è...
Una trasformazione box-cox è un metodo comunemente utilizzato per trasformare un set di dati non distribuito normalmente in un set distribuito più normalmente . L’idea alla base di questo metodo è trovare un valore per λ tale che i dati trasformati...
La distanza Manhattan tra due vettori, A e B , si calcola come segue: Σ|a i – b i | dove i è l’i- esimo elemento di ciascun vettore. Questa distanza viene utilizzata per misurare la dissomiglianza tra due vettori qualsiasi...
La distanza di Minkowski tra due vettori A e B si calcola come segue: (Σ|a i – b i | p ) 1/p dove i è l’i- esimo elemento di ciascun vettore e p è un numero intero. Questa distanza viene...
Quando si esegue un’analisi di regressione o ANOVA in R, le tabelle di output contengono valori p per le variabili utilizzate nell’analisi insieme ai codici di significatività corrispondenti . Questi codici di significatività vengono visualizzati come una serie di stelle o...
Per adattare un modello di regressione lineare in R, possiamo usare il comando lm() . Per visualizzare l’output del modello di regressione, possiamo quindi utilizzare il comando summary() . Questo tutorial spiega come interpretare ciascun valore dell’output della regressione in R....