Il coefficiente di correlazione di Matthews (MCC) è una metrica che possiamo utilizzare per valutare le prestazioni di unmodello di classificazione . Viene calcolato come segue: Centro clienti = (TP*TN – FP*FN) / √ (TP+FP)(TP+FN)(TN+FP)(TN+FN) Oro: TP : numero di veri...
È possibile utilizzare la seguente sintassi di base in dplyr per modificare una variabile se una colonna contiene una stringa particolare: library (dplyr) df %>% mutate_at(vars(contains(' starter ')), ~ (scale(.) %>% as. vector )) Questa particolare sintassi applica la funzione scale()...
Un istogramma è un grafico che può essere utilizzato per visualizzare rapidamente la distribuzione dei valori in un set di dati. Questo tutorial fornisce un esempio passo passo di come creare un istogramma in Fogli Google e modificare il numero di...
Una media troncata è la media di un set di dati che è stata calcolata dopo aver rimosso una percentuale specifica dei valori più piccoli e più grandi nel set di dati. Ad esempio, una media troncata del 10% rappresenterebbe la...
Una media troncata è la media di un set di dati che è stata calcolata dopo aver rimosso una percentuale specifica dei valori più piccoli e più grandi nel set di dati. Ad esempio, una media troncata del 10% rappresenterebbe la...
Nel linguaggio di programmazione R, un data.frame fa parte del database R. Qualsiasi data.frame può essere convertito in data.table utilizzando la funzione setDF del pacchetto data.table . Un data.table offre i seguenti vantaggi rispetto a un data.frame in R: 1. È...
In un modello di regressione lineare, un coefficiente di regressione ci dice la variazione media nella variabile di risposta associata ad un aumento di un’unità della variabile predittrice. Possiamo utilizzare la seguente formula per calcolare un intervallo di confidenza per un...
Spesso potresti voler stampare una stringa e una variabile sulla stessa riga in R. Fortunatamente, questo è facile da fare utilizzando le funzioni print() e paste0() . L’esempio seguente mostra come eseguire questa operazione. Esempio: stampa una stringa e una variabile...
Uno degli algoritmi di clustering più comunemente utilizzati nell’apprendimento automatico è noto come clustering k-means . Il clustering K-means è una tecnica in cui inseriamo ciascuna osservazione da un set di dati in uno dei cluster K. L’obiettivo finale è quello...
La regressione logistica è un metodo che possiamo utilizzare per adattare un modello di regressione quando la variabile di risposta è binaria. Il seguente esempio passo passo mostra come eseguire la regressione logistica in Fogli Google. Passaggio 1: installare XLMiner Analysis...