È possibile utilizzare una combinazione della funzione RANK.EQ() e della funzione COUNTIFS() in Excel per classificare gli elementi in base a più criteri. L’esempio seguente mostra come utilizzare queste funzioni per ordinare gli elementi in un elenco in base a più...
Nelle statistiche, utilizziamo spesso i valori p per determinare se esiste una differenza statisticamente significativa tra la media di due gruppi. Tuttavia, mentre il valore p può dirci se esiste o meno una differenza statisticamente significativa tra due gruppi, la dimensione...
Puoi utilizzare uno dei due metodi per rimuovere righe duplicate da un frame di dati in R: Metodo 1: utilizzare Base R #remove duplicate rows across entire data frame df[ ! duplicated(df), ] #remove duplicate rows across specific columns of data...
Il valore logaritmico di un modello di regressione è un modo per misurare la bontà di adattamento di un modello. Maggiore è il valore di verosimiglianza, migliore è il modello che si adatta a un set di dati. Il valore della...
Il criterio informativo bayesiano , spesso abbreviato BIC , è una misura utilizzata per confrontare la bontà dell’adattamento di diversi modelli di regressione. In pratica, adattiamo più modelli di regressione allo stesso set di dati e scegliamo il modello con il...
Il criterio informativo bayesiano , spesso abbreviato BIC , è una misura utilizzata per confrontare la bontà dell’adattamento di diversi modelli di regressione. In pratica, adattiamo più modelli di regressione allo stesso set di dati e scegliamo il modello con il...
Un messaggio di errore che potresti incontrare in R è: Coefficients: (1 not defined because of singularities) Questo messaggio di errore si verifica quando si adatta un modello utilizzando la funzione glm() in R e due o più variabili predittive hanno...
Ogni volta che si adatta un modello lineare generale (come la regressione logistica, la regressione di Poisson, ecc.), la maggior parte dei software statistici produce valori per la devianza zero e la devianza residua del modello. La devianza zero ci dice...
In statistica, le variabili casuali sono chiamate iid – distribuite in modo indipendente e identico – se sono soddisfatte le seguenti due condizioni: (1) Indipendente – Il risultato di un evento non influenza il risultato di un altro. (2) Distribuito identicamente...
La regressione logistica è un tipo di regressione che possiamo utilizzare quando la variabile di risposta è binaria. Un modo comune per valutare la qualità di un modello di regressione logistica è creare una matrice di confusione , ovvero una tabella...