La V di Cramer è una misura della forza dell’associazione tra due variabili nominali. Va da 0 a 1 dove: 0 indica nessuna associazione tra le due variabili. 1 indica una forte associazione tra le due variabili. Viene calcolato come segue:...
Un test F parziale viene utilizzato per determinare se esiste o meno una differenza statisticamente significativa tra un modello di regressione e una versione nidificata dello stesso modello. Un modello nidificato è semplicemente un modello che contiene un sottoinsieme di variabili...
È possibile utilizzare la seguente sintassi per rimuovere le righe contenenti una determinata stringa in un frame di dati in R: df[!grepl(' string ', df$column),] Questo tutorial fornisce diversi esempi di utilizzo pratico di questa sintassi con il seguente frame di...
Molti test statistici presuppongono che i set di dati siano distribuiti normalmente . Tuttavia, nella pratica questo presupposto viene spesso violato. Un modo per risolvere questo problema è trasformare i valori nel set di dati utilizzando una delle tre trasformazioni seguenti:...
Una trasformazione box-cox è un metodo comunemente utilizzato per trasformare un set di dati non distribuito normalmente in un set distribuito più normalmente . L’idea di base è trovare un valore per λ tale che i dati trasformati siano il più...
Spesso potresti voler adattare una curva a un set di dati in Python. Il seguente esempio passo passo spiega come adattare le curve ai dati in Python utilizzando la funzione numpy.polyfit() e come determinare quale curva si adatta meglio ai dati....
Un grafico log-log è un grafico che utilizza scale logaritmiche sia sull’asse x che sull’asse y. Questo tipo di grafico è utile per visualizzare due variabili quando la vera relazione tra loro segue un qualche tipo di legge di potere. Questo...
Spesso potresti voler contare solo il numero di righe in un DataFrame panda che soddisfa determinati criteri. Fortunatamente, questo è facile da fare utilizzando la seguente sintassi di base: sum(df. column_name == some_value ) I seguenti esempi mostrano come utilizzare in...
La distribuzione normale è la distribuzione di probabilità più comunemente utilizzata in statistica. Ha le seguenti proprietà: Simmetrico A forma di campana La media e la mediana sono uguali; entrambi situati al centro della distribuzione La media della distribuzione normale determina...
Un grafico semi-logaritmico è un tipo di grafico che utilizza una scala logaritmica sull’asse y e una scala lineare sull’asse x. Questo tipo di grafico viene spesso utilizzato quando i valori della variabile y hanno una variabilità molto maggiore rispetto ai...