È possibile utilizzare la funzione DataFrame.std() per calcolare la deviazione standard dei valori in un DataFrame panda. Nella pratica è possibile utilizzare i seguenti metodi per calcolare la deviazione standard: Metodo 1: Calcola la deviazione standard di una colonna df [...
La regola pratica , a volte chiamata regola 68-95-99.7, afferma che per un dato set di dati con una distribuzione normale: Il 68% dei valori dei dati rientra in una deviazione standard dalla media. Il 95% dei valori dei dati si...
Usiamo spesso il coefficiente di correlazione di Pearson per calcolare la correlazione tra variabili numeriche continue. Dobbiamo però utilizzare una metrica diversa per calcolare la correlazione tra variabili categoriali, ovvero variabili che assumono nomi o etichette come: Stato civile (celibe, sposato,...
La codifica one-hot viene utilizzata per convertire le variabili categoriali in un formato che può essere facilmente utilizzato dagli algoritmi di machine learning . L’idea di base della codifica one-hot è quella di creare nuove variabili che assumano i valori 0...
È possibile utilizzare la seguente sintassi di base per creare sottotrame nella libreria di visualizzazione dati Seaborn in Python: #define dimensions of subplots (rows, columns) fig, axes = plt. subplots (2, 2) #create chart in each subplot sns. boxplot (data=df, x='...
Puoi utilizzare la seguente sintassi di base per estrarre il mese da una data in panda: df[' month '] = pd. DatetimeIndex (df[' date_column ']). month L’esempio seguente mostra come utilizzare questa funzione nella pratica. Esempio: estrai il mese dalla data...
Molti test statistici presuppongono che i set di dati siano distribuiti normalmente. Tuttavia, nella pratica spesso ciò non avviene. Un modo per risolvere questo problema è trasformare la distribuzione dei valori in un set di dati utilizzando una delle tre trasformazioni:...
La codifica one-hot viene utilizzata per convertire le variabili categoriali in un formato che può essere utilizzato dagli algoritmi di machine learning . L’idea di base della codifica one-hot è quella di creare nuove variabili che assumano i valori 0 e...
La correlazione policorica viene utilizzata per calcolare la correlazione tra variabili ordinali. Ricordiamo che le variabili ordinali sono variabili i cui possibili valori sono categoriali e hanno un ordine naturale. Ecco alcuni esempi di variabili misurate su scala ordinale: Soddisfazione :...
La regressione logistica è un tipo di modello di regressione che possiamo utilizzare per comprendere la relazione tra una o più variabili predittive e una variabile di risposta quando la variabile di risposta è binaria. Se abbiamo solo una variabile predittore...