Spesso potresti voler raggruppare e aggregare più colonne di un DataFrame panda. Fortunatamente, questo è facile da fare utilizzando le funzioni panda .groupby() e .agg() . Questo tutorial spiega diversi esempi di utilizzo pratico di queste funzioni. Esempio 1: raggruppa per...
Spesso potresti voler normalizzare i valori dei dati di una o più colonne in un DataFrame panda. Questo tutorial spiega due modi per farlo: 1. Normalizzazione Min-Max Scopo: converte ciascun valore di dati in un valore compreso tra 0 e 1....
Il test di Shapiro-Wilk è un test di normalità. Viene utilizzato per determinare se un campione proviene o meno da una distribuzione normale . Per eseguire un test Shapiro-Wilk in Python possiamo utilizzare la funzione scipy.stats.shapiro() , che utilizza la seguente...
Il test di Kolmogorov-Smirnov viene utilizzato per verificare se un campione proviene o meno da una determinata distribuzione. Per eseguire un test di Kolmogorov-Smirnov in Python, possiamo utilizzare scipy.stats.kstest() per un test a un campione o scipy.stats.ks_2samp() per un test a...
I ricercatori spesso prelevano campioni da una popolazione e utilizzano i dati del campione per trarre conclusioni sulla popolazione nel suo insieme. Un metodo di campionamento comunemente utilizzato è il campionamento casuale stratificato , in cui una popolazione viene divisa in...
Spesso potresti voler ombreggiare il colore dei punti in un grafico a dispersione matplotlib basato su una terza variabile. Fortunatamente, questo è facile da fare utilizzando la funzione matplotlib.pyplot.scatter() , che accetta la seguente sintassi: matplotlib.pyplot.scatter(x, y, s=Nessuno, c=Nessuno, cmap=Nessuno) Oro:...
L’errore quadratico medio (RMSE) è una metrica che ci dice quanto distano, in media, i nostri valori previsti dai valori osservati in un modello. Viene calcolato come segue: RMSE = √[ Σ(P i – O i ) 2 / n ]...
Spesso potresti voler modificare la dimensione del carattere di vari elementi su un grafico Matplotlib. Fortunatamente, questo è facile da fare utilizzando il seguente codice: import matplotlib.pyplot as plt plt. rc ('font', size=10) #controls default text size plt. rc ('axes', titlesize=10)...
Un diagramma di contorno è un tipo di diagramma che ci consente di visualizzare dati tridimensionali in due dimensioni utilizzando i contorni. È possibile creare un diagramma di contorno in Matplotlib utilizzando le due funzioni seguenti: matplotlib.pyplot.contour() – Crea grafici di...
Spesso potresti voler rimuovere i segni di graduazione da uno o più assi in un grafico Matplotlib. Fortunatamente, questo è facile da fare utilizzando la funzione tick_params() . Questo tutorial mostra diversi esempi di come utilizzare questa funzionalità nella pratica, in...