Un grafico a barre è utile per visualizzare le quantità di diverse variabili categoriali. A volte vogliamo creare un barplot che visualizzi le quantità di variabili categoriali divise in sottogruppi. Ad esempio, potremmo voler visualizzare le vendite totali di popcorn e...
Nelle statistiche, un punteggio z ci dice quante deviazioni standard un dato valore è dalla media . Usiamo la seguente formula per calcolare uno z-score: z = (X – μ) / σ Oro: X è un singolo valore di dati grezzi...
In statistica, l’errore medio assoluto (MAE) è un modo per misurare l’accuratezza di un determinato modello. Viene calcolato come segue: MAE = (1/n) * Σ|y i – x i | Oro: Σ: simbolo greco che significa “somma” y i : il...
Nelle statistiche, una proporzione della popolazione si riferisce alla frazione di individui in una popolazione con una determinata caratteristica. Ad esempio, supponiamo che il 43,8% dei residenti di una determinata città sostenga una nuova legge. Il valore 0,438 rappresenta una proporzione...
In una distribuzione di frequenza, i confini delle classi sono i valori che separano le classi. Utilizziamo i seguenti passaggi per calcolare i confini delle classi in una distribuzione di frequenza: 1. Sottrarre il limite superiore della prima classe dal limite...
Un istogramma è un grafico che ci aiuta a visualizzare la distribuzione dei valori in un insieme di dati. Si scopre che il numero di riquadri utilizzati in un istogramma può avere un enorme impatto sul modo in cui interpretiamo i...
L’asimmetria è un modo per descrivere la simmetria di una distribuzione. Una distribuzione è distorta se ha una “coda” sul lato sinistro della distribuzione: Una distribuzione è distorta a destra se ha una “coda” sul lato destro della distribuzione: E una...
La funzione pandas fillna() è utile per riempire i valori mancanti nelle colonne di un DataFrame pandas. Questo tutorial fornisce diversi esempi di utilizzo di questa funzione per riempire i valori mancanti per più colonne nel seguente DataFrame panda: import pandas...
Un test di tendenza di Mann-Kendall viene utilizzato per determinare se esiste o meno una tendenza nei dati delle serie temporali. Questo è un test non parametrico, il che significa che non vengono fatte ipotesi sottostanti sulla normalità dei dati. Le...
Una mappa termica è un tipo di grafico che utilizza diverse sfumature di colori per rappresentare i valori dei dati. Questo tutorial spiega come creare mappe di calore utilizzando la libreria di visualizzazione Seaborn Python con il seguente set di dati:...