Distribuzione di probabilità
Questo articolo spiega quali sono le distribuzioni di probabilità nelle statistiche. Quindi troverai la definizione di distribuzione di probabilità, esempi di distribuzioni di probabilità e i diversi tipi di distribuzioni di probabilità.
Cos’è una distribuzione di probabilità?
Una distribuzione di probabilità è una funzione che definisce la probabilità di occorrenza di ciascun valore di una variabile casuale . In poche parole, una distribuzione di probabilità è una funzione matematica che descrive le probabilità di tutti i possibili risultati di un esperimento casuale.
Ad esempio, lasciamo
Pertanto, le distribuzioni di probabilità sono spesso utilizzate nella teoria e nella statistica della probabilità, poiché vengono utilizzate per calcolare le probabilità di diversi eventi in uno spazio campionario .
Tipi di distribuzioni di probabilità
Le distribuzioni di probabilità possono essere suddivise in due grandi tipologie: distribuzioni discrete e distribuzioni continue.
- Distribuzione di probabilità discreta: la distribuzione può assumere solo un numero numerabile di valori in un intervallo. Normalmente, le distribuzioni di probabilità discrete possono assumere solo valori interi, cioè non hanno cifre decimali.
- Distribuzione di probabilità continua: la distribuzione può assumere un numero infinito di valori in un intervallo. In generale, le distribuzioni di probabilità continue possono assumere valori decimali.
Distribuzioni discrete di probabilità
Una distribuzione di probabilità discreta è la distribuzione che definisce le probabilità di una variabile casuale discreta. Pertanto, una distribuzione di probabilità discreta può assumere solo un numero finito di valori (solitamente valori interi).
Distribuzione discreta ed uniforme
La distribuzione uniforme discreta è una distribuzione di probabilità discreta in cui tutti i valori sono equiprobabili, cioè in una distribuzione uniforme discreta tutti i valori hanno la stessa probabilità di verificarsi.
Ad esempio, il lancio di un dado può essere definito con una distribuzione discreta e uniforme, poiché tutti i possibili risultati (1, 2, 3, 4, 5 o 6) hanno la stessa probabilità di verificarsi.
In generale, una distribuzione discreta uniforme ha due parametri caratteristici, a e b , che definiscono l’intervallo di possibili valori che la distribuzione può assumere. Pertanto, quando una variabile è definita da una distribuzione uniforme discreta, si scrive Uniform(a,b) .
La distribuzione discreta uniforme può essere utilizzata per descrivere esperimenti casuali perché se tutti i risultati hanno la stessa probabilità, significa che l’esperimento è casuale.
Distribuzione di Bernoulli
La distribuzione di Bernoulli , detta anche distribuzione dicotomica , è una distribuzione di probabilità che rappresenta una variabile discreta che può avere solo due esiti: “successo” o “fallimento”.
Nella distribuzione di Bernoulli, il “successo” è l’esito che ci aspettiamo e ha valore 1, mentre l’esito del “fallimento” è un esito diverso da quello atteso e ha valore 0. Quindi, se la probabilità dell’esito di “ successo” è p , la probabilità dell’esito di “fallimento” è q=1-p .
La distribuzione di Bernoulli prende il nome dallo statistico svizzero Jacob Bernoulli.
In statistica, la distribuzione di Bernoulli ha principalmente un’applicazione: definire le probabilità di esperimenti in cui ci sono solo due possibili risultati: successo e fallimento. Quindi, un esperimento che utilizza la distribuzione di Bernoulli è chiamato test di Bernoulli o esperimento di Bernoulli.
Distribuzione binomiale
La distribuzione binomiale , chiamata anche distribuzione binomiale , è una distribuzione di probabilità che conta il numero di successi quando si eseguono una serie di esperimenti dicotomici indipendenti con una probabilità di successo costante. In altre parole, la distribuzione binomiale è una distribuzione che descrive il numero di esiti positivi di una sequenza di prove Bernoulliane.
Ad esempio, il numero di volte in cui appare “testa” quando si lancia una moneta 25 volte è una distribuzione binomiale.
In generale il numero totale di esperimenti eseguiti è definito con il parametro n , mentre p è la probabilità di successo di ciascun esperimento. Pertanto, una variabile casuale che segue una distribuzione binomiale si scrive come segue:
Si noti che in una distribuzione binomiale, lo stesso identico esperimento viene ripetuto n volte e gli esperimenti sono indipendenti l’uno dall’altro, quindi la probabilità di successo di ciascun esperimento è la stessa (p) .
Distribuzione del pesce
La distribuzione di Poisson è una distribuzione di probabilità che definisce la probabilità che un dato numero di eventi si verifichi in un periodo di tempo. In altre parole, la distribuzione di Poisson viene utilizzata per modellare variabili casuali che descrivono il numero di volte in cui un fenomeno si ripete in un intervallo di tempo.
Ad esempio, il numero di chiamate ricevute da una centrale telefonica al minuto è una variabile casuale discreta che può essere definita utilizzando la distribuzione di Poisson.
La distribuzione di Poisson ha un parametro caratteristico, rappresentato dalla lettera greca λ e indica il numero di volte in cui si prevede che l’evento studiato si verifichi durante un dato intervallo.
distribuzione multinomiale
La distribuzione multinomiale (o distribuzione multinomiale ) è una distribuzione di probabilità che descrive la probabilità che più eventi mutuamente esclusivi si verifichino un dato numero di volte dopo diverse prove.
Cioè, se un esperimento casuale può dare come risultato tre o più eventi esclusivi ed è nota la probabilità che ciascun evento si verifichi separatamente, la distribuzione multinomiale viene utilizzata per calcolare la probabilità che quando vengono eseguiti più esperimenti si verifichi un certo numero di eventi. volta ogni volta.
La distribuzione multinomiale è quindi una generalizzazione della distribuzione binomiale.
distribuzione geometrica
La distribuzione geometrica è una distribuzione di probabilità che definisce il numero di prove Bernoulliane necessarie per ottenere il primo risultato positivo. Cioè, una distribuzione geometrica modella processi in cui gli esperimenti di Bernoulli vengono ripetuti finché uno di essi non ottiene un risultato positivo.
Ad esempio, il numero di auto che passano su un’autostrada finché non vedono un’auto gialla è una distribuzione geometrica.
Ricorda che un test di Bernoulli è un esperimento che ha due possibili esiti: “successo” e “fallimento”. Quindi se la probabilità di “successo” è p , la probabilità di “fallimento” è q=1-p .
La distribuzione geometrica dipende quindi dal parametro p , che è la probabilità di successo di tutti gli esperimenti effettuati. Inoltre, la probabilità p è la stessa per tutti gli esperimenti.
distribuzione binomiale negativa
La distribuzione binomiale negativa è una distribuzione di probabilità che descrive il numero di prove Bernoulliane necessarie per ottenere un dato numero di risultati positivi.
Pertanto, una distribuzione binomiale negativa ha due parametri caratteristici: r è il numero di risultati desiderati e p è la probabilità di successo per ogni esperimento di Bernoulli eseguito.
Pertanto, una distribuzione binomiale negativa definisce un processo in cui vengono eseguite tutte le prove Bernoulliane necessarie per ottenere risultati positivi. Inoltre, tutti questi studi di Bernoulli sono indipendenti e hanno una probabilità di successo costante.
Ad esempio, una variabile casuale che segue una distribuzione binomiale negativa è il numero di volte in cui è necessario lanciare un dado finché non viene lanciato tre volte il numero 6.
distribuzione ipergeometrica
La distribuzione ipergeometrica è una distribuzione di probabilità che descrive il numero di casi di successo in un’estrazione casuale senza sostituzione di n elementi da una popolazione.
Cioè, la distribuzione ipergeometrica viene utilizzata per calcolare la probabilità di ottenere x successi estraendo n elementi da una popolazione senza sostituirne nessuno.
Pertanto, la distribuzione ipergeometrica ha tre parametri:
- N : è il numero di elementi della popolazione (N = 0, 1, 2,…).
- K : è il numero massimo di casi di successo (K = 0, 1, 2,…,N). Poiché in una distribuzione ipergeometrica un elemento può essere considerato solo un “successo” o un “fallimento”, NK è il numero massimo di casi di fallimento.
- n : è il numero di recuperi senza sostituzione eseguiti.
Distribuzioni di probabilità continue
Una distribuzione di probabilità continua è quella che può assumere qualsiasi valore in un intervallo, compresi i valori decimali. Pertanto, una distribuzione di probabilità continua definisce le probabilità di una variabile casuale continua.
distribuzione uniforme e continua
La distribuzione uniforme continua , detta anche distribuzione rettangolare , è un tipo di distribuzione di probabilità continua in cui tutti i valori hanno la stessa probabilità di apparire. In altre parole, la distribuzione uniforme continua è una distribuzione in cui la probabilità è distribuita uniformemente su un intervallo.
La distribuzione uniforme continua viene utilizzata per descrivere variabili continue che hanno probabilità costante. Allo stesso modo, la distribuzione uniforme continua viene utilizzata per definire i processi casuali, perché se tutti i risultati hanno la stessa probabilità, significa che c’è casualità nel risultato.
La distribuzione uniforme continua ha due parametri caratteristici, aeb , che definiscono l’intervallo di equiprobabilità. Pertanto, il simbolo della distribuzione uniforme continua è U(a,b) , dove a e b sono i valori caratteristici della distribuzione.
Ad esempio, se il risultato di un esperimento casuale può assumere qualsiasi valore compreso tra 5 e 9 e tutti i possibili risultati hanno la stessa probabilità di verificarsi, l’esperimento può essere simulato con una distribuzione uniforme continua U(5.9).
Distribuzione normale
La distribuzione normale è una distribuzione di probabilità continua il cui grafico è a campana e simmetrico rispetto alla sua media. In statistica, la distribuzione normale viene utilizzata per modellare fenomeni con caratteristiche molto diverse, motivo per cui questa distribuzione è così importante.
Infatti, in statistica, la distribuzione normale è considerata di gran lunga la più importante tra tutte le distribuzioni di probabilità, perché non solo può modellare un gran numero di fenomeni del mondo reale, ma può anche essere utilizzata per approssimare altri tipi di fenomeni. distribuzioni. a determinate condizioni.
Il simbolo della distribuzione normale è la lettera maiuscola N. Quindi, per indicare che una variabile segue una distribuzione normale, si indica con la lettera N e si aggiungono tra parentesi i valori della sua media aritmetica e della deviazione standard.
La distribuzione normale ha molti nomi diversi, tra cui distribuzione gaussiana , distribuzione gaussiana e distribuzione di Laplace-Gauss .
Distribuzione lognormale
La distribuzione lognormale , o distribuzione lognormale , è una distribuzione di probabilità che definisce una variabile casuale il cui logaritmo segue una distribuzione normale.
Pertanto, se la variabile X ha una distribuzione normale, allora la funzione esponenziale e x ha una distribuzione lognormale.
Si noti che la distribuzione lognormale può essere utilizzata solo quando i valori della variabile sono positivi, poiché il logaritmo è una funzione che accetta solo un argomento positivo.
Tra le diverse applicazioni della distribuzione lognormale in statistica, distinguiamo l’utilizzo di questa distribuzione per analizzare investimenti finanziari ed effettuare analisi di affidabilità.
La distribuzione lognormale è conosciuta anche come distribuzione Tinaut , a volte scritta anche come distribuzione lognormale o distribuzione lognormale .
Distribuzione chi-quadrato
La distribuzione Chi-quadrato è una distribuzione di probabilità il cui simbolo è χ². Più precisamente, la distribuzione Chi-quadrato è la somma dei quadrati di k variabili casuali indipendenti con distribuzione normale.
Pertanto, la distribuzione Chi-quadrato ha k gradi di libertà. Pertanto, una distribuzione Chi-quadrato ha tanti gradi di libertà quanti sono la somma dei quadrati delle variabili normalmente distribuite che rappresenta.
La distribuzione Chi-quadrato è anche conosciuta come distribuzione Pearson .
La distribuzione chi-quadrato è ampiamente utilizzata nell’inferenza statistica, ad esempio nei test di ipotesi e negli intervalli di confidenza. Vedremo di seguito quali sono le applicazioni di questo tipo di distribuzione di probabilità.
Distribuzione t di Student
La distribuzione t di Student è una distribuzione di probabilità ampiamente utilizzata in statistica. Nello specifico, la distribuzione t di Student viene utilizzata nel test t di Student per determinare la differenza tra le medie di due campioni e per stabilire intervalli di confidenza.
La distribuzione t di Student fu sviluppata dallo statistico William Sealy Gosset nel 1908 con lo pseudonimo di “Student”.
La distribuzione t di Student è definita dal numero di gradi di libertà, ottenuti sottraendo un’unità dal numero totale di osservazioni. Pertanto, la formula per determinare i gradi di libertà della distribuzione t di Student è ν=n-1 .
Distribuzione Snedecor F
La distribuzione F di Snedecor , chiamata anche distribuzione F di Fisher-Snedecor o semplicemente distribuzione F , è una distribuzione di probabilità continua utilizzata nell’inferenza statistica, in particolare nell’analisi della varianza.
Una delle proprietà della distribuzione Snedecor F è che è definita dal valore di due parametri reali, m e n , che ne indicano i gradi di libertà. Pertanto, il simbolo della distribuzione Snedecor F è F m,n , dove m e n sono i parametri che definiscono la distribuzione.
La distribuzione F Fisher-Snedecor deve il suo nome allo statistico inglese Ronald Fisher e allo statistico americano George Snedecor.
Nelle statistiche, la distribuzione F Fisher-Snedecor ha diverse applicazioni. Ad esempio, la distribuzione F Fisher-Snedecor viene utilizzata per confrontare diversi modelli di regressione lineare e questa distribuzione di probabilità viene utilizzata nell’analisi della varianza (ANOVA).
distribuzione esponenziale
La distribuzione esponenziale è una distribuzione di probabilità continua utilizzata per modellare il tempo di attesa per il verificarsi di un fenomeno casuale.
Più precisamente, la distribuzione esponenziale permette di descrivere il tempo di attesa tra due fenomeni che segue una distribuzione di Poisson. Pertanto, la distribuzione esponenziale è strettamente correlata alla distribuzione di Poisson.
La distribuzione esponenziale ha un parametro caratteristico, rappresentato dalla lettera greca λ e indica il numero di volte in cui si prevede che l’evento studiato si verifichi in un dato periodo di tempo.
Allo stesso modo, la distribuzione esponenziale viene utilizzata anche per modellare il tempo fino al verificarsi di un guasto. La distribuzione esponenziale ha quindi diverse applicazioni nella teoria dell’affidabilità e della sopravvivenza.
Distribuzione beta
La distribuzione beta è una distribuzione di probabilità definita nell’intervallo (0,1) e parametrizzata da due parametri positivi: α e β. In altre parole, i valori della distribuzione beta dipendono dai parametri α e β.
Pertanto, la distribuzione beta viene utilizzata per definire variabili casuali continue il cui valore è compreso tra 0 e 1.
Esistono diverse notazioni per indicare che una variabile casuale continua è governata da una distribuzione beta, le più comuni sono:
Nelle statistiche, la distribuzione beta ha applicazioni molto diverse. Ad esempio, la distribuzione beta viene utilizzata per studiare le variazioni percentuali in diversi campioni. Allo stesso modo, nella gestione dei progetti, la distribuzione beta viene utilizzata per eseguire l’analisi Pert.
Distribuzione gamma
La distribuzione gamma è una distribuzione di probabilità continua definita da due parametri caratteristici, α e λ. In altre parole, la distribuzione gamma dipende dal valore dei suoi due parametri: α è il parametro di forma e λ è il parametro di scala.
Il simbolo della distribuzione gamma è la lettera greca maiuscola Γ. Quindi, se una variabile casuale segue una distribuzione gamma, si scrive come segue:
La distribuzione gamma può anche essere parametrizzata utilizzando il parametro di forma k = α e il parametro di scala inversa θ = 1/λ. In tutti i casi, i due parametri che definiscono la distribuzione gamma sono numeri reali positivi.
In genere, la distribuzione gamma viene utilizzata per modellare set di dati inclinati a destra, in modo che vi sia una maggiore concentrazione di dati sul lato sinistro del grafico. Ad esempio, la distribuzione gamma viene utilizzata per modellare l’affidabilità dei componenti elettrici.
Distribuzione di Weibull
La distribuzione di Weibull è una distribuzione di probabilità continua definita da due parametri caratteristici: il parametro di forma α e il parametro di scala λ.
Nelle statistiche, la distribuzione di Weibull viene utilizzata principalmente per l’analisi della sopravvivenza. Allo stesso modo, la distribuzione Weibull ha molte applicazioni in diversi campi.
Secondo gli autori la distribuzione di Weibull può essere parametrizzata anche con tre parametri. Successivamente viene aggiunto un terzo parametro chiamato valore di soglia, che indica l’ascissa in cui inizia il grafico della distribuzione.
La distribuzione di Weibull prende il nome dallo svedese Waloddi Weibull, che la descrisse dettagliatamente nel 1951. Tuttavia, la distribuzione di Weibull fu scoperta da Maurice Fréchet nel 1927 e applicata per la prima volta da Rosin e Rammler nel 1933.
Distribuzione di Pareto
La distribuzione di Pareto è una distribuzione di probabilità continua utilizzata in statistica per modellare il principio di Pareto. Pertanto, la distribuzione di Pareto è una distribuzione di probabilità che ha pochi valori la cui probabilità di accadimento è molto più alta rispetto al resto dei valori.
Ricordiamo che la legge di Pareto, detta anche regola 80-20, è un principio statistico secondo il quale la maggior parte della causa di un fenomeno è dovuta ad una piccola parte della popolazione.
La distribuzione di Pareto ha due parametri caratteristici: il parametro di scala x m e il parametro di forma α.
In origine, la distribuzione di Pareto veniva utilizzata per descrivere la distribuzione della ricchezza all’interno della popolazione, poiché la maggior parte di essa era dovuta ad una piccola percentuale della popolazione. Ma attualmente la distribuzione di Pareto ha molteplici applicazioni, ad esempio nel controllo della qualità, in economia, nella scienza, in campo sociale, ecc.