Distribuição de probabilidade contínua
Este artigo explica o que são distribuições de probabilidade contínuas e para que são usadas nas estatísticas. Assim você descobrirá o que significa uma distribuição de probabilidade ser contínua, exemplos de distribuições contínuas e quais são os diferentes tipos de distribuições contínuas.
O que é uma distribuição de probabilidade contínua?
Uma distribuição de probabilidade contínua é aquela cuja função de distribuição é contínua. Portanto, uma distribuição de probabilidade contínua define as probabilidades de uma variável aleatória contínua .
Por exemplo, a distribuição normal e a distribuição t de Student são distribuições de probabilidade contínuas.
Uma das características das distribuições de probabilidade contínuas é que elas podem assumir qualquer valor dentro de um intervalo. Assim, diferentemente das distribuições de probabilidade discretas, as distribuições de probabilidade contínuas podem assumir valores decimais.
Nas distribuições contínuas, para calcular uma probabilidade cumulativa, deve-se encontrar a área sob a curva da distribuição, portanto neste tipo de distribuições de probabilidade, a função de probabilidade cumulativa é equivalente à integral da função densidade .
Exemplos de distribuições de probabilidade contínua
Depois de vermos a definição de distribuição de probabilidade contínua, veremos vários exemplos deste tipo de distribuição para melhor compreender o conceito.
Exemplos de distribuições de probabilidade contínuas:
- O peso dos alunos em um curso.
- A vida útil de um componente elétrico.
- A rentabilidade das ações das empresas listadas em bolsa.
- A velocidade de um carro.
- O preço de certas ações.
Tipos de distribuições de probabilidade contínuas
Os principais tipos de distribuições de probabilidade contínuas são:
- Distribuição uniforme e contínua
- Distribuição normal
- Distribuição lognormal
- Distribuição qui-quadrado
- Distribuição t de estudante
- Snedecor F Distribuição
- Distribuição exponencial
- Distribuição Beta
- Distribuição gama
- Distribuição Weibull
- Distribuição de Pareto
Cada tipo de distribuição de probabilidade contínua é explicado em detalhes abaixo.
Distribuição uniforme e contínua
A distribuição uniforme contínua , também chamada de distribuição retangular , é um tipo de distribuição de probabilidade contínua em que todos os valores têm a mesma probabilidade de aparecer. Em outras palavras, a distribuição uniforme contínua é uma distribuição em que a probabilidade é distribuída uniformemente ao longo de um intervalo.
A distribuição uniforme contínua é usada para descrever variáveis contínuas que têm probabilidade constante. Da mesma forma, a distribuição uniforme contínua é usada para definir processos aleatórios, porque se todos os resultados tiverem a mesma probabilidade, significa que há aleatoriedade no resultado.
A distribuição uniforme contínua possui dois parâmetros característicos, aeb , que definem o intervalo de equiprobabilidade. Assim, o símbolo para a distribuição uniforme contínua é U(a,b) , onde a e b são os valores característicos da distribuição.
Por exemplo, se o resultado de um experimento aleatório pode assumir qualquer valor entre 5 e 9 e todos os resultados possíveis têm a mesma probabilidade de ocorrer, o experimento pode ser simulado com uma distribuição uniforme contínua U(5.9).
Distribuição normal
A distribuição normal é uma distribuição de probabilidade contínua cujo gráfico tem forma de sino e é simétrico em relação à sua média. Nas estatísticas, a distribuição normal é utilizada para modelar fenômenos com características muito diferentes, por isso essa distribuição é tão importante.
Na verdade, em estatística, a distribuição normal é considerada de longe a distribuição mais importante de todas as distribuições de probabilidade, porque não só pode modelar um grande número de fenómenos do mundo real, mas a distribuição normal também pode ser usada para aproximar outros tipos de fenómenos. distribuições. sob certas condições.
O símbolo da distribuição normal é a letra N maiúscula. Assim, para indicar que uma variável segue uma distribuição normal, ela é indicada pela letra N e os valores de sua média aritmética e desvio padrão são somados entre parênteses.
A distribuição normal tem muitos nomes diferentes, incluindo distribuição Gaussiana , distribuição Gaussiana e distribuição Laplace-Gauss .
Distribuição lognormal
A distribuição lognormal , ou distribuição lognormal , é uma distribuição de probabilidade que define uma variável aleatória cujo logaritmo segue uma distribuição normal.
Portanto, se a variável X tem distribuição normal, então a função exponencial e x tem distribuição lognormal.
Observe que a distribuição lognormal só pode ser utilizada quando os valores da variável são positivos, pois o logaritmo é uma função que aceita apenas um argumento positivo.
Entre as diferentes aplicações da distribuição lognormal em estatística, destacamos a utilização desta distribuição para analisar investimentos financeiros e realizar análises de confiabilidade.
A distribuição lognormal também é conhecida como distribuição Tinaut , às vezes também escrita como distribuição lognormal ou distribuição log-normal .
Distribuição qui-quadrado
A distribuição Qui-quadrado é uma distribuição de probabilidade cujo símbolo é χ². Mais precisamente, a distribuição qui-quadrado é a soma do quadrado de k variáveis aleatórias independentes com distribuição normal.
Assim, a distribuição Qui-quadrado possui k graus de liberdade. Portanto, uma distribuição Qui-quadrado tem tantos graus de liberdade quanto a soma dos quadrados das variáveis normalmente distribuídas que ela representa.
A distribuição qui-quadrado também é conhecida como distribuição de Pearson .
A distribuição qui-quadrado é amplamente utilizada em inferência estatística, por exemplo, em testes de hipóteses e intervalos de confiança. Veremos a seguir quais são as aplicações desse tipo de distribuição de probabilidade.
Distribuição t de estudante
A distribuição t de Student é uma distribuição de probabilidade amplamente utilizada em estatística. Especificamente, a distribuição t de Student é utilizada no teste t de Student para determinar a diferença entre as médias de duas amostras e estabelecer intervalos de confiança.
A distribuição t de Student foi desenvolvida pelo estatístico William Sealy Gosset em 1908 sob o pseudônimo de “Student”.
A distribuição t de Student é definida pelo seu número de graus de liberdade, obtido subtraindo uma unidade do número total de observações. Portanto, a fórmula para determinar os graus de liberdade de uma distribuição t de Student é ν=n-1 .
Snedecor F Distribuição
A distribuição F de Snedecor , também chamada de distribuição F de Fisher-Snedecor ou simplesmente distribuição F , é uma distribuição de probabilidade contínua usada em inferência estatística, particularmente em análise de variância.
Uma das propriedades da distribuição Snedecor F é que ela é definida pelo valor de dois parâmetros reais, m e n , que indicam seus graus de liberdade. Assim, o símbolo para a distribuição Snedecor F é F m,n , onde m e n são os parâmetros que definem a distribuição.
A distribuição Fisher-Snedecor F deve seu nome ao estatístico inglês Ronald Fisher e ao estatístico americano George Snedecor.
Em estatística, a distribuição Fisher-Snedecor F tem diferentes aplicações. Por exemplo, a distribuição Fisher-Snedecor F é usada para comparar diferentes modelos de regressão linear, e esta distribuição de probabilidade é usada na análise de variância (ANOVA).
Distribuição exponencial
A distribuição exponencial é uma distribuição de probabilidade contínua usada para modelar o tempo de espera para a ocorrência de um fenômeno aleatório.
Mais precisamente, a distribuição exponencial permite descrever o tempo de espera entre dois fenómenos que segue uma distribuição de Poisson. Portanto, a distribuição exponencial está intimamente relacionada com a distribuição de Poisson.
A distribuição exponencial possui um parâmetro característico, representado pela letra grega λ e indica o número de vezes que se espera que o evento estudado ocorra durante um determinado período de tempo.
Da mesma forma, a distribuição exponencial também é usada para modelar o tempo até que ocorra uma falha. A distribuição exponencial, portanto, tem diversas aplicações na teoria da confiabilidade e da sobrevivência.
Distribuição Beta
A distribuição beta é uma distribuição de probabilidade definida no intervalo (0,1) e parametrizada por dois parâmetros positivos: α e β. Em outras palavras, os valores da distribuição beta dependem dos parâmetros α e β.
Portanto, a distribuição beta é utilizada para definir variáveis aleatórias contínuas cujo valor está entre 0 e 1.
Existem diversas notações para indicar que uma variável aleatória contínua é governada por uma distribuição beta, as mais comuns são:
Nas estatísticas, a distribuição beta tem aplicações muito variadas. Por exemplo, a distribuição beta é usada para estudar variações de porcentagens em diferentes amostras. Da mesma forma, no gerenciamento de projetos, a distribuição beta é usada para realizar análises Pert.
Distribuição gama
A distribuição gama é uma distribuição de probabilidade contínua definida por dois parâmetros característicos, α e λ. Em outras palavras, a distribuição gama depende do valor de seus dois parâmetros: α é o parâmetro de forma e λ é o parâmetro de escala.
O símbolo da distribuição gama é a letra grega maiúscula Γ. Portanto, se uma variável aleatória segue uma distribuição gama, ela é escrita da seguinte forma:
A distribuição gama também pode ser parametrizada usando o parâmetro de forma k = α e o parâmetro de escala inversa θ = 1/λ. Em todos os casos, os dois parâmetros que definem a distribuição gama são números reais positivos.
Normalmente, a distribuição gama é usada para modelar conjuntos de dados distorcidos à direita, de modo que haja uma maior concentração de dados no lado esquerdo do gráfico. Por exemplo, a distribuição gama é usada para modelar a confiabilidade de componentes elétricos.
Distribuição Weibull
A distribuição Weibull é uma distribuição de probabilidade contínua definida por dois parâmetros característicos: o parâmetro de forma α e o parâmetro de escala λ.
Nas estatísticas, a distribuição Weibull é usada principalmente para análise de sobrevivência. Da mesma forma, a distribuição Weibull tem muitas aplicações em diferentes campos.
Segundo os autores, a distribuição Weibull também pode ser parametrizada com três parâmetros. Em seguida, é adicionado um terceiro parâmetro denominado valor limite, que indica a abcissa na qual o gráfico de distribuição começa.
A distribuição Weibull recebeu o nome do sueco Waloddi Weibull, que a descreveu detalhadamente em 1951. No entanto, a distribuição Weibull foi descoberta por Maurice Fréchet em 1927 e aplicada pela primeira vez por Rosin e Rammler em 1933.
Distribuição de Pareto
A distribuição de Pareto é uma distribuição de probabilidade contínua usada em estatística para modelar o princípio de Pareto. Portanto, a distribuição de Pareto é uma distribuição de probabilidade que possui alguns valores cuja probabilidade de ocorrência é muito maior que o restante dos valores.
Lembre-se que a lei de Pareto, também chamada de regra 80-20, é um princípio estatístico que diz que a maior parte da causa de um fenômeno se deve a uma pequena parte da população.
A distribuição de Pareto possui dois parâmetros característicos: o parâmetro de escala x m e o parâmetro de forma α.
Originalmente, a distribuição de Pareto era usada para descrever a distribuição da riqueza dentro da população, porque a maior parte dela se devia a uma pequena proporção da população. Mas actualmente a distribuição de Pareto tem muitas aplicações, por exemplo no controlo de qualidade, na economia, na ciência, no campo social, etc.
Distribuição de probabilidade contínua e discreta
As distribuições de probabilidade podem ser classificadas em distribuições contínuas e distribuições discretas. Então, por fim, veremos qual é a diferença entre esses dois tipos de distribuições de probabilidade.
A diferença entre distribuições de probabilidade contínuas e distribuições de probabilidade discretas é o número de valores que elas podem assumir. As distribuições contínuas podem assumir um número infinito de valores em um intervalo, enquanto as distribuições discretas podem assumir apenas um número contável de valores em um intervalo.
Portanto, em geral, uma forma de diferenciar distribuições contínuas de distribuições discretas é pelo tipo de números que elas podem assumir. Normalmente, uma distribuição contínua pode assumir qualquer valor, incluindo números decimais, enquanto distribuições discretas só podem assumir números inteiros.