Cdf ou pdf: qual a diferença?


Este tutorial fornece uma explicação simples da diferença entre um PDF (função de densidade de probabilidade) e um CDF (função de distribuição cumulativa) em estatísticas.

Variáveis aleatórias

Antes de podermos definir um PDF ou CDF, primeiro precisamos entender as variáveis aleatórias.

Uma variável aleatória , geralmente denotada por X, é uma variável cujos valores são os resultados numéricos de um processo aleatório. Existem dois tipos de variáveis aleatórias: discretas e contínuas.

Variáveis aleatórias discretas

Uma variável aleatória discreta é uma variável que só pode assumir um número contável de valores distintos como 0, 1, 2, 3, 4, 5… 100, 1 milhão, etc. Aqui estão alguns exemplos de variáveis aleatórias discretas:

  • O número de vezes que uma moeda dá coroa depois de ser lançada 20 vezes.
  • O número de vezes que um dado cai no número 4 depois de ser lançado 100 vezes.

Variáveis aleatórias contínuas

Uma variável aleatória contínua é uma variável que pode assumir um número infinito de valores possíveis. Aqui estão alguns exemplos de variáveis aleatórias contínuas:

  • Altura de uma pessoa
  • Peso de um animal
  • Tempo necessário para caminhar uma milha

Por exemplo, a altura de uma pessoa pode ser 60,2 polegadas, 65,2344 polegadas, 70,431222 polegadas, etc. Há uma quantidade infinita de valores possíveis para tamanho.

Regra geral: se você pode contar o número de resultados, então você está trabalhando com uma variável aleatória discreta (por exemplo, contando o número de vezes que uma moeda dá cara). Mas se você puder medir o resultado, estará trabalhando com uma variável aleatória contínua (por exemplo, medida, altura, peso, tempo, etc.)

Funções de densidade de probabilidade

Uma função de densidade de probabilidade (pdf) nos diz a probabilidade de uma variável aleatória assumir um determinado valor.

Por exemplo, suponha que lançamos um dado uma vez. Se deixarmos x denotar o número em que os dados caem, então a função de densidade de probabilidade para o resultado pode ser descrita da seguinte forma:

P(x < 1) : 0

P(x = 1) : 1/6

P(x = 2) : 1/6

P(x = 3) : 1/6

P(x = 4) : 1/6

P(x = 5) : 1/6

P(x = 6) : 1/6

P(x > 6) : 0

Observe que este é um exemplo de variável aleatória discreta, pois x só pode assumir valores inteiros.

Para uma variável aleatória contínua, não podemos usar uma PDF diretamente, pois a probabilidade de x assumir um valor exato é zero.

Por exemplo, suponha que queiramos saber a probabilidade de um hambúrguer de um determinado restaurante pesar um quarto de libra (0,25 libras). Como o peso é uma variável contínua, pode assumir um número infinito de valores.

Por exemplo, um determinado hambúrguer pode pesar, na verdade, 0,250001 libras, ou 0,24 libras, ou 0,2488 libras. A probabilidade de um determinado hambúrguer pesar exatamente 0,25 libras é essencialmente zero.

Funções de distribuição cumulativa

Uma função de distribuição cumulativa (cdf) nos diz a probabilidade de uma variável aleatória assumir um valor menor ou igual a x .

Por exemplo, suponha que lançamos um dado uma vez. Se deixarmos x denotar o número em que os dados caem, então a função de distribuição cumulativa do resultado pode ser descrita da seguinte forma:

P(x ≤ 0) : 0

P(x ≤ 1) : 1/6

P(x ≤ 2) : 2/6

P(x ≤ 3) : 3/6

P(x ≤ 4) : 4/6

P(x ≤ 5) : 5/6

P(x ≤ 6) : 6/6

P(x > 6) : 0

Observe que a probabilidade de x ser menor ou igual a 6 é 6/6, que é igual a 1. Isso ocorre porque os dados cairão em 1, 2, 3, 4, 5 ou 6 com 100% de probabilidade.

Este exemplo usa uma variável aleatória discreta, mas uma função de densidade contínua também pode ser usada para uma variável aleatória contínua.

As funções de distribuição cumulativa têm as seguintes propriedades:

  • A probabilidade de uma variável aleatória assumir um valor menor que o menor valor possível é zero. Por exemplo, a probabilidade de um dado cair em um valor menor que 1 é zero.
  • A probabilidade de uma variável aleatória assumir um valor menor ou igual ao maior valor possível é um. Por exemplo, a probabilidade de um dado cair no valor 1, 2, 3, 4, 5 ou 6 é um. Deve pousar em um desses números.
  • O cdf é sempre não decrescente. Isto é, a probabilidade de um dado cair num número menor ou igual a 1 é 1/6, a probabilidade de um dado cair num número menor ou igual a 2 é 2/6, a probabilidade de cair num número menor ou igual a 2 é 2/6, a probabilidade de cair num número menor ou igual a 2 é 2/6. número menor ou igual a 3 é 3/6, etc. As probabilidades cumulativas são sempre não decrescentes.

Relacionado: Você pode usar um gráfico ogiva para visualizar uma função de distribuição cumulativa.

A relação entre um CDF e um PDF

Em termos técnicos, uma função de densidade de probabilidade (pdf) é a derivada de uma função de distribuição cumulativa (cdf).

Além disso, a área sob a curva de uma pdf entre o infinito negativo e x é igual ao valor de x na cdf.

Para uma explicação completa da relação entre um pdf e um cdf, bem como a prova de por que o pdf é a derivada do cdf, consulte um livro de estatística.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *