Teorema do limite central: definição + exemplos


O teorema do limite central afirma que a distribuição amostral de uma média amostral é aproximadamente normal se o tamanho da amostra for grande o suficiente, mesmo que a distribuição populacional não seja normal .

O teorema do limite central também afirma que a distribuição amostral terá as seguintes propriedades:

1. A média da distribuição amostral será igual à média da distribuição populacional:

x = µ

2. A variância da distribuição amostral será igual à variância da distribuição populacional dividida pelo tamanho da amostra:

s2 = σ2 /n

Exemplos do Teorema do Limite Central

Aqui estão alguns exemplos para ilustrar o teorema do limite central na prática.

Distribuição uniforme

Suponha que a largura do casco de uma tartaruga siga uma distribuição uniforme com largura mínima de 2 polegadas e largura máxima de 6 polegadas. Ou seja, se selecionarmos uma tartaruga aleatoriamente e medirmos a largura de seu casco, é provável que ela também tenha entre 5 e 15 centímetros de largura .

Se fizéssemos um histograma para representar a distribuição das larguras dos cascos das tartarugas, ficaria assim:

Exemplo de distribuição uniforme do teorema do limite central
A média de uma distribuição uniforme é μ = (b+a) / 2 onde b é o maior valor possível e a é o menor valor possível. Neste caso é (6+2)/2 = 4.

A variância de uma distribuição uniforme é σ2 = (ba) 2/12 . Neste caso é (6-2) 2/12 = 1,33

Tirando amostras aleatórias de 2 da distribuição uniforme

Agora imagine que pegamos uma amostra aleatória de 2 tartarugas dessa população e medimos a largura do casco de cada tartaruga. Vamos supor que o casco da primeira tartaruga tenha 7 centímetros de largura e o da segunda 15 centímetros de largura. A largura média desta amostra de 2 tartarugas é de 4,5 polegadas.

A seguir, imagine que pegamos outra amostra aleatória de 2 tartarugas dessa população e medimos novamente a largura do casco de cada tartaruga. Vamos supor que o casco da primeira tartaruga tenha 2,5 polegadas de largura e a segunda também tenha 2,5 polegadas de largura. A largura média desta amostra de 2 tartarugas é de 2,5 polegadas.

Imagine que continuamos coletando amostras aleatórias de 2 tartarugas repetidamente e continuamos encontrando a largura média do casco a cada vez.

Se fizéssemos um histograma para representar a largura média do casco de todas essas amostras de 2 tartarugas, ficaria assim:

Teorema do limite central para tamanho de amostra 2 para distribuição uniforme
Isso é chamado de distribuição amostral para as médias amostrais porque mostra a distribuição das médias amostrais.

A média desta distribuição amostral é x = μ = 4

A variância desta distribuição amostral é s2 = σ2 / n = 1,33 / 2 = 0,665

Tirando amostras aleatórias de 5 da distribuição uniforme

Agora imagine que repetimos a mesma experiência, mas desta vez recolhemos amostras aleatórias de 5 tartarugas repetidamente e calculamos a largura média da carapaça de cada vez.

Se fizéssemos um histograma para representar a largura média do casco de todas essas amostras de 5 tartarugas, ficaria assim:

Teorema do limite central para distribuição uniforme do tamanho da amostra 5
Observe que esta distribuição tem um formato mais de “sino” que se assemelha à distribuição normal . Isso ocorre porque quando tomamos amostras de 5, a variância entre nossas médias amostrais é muito menor, então temos menos probabilidade de obter amostras com uma média próxima de 2 polegadas ou 6 polegadas e mais probabilidade de obter amostras com média próxima de 2 polegadas ou 6 polegadas. 6 polegadas. a média está mais próxima da média real da população em 10 centímetros.

A média desta distribuição amostral é x = μ = 4

A variância desta distribuição amostral é s2 = σ2 / n = 1,33 / 5 = 0,266

Tirando amostras aleatórias de 30 da distribuição uniforme

Agora imagine que repetimos a mesma experiência, mas desta vez recolhemos amostras aleatórias de 30 tartarugas repetidamente e calculamos a largura média da carapaça de cada vez.

Se fizéssemos um histograma para representar a largura média do casco de todas essas amostras de 30 tartarugas, ficaria assim:

Teorema do limite central para um tamanho de amostra de 30
Observe que esta distribuição amostral é ainda mais em forma de sino e muito mais estreita do que as duas distribuições anteriores.

A média desta distribuição amostral é x = μ = 4

A variância desta distribuição amostral é s2 = σ2 / n = 1,33 / 30 = 0,044

A distribuição qui-quadrado

Suponha que o número de animais de estimação por família em uma determinada cidade siga uma distribuição qui-quadrado com três graus de liberdade. Se fizéssemos um histograma para representar a distribuição dos animais por família, ficaria assim:

Teorema do limite central para a distribuição qui-quadrado

A média de uma distribuição qui-quadrado é simplesmente o número de graus de liberdade (gl). Neste caso, μ = 3 .

A variância de uma distribuição qui-quadrado é 2 * df. Neste caso, σ2 = 2 * 3 = 6 .

Tomando amostras aleatórias de 2

Imagine que pegamos uma amostra aleatória de 2 famílias dessa população e contamos o número de animais de estimação em cada família. Suponha que a primeira família tenha 4 animais de estimação e a segunda família tenha 1 animal de estimação. O número médio de animais de estimação para esta amostra de 2 famílias é 2,5.

Então imagine que pegamos outra amostra aleatória de 2 famílias dessa população e contamos novamente o número de animais de estimação em cada família. Suponha que a primeira família tenha 6 animais de estimação e a segunda família tenha 4 animais de estimação. O número médio de animais de estimação para esta amostra de 2 famílias é 5.

Imagine que continuamos coletando amostras aleatórias de 2 famílias repetidamente e sempre encontrando o número médio de animais de estimação.

Se fizéssemos um histograma para representar o número médio de animais de estimação de todas essas amostras de 2 famílias, ficaria assim:

Teorema do limite central com um tamanho de amostra de distribuição qui-quadrado de 2

A média desta distribuição amostral é x = μ = 3

A variância desta distribuição amostral é s 2 = σ 2 / n = 6/2 = 3

Tomando amostras aleatórias de 10

Agora imagine que repetimos a mesma experiência, mas desta vez recolhemos amostras aleatórias de 10 famílias repetidamente e de cada vez encontramos o número médio de animais por família.

Se fizéssemos um histograma para representar o número médio de animais por família em todas essas amostras de 10 famílias, ficaria assim:

Teorema do limite central com distribuição qui-quadrado

A média desta distribuição amostral é x = μ = 3

A variância desta distribuição amostral é s2 = σ2 / n = 6/10 = 0,6

Tomando amostras aleatórias de 30

Agora imagine que repetimos a mesma experiência, mas desta vez recolhemos amostras aleatórias de 30 famílias repetidas vezes e de cada vez encontramos o número médio de animais por família.

Se fizéssemos um histograma para representar o número médio de animais por família em todas estas amostras de 30 famílias, ficaria assim:

Histograma do teorema do limite central com distribuição qui-quadrado

A média desta distribuição amostral é x = μ = 3

A variância desta distribuição amostral é s2 = σ2 / n = 6/30 = 0,2

Resumo

Aqui estão as principais conclusões desses dois exemplos:

  • A distribuição amostral de uma média amostral é aproximadamente normal se o tamanho da amostra for grande o suficiente, mesmo que a distribuição da população não seja normal . Nos dois exemplos acima, nem a distribuição uniforme nem a distribuição qui-quadrado eram normais (elas não tinham formato de “sino”), mas quando pegamos uma amostra grande o suficiente, a distribuição da média amostral se transformou em parece Seja normal.
  • Quanto maior o tamanho da amostra, menor será a variância da média amostral.

Defina “grande o suficiente”

Lembre-se de que o teorema do limite central afirma que a distribuição amostral de uma média amostral é aproximadamente normal se o tamanho da amostra for “grande o suficiente” , mesmo que a distribuição da população não seja normal.

Não há uma definição exata de quão grande uma amostra deve ser para que o teorema do limite central seja aplicado, mas em geral depende da assimetria da distribuição da população de onde a amostra vem:

  • Se a distribuição da população for simétrica, um tamanho de amostra tão pequeno quanto 15 é por vezes suficiente.
  • Se a distribuição da população for distorcida, normalmente é necessária uma amostra de pelo menos 30 pessoas.
  • Se a distribuição da população for extremamente distorcida, poderá ser necessária uma amostra de 40 ou mais pessoas.

Confira este tutorial sobre Condicionamento de uma amostra grande para obter mais informações sobre este tópico.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *