Como realizar análise univariada em r (com exemplos)
O termo análise univariada refere-se à análise de uma variável. Você pode se lembrar disso porque o prefixo “uni” significa “um”.
Existem três maneiras comuns de realizar análise univariada em uma variável:
1. Estatísticas resumidas – Mede o centro e a distribuição dos valores.
2. Tabela de Frequência – Descreve com que frequência aparecem valores diferentes.
3. Gráficos – Utilizados para visualizar a distribuição de valores.
Este tutorial fornece um exemplo de como realizar análise univariada para a seguinte variável:
#create variable with 15 values
x <- c(1, 1, 2, 3.5, 4, 4, 4, 5, 5, 6.5, 7, 7.4, 8, 13, 14.2)
Estatísticas resumidas
Podemos usar a seguinte sintaxe para calcular várias estatísticas resumidas para nossa variável:
#find means mean(x) [1] 5.706667 #find median median(x) [1] 5 #find range max(x) - min(x) [1] 13.2 #find interquartile range (spread of middle 50% of values) IQR(x) [1] 3.45 #find standard deviation sd(x) [1] 3.858287
Tabela de frequência
Podemos usar a seguinte sintaxe para produzir uma tabela de frequência para nossa variável:
#produce frequency table
table(s)
1 2 3.5 4 5 6.5 7 7.4 8 13 14.2
2 1 1 3 2 1 1 1 1 1 1
Isso nos diz que:
- O valor 1 aparece duas vezes
- O valor 2 aparece 1 vez
- O valor 3,5 aparece 1 vez
E assim por diante.
Gráficos
Podemos produzir um boxplot usando a seguinte sintaxe:
#produce boxplot
boxplot(x)
Podemos produzir um histograma usando a seguinte sintaxe:
#produce histogram
hist(x)
Podemos produzir uma curva de densidade usando a seguinte sintaxe:
#produce density curve
plot(density(x))
Cada um desses gráficos nos dá uma maneira única de visualizar a distribuição dos valores da nossa variável.
Você pode encontrar mais tutoriais de R nesta página .