Como realizar análise univariada em r (com exemplos)


O termo análise univariada refere-se à análise de uma variável. Você pode se lembrar disso porque o prefixo “uni” significa “um”.

Existem três maneiras comuns de realizar análise univariada em uma variável:

1. Estatísticas resumidas – Mede o centro e a distribuição dos valores.

2. Tabela de Frequência – Descreve com que frequência aparecem valores diferentes.

3. Gráficos – Utilizados para visualizar a distribuição de valores.

Este tutorial fornece um exemplo de como realizar análise univariada para a seguinte variável:

 #create variable with 15 values
x <- c(1, 1, 2, 3.5, 4, 4, 4, 5, 5, 6.5, 7, 7.4, 8, 13, 14.2)

Estatísticas resumidas

Podemos usar a seguinte sintaxe para calcular várias estatísticas resumidas para nossa variável:

 #find means
mean(x)
[1] 5.706667

#find median
median(x)

[1] 5

#find range
max(x) - min(x)

[1] 13.2

#find interquartile range (spread of middle 50% of values)
IQR(x)

[1] 3.45

#find standard deviation
sd(x)

[1] 3.858287

Tabela de frequência

Podemos usar a seguinte sintaxe para produzir uma tabela de frequência para nossa variável:

 #produce frequency table
table(s)

   1 2 3.5 4 5 6.5 7 7.4 8 13 14.2 
   2 1 1 3 2 1 1 1 1 1 1 

Isso nos diz que:

  • O valor 1 aparece duas vezes
  • O valor 2 aparece 1 vez
  • O valor 3,5 aparece 1 vez

E assim por diante.

Gráficos

Podemos produzir um boxplot usando a seguinte sintaxe:

 #produce boxplot
boxplot(x)

Podemos produzir um histograma usando a seguinte sintaxe:

 #produce histogram
hist(x) 

Podemos produzir uma curva de densidade usando a seguinte sintaxe:

 #produce density curve
plot(density(x)) 

Cada um desses gráficos nos dá uma maneira única de visualizar a distribuição dos valores da nossa variável.


Você pode encontrar mais tutoriais de R nesta página .

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *