Como traçar a distribuição dos valores das colunas em r


Você pode usar os seguintes métodos para traçar uma distribuição dos valores das colunas em R:

Método 1: traçar a distribuição de valores usando gráfico de densidade

 plot(density(df$my_column))

Método 2: traçar a distribuição de valores usando um histograma

 hist(df$my_column)

Os exemplos a seguir mostram como usar cada método na prática com o seguinte quadro de dados

 #create data frame
df = data. frame (team=rep(c(' A ', ' B '), each= 10 ),
                points=c(3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 8,
                         7, 8, 9, 12, 12, 12, 14, 15, 17))

#view data frame
df

   team points
1 to 3
2 to 3
3 to 4
4 to 5
5 to 4
6 to 7
7 to 7
8 to 7
9 to 10
10 to 11
11 B 8
12 B 7
13 B 8
14 B 9
15 B 12
16 B 12
17 B 12
18 B 14
19 B 15
20 B 17

Exemplo 1: traçar a distribuição de valores usando gráfico de densidade

O código a seguir mostra como traçar a distribuição de valores na coluna de pontos usando um gráfico de densidade :

 #plot distribution of values in points column
plot(density(df$points)) 

Esta sintaxe produz uma curva suave que resume a distribuição dos valores de uma variável.

Observe que também podemos alterar o título, os rótulos dos eixos e a cor da linha no gráfico de densidade, se quisermos:

 #plot distribution of values in points column
plot(density(df$points), col=' red ', main=' Density Plot of Points ', xlab=' Points ')

traçar a distribuição dos valores das colunas em R usando o gráfico de densidade

Exemplo 2: traçar a distribuição de valores usando um histograma

O código a seguir mostra como traçar a distribuição de valores na coluna de pontos usando um histograma:

 #plot distribution of values in points column using histogram
hist(df$points)

Um histograma usa barras para representar as frequências dos valores na coluna de pontos , em oposição a uma linha suave que resume a forma da distribuição.

Observe que também podemos alterar o título, os rótulos dos eixos, a cor e o número de saltos usados no histograma:

 #plot distribution of values in points column using histogram
hist(df$points, main=' Histogram of Points ', xlab=' Points ', col=' steelblue ', breaks= 12 )

traçar a distribuição dos valores das colunas em R usando histograma

Nota : Quanto maior o valor escolhido para o argumento de quebras , mais barras haverá no histograma.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:

Como adicionar linha vertical ao histograma em R
Como criar gráficos de densidade de kernel em R
Como sobrepor gráficos de densidade no ggplot2

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *