Como traçar a distribuição dos valores das colunas em r
Você pode usar os seguintes métodos para traçar uma distribuição dos valores das colunas em R:
Método 1: traçar a distribuição de valores usando gráfico de densidade
plot(density(df$my_column))
Método 2: traçar a distribuição de valores usando um histograma
hist(df$my_column)
Os exemplos a seguir mostram como usar cada método na prática com o seguinte quadro de dados
#create data frame df = data. frame (team=rep(c(' A ', ' B '), each= 10 ), points=c(3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 8, 7, 8, 9, 12, 12, 12, 14, 15, 17)) #view data frame df team points 1 to 3 2 to 3 3 to 4 4 to 5 5 to 4 6 to 7 7 to 7 8 to 7 9 to 10 10 to 11 11 B 8 12 B 7 13 B 8 14 B 9 15 B 12 16 B 12 17 B 12 18 B 14 19 B 15 20 B 17
Exemplo 1: traçar a distribuição de valores usando gráfico de densidade
O código a seguir mostra como traçar a distribuição de valores na coluna de pontos usando um gráfico de densidade :
#plot distribution of values in points column
plot(density(df$points))
Esta sintaxe produz uma curva suave que resume a distribuição dos valores de uma variável.
Observe que também podemos alterar o título, os rótulos dos eixos e a cor da linha no gráfico de densidade, se quisermos:
#plot distribution of values in points column plot(density(df$points), col=' red ', main=' Density Plot of Points ', xlab=' Points ')
Exemplo 2: traçar a distribuição de valores usando um histograma
O código a seguir mostra como traçar a distribuição de valores na coluna de pontos usando um histograma:
#plot distribution of values in points column using histogram
hist(df$points)
Um histograma usa barras para representar as frequências dos valores na coluna de pontos , em oposição a uma linha suave que resume a forma da distribuição.
Observe que também podemos alterar o título, os rótulos dos eixos, a cor e o número de saltos usados no histograma:
#plot distribution of values in points column using histogram hist(df$points, main=' Histogram of Points ', xlab=' Points ', col=' steelblue ', breaks= 12 )
Nota : Quanto maior o valor escolhido para o argumento de quebras , mais barras haverá no histograma.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:
Como adicionar linha vertical ao histograma em R
Como criar gráficos de densidade de kernel em R
Como sobrepor gráficos de densidade no ggplot2