Como criar um gráfico de pareto em r (passo a passo)
Um gráfico de Pareto é um tipo de gráfico que exibe as frequências de diferentes categorias, bem como as frequências cumulativas das categorias.
Este tutorial fornece um exemplo passo a passo de criação de um gráfico de Pareto em R.
Etapa 1: crie os dados
Suponha que realizamos uma pesquisa na qual pedimos a 350 pessoas diferentes que identifiquem a sua marca de cereal favorita entre as marcas A, B, C, D e E.
O conjunto de dados a seguir mostra o total de votos para cada marca:
#createdata df <- data. frame (favorite=c('A', 'B', 'C', 'D', 'E', 'F'), count=c(140, 97, 58, 32, 17, 6)) #viewdata df favorite count 1 to 140 2 B 97 3 C 58 4 D 32 5 E 17 6 F 6
Etapa 2: crie o gráfico de Pareto
Para criar um gráfico de Pareto para visualizar os resultados desta pesquisa, podemos usar a função pareto.chart() do pacote qcc :
library (qcc) #create Pareto chart pareto. chart (df$count) Pareto chart analysis for df$count Frequency Cum.Freq. Percentage Cum.Percent. A 140.000000 140.000000 40.000000 40.000000 B 97.000000 237.000000 27.714286 67.714286 C 58.000000 295.000000 16.571429 84.285714 D 32.000000 327.000000 9.142857 93.428571 E 17.000000 344.000000 4.857143 98.285714 F 6.000000 350.000000 1.714286 100.000000
A tabela de saída nos mostra a frequência e a frequência acumulada de cada marca. Por exemplo:
- Frequência da marca A: 140 | Frequência cumulativa: 140
- Frequência da marca B: 97 | Frequência cumulativa de A, B: 237
- Frequência da marca C: 58 | Frequência cumulativa de A, B, C: 295
E assim por diante.
Etapa 3: edite o gráfico de Pareto (opcional)
O código a seguir mostra como modificar o título do gráfico, bem como a paleta de cores utilizada:
pareto. chart (df$count, main=' Pareto Chart for Favorite Cereal Brands ', col=heat. colors ( length (df$count)))
Você pode encontrar uma lista completa de paletas de cores disponíveis nesta folha de referências do R Color .
Recursos adicionais
Como criar tabelas de frequência em R
Como criar um histograma de frequência relativa em R
Como calcular somas cumulativas em R