Como criar um gráfico de pares em python
Um gráfico de pares é uma matriz de gráfico de dispersão que permite compreender a relação de pares entre diferentes variáveis em um conjunto de dados.
A maneira mais fácil de criar um gráfico de pares em Python é usar a funçãoseaborn.pairplot(df) .
Os exemplos a seguir mostram como usar esta função na prática.
Exemplo 1: gráfico de pares para todas as variáveis
O código a seguir mostra como criar um gráfico de pares para cada variável numérica no conjunto de dados marítimo chamado iris :
import pandas as pd import matplotlib. pyplot as plt import seaborn as sns #define dataset iris = sns. load_dataset (“ iris ”) #create pairs plot for all numeric variables sns. pairplot (iris)
A forma de interpretar a matriz é a seguinte:
- A distribuição de cada variável é apresentada como um histograma ao longo das caixas diagonais.
- Todas as outras caixas exibem um gráfico de dispersão da relação entre cada combinação de variáveis aos pares. Por exemplo, a caixa no canto inferior esquerdo da matriz mostra um gráfico de dispersão de valores para petal_width versus sepal_length .
Este gráfico único nos dá uma ideia da relação entre cada par de variáveis em nosso conjunto de dados.
Exemplo 2: Traçando pares para variáveis específicas
Também podemos especificar apenas certas variáveis para incluir no gráfico de pares:
sns. pairplot (iris[[' sepal_length ', ' sepal_width ']])
Exemplo 3: Plotando pares com cores por categoria
Também podemos criar um gráfico de pares que colore cada ponto em cada gráfico com base em uma variável categórica usando o argumento hue :
sns. pairplot (iris, hue=' species ')
Usando o argumento matiz , podemos compreender melhor os dados.
Recursos adicionais
Como criar gráficos de barras com Seaborn
Como criar mapas de calor com Seaborn
Como adicionar um título aos gráficos Seaborn