Como criar uma matriz de dispersão em pandas (com exemplos)


Uma matriz de gráfico de dispersão é exatamente o que parece: uma matriz de gráfico de dispersão.

Este tipo de matriz é útil porque permite visualizar simultaneamente a relação entre múltiplas variáveis em um conjunto de dados.

Você pode usar a função scatter_matrix() para criar uma matriz de dispersão a partir de um DataFrame do pandas:

 p.d. plotting . scatter_matrix (df)

Os exemplos a seguir mostram como usar essa sintaxe na prática com o seguinte DataFrame do pandas:

 import pandas as pd
import numpy as np

#make this example reproducible
n.p. random . seeds (0)

#createDataFrame
df = pd. DataFrame ({' points ': np.random.randn(1000),
                   ' assists ': np.random.randn(1000),
                   ' rebounds ': np.random.randn(1000)})

#view first five rows of DataFrame
df. head ()

	points assists rebounds
0 1.764052 0.555963 -1.532921
1 0.400157 0.892474 -1.711970
2 0.978738 -0.422315 0.046135
3 2.240893 0.104714 -0.958374
4 1.867558 0.228053 -0.080812

Exemplo 1: Matriz de difusão básica

O código a seguir mostra como criar uma matriz de dispersão básica:

 p.d. plotting . scatter_matrix (df)

matriz de dispersão em pandas

Exemplo 2: Matriz de dispersão para colunas específicas

O código a seguir mostra como criar uma matriz de dispersão apenas para as duas primeiras colunas do DataFrame:

 p.d. plotting . scatter_matrix (df. iloc [:, 0:2])

Exemplo 3: Matriz de dispersão com cores e compartimentos personalizados

O código a seguir mostra como criar uma matriz de dispersão com cores personalizadas e um número específico de grupos para os histogramas:

 p.d. plotting . scatter_matrix (df, color=' red ', hist_kwds={' bins ': 30 , 'color': ' red '})

matriz de dispersão panda com cor personalizada

Exemplo 4: Matriz de dispersão com gráfico KDE

O código a seguir mostra como criar uma matriz de dispersão com um gráfico de estimativa de densidade do kernel ao longo das diagonais da matriz em vez de um histograma:

 p.d. plotting . scatter_matrix (df, diagonal=' kde ')

Você pode encontrar a documentação online completa da função scatter_matrix() aqui .

Recursos adicionais

Os tutoriais a seguir explicam como criar outros gráficos comuns em Python:

Como criar mapas de calor em Python
Como criar uma curva em forma de sino em Python
Como criar um gráfico Ogive em Python

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *