Come creare una matrice di dispersione in pandas (con esempi)


Una matrice di grafici a dispersione è esattamente ciò che sembra: una matrice di grafici a dispersione.

Questo tipo di matrice è utile perché consente di visualizzare contemporaneamente la relazione tra più variabili in un set di dati.

Puoi utilizzare la funzione scatter_matrix() per creare una matrice di dispersione da un DataFrame panda:

 p.d. plotting . scatter_matrix (df)

I seguenti esempi mostrano come utilizzare questa sintassi in pratica con i seguenti DataFrame panda:

 import pandas as pd
import numpy as np

#make this example reproducible
n.p. random . seeds (0)

#createDataFrame
df = pd. DataFrame ({' points ': np.random.randn(1000),
                   ' assists ': np.random.randn(1000),
                   ' rebounds ': np.random.randn(1000)})

#view first five rows of DataFrame
df. head ()

	points assists rebounds
0 1.764052 0.555963 -1.532921
1 0.400157 0.892474 -1.711970
2 0.978738 -0.422315 0.046135
3 2.240893 0.104714 -0.958374
4 1.867558 0.228053 -0.080812

Esempio 1: matrice di diffusione di base

Il codice seguente mostra come creare una matrice di dispersione di base:

 p.d. plotting . scatter_matrix (df)

matrice di dispersione nei panda

Esempio 2: matrice di dispersione per colonne specifiche

Il codice seguente mostra come creare una matrice di dispersione solo per le prime due colonne del DataFrame:

 p.d. plotting . scatter_matrix (df. iloc [:, 0:2])

Esempio 3: matrice di dispersione con colori e contenitori personalizzati

Il codice seguente mostra come creare una matrice di dispersione con colori personalizzati e un numero specifico di gruppi per gli istogrammi:

 p.d. plotting . scatter_matrix (df, color=' red ', hist_kwds={' bins ': 30 , 'color': ' red '})

matrice di dispersione panda con colore personalizzato

Esempio 4: matrice di dispersione con grafico KDE

Il codice seguente mostra come creare una matrice di dispersione con un grafico di stima della densità del kernel lungo le diagonali della matrice anziché un istogramma:

 p.d. plotting . scatter_matrix (df, diagonal=' kde ')

Puoi trovare la documentazione online completa della funzione scatter_matrix() qui .

Risorse addizionali

I seguenti tutorial spiegano come creare altri grafici comuni in Python:

Come creare mappe di calore in Python
Come creare una curva a campana in Python
Come creare un grafico a ogiva in Python

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *