Een spreidingsmatrix in panda's maken (met voorbeelden)


Een scatterplot-matrix is precies hoe het klinkt: een scatterplot-matrix.

Dit type matrix is handig omdat je hiermee tegelijkertijd de relatie tussen meerdere variabelen in een dataset kunt visualiseren.

U kunt de functie scatter_matrix() gebruiken om een spreidingsmatrix te maken op basis van een panda’s DataFrame:

 p.d. plotting . scatter_matrix (df)

De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken met de volgende panda’s DataFrame:

 import pandas as pd
import numpy as np

#make this example reproducible
n.p. random . seeds (0)

#createDataFrame
df = pd. DataFrame ({' points ': np.random.randn(1000),
                   ' assists ': np.random.randn(1000),
                   ' rebounds ': np.random.randn(1000)})

#view first five rows of DataFrame
df. head ()

	points assists rebounds
0 1.764052 0.555963 -1.532921
1 0.400157 0.892474 -1.711970
2 0.978738 -0.422315 0.046135
3 2.240893 0.104714 -0.958374
4 1.867558 0.228053 -0.080812

Voorbeeld 1: Basisdiffusiematrix

De volgende code laat zien hoe u een basisdispersiematrix maakt:

 p.d. plotting . scatter_matrix (df)

verspreidingsmatrix bij panda's

Voorbeeld 2: Spreidingsmatrix voor specifieke kolommen

De volgende code laat zien hoe u een spreidingsmatrix maakt voor alleen de eerste twee kolommen van het DataFrame:

 p.d. plotting . scatter_matrix (df. iloc [:, 0:2])

Voorbeeld 3: Verspreidingsmatrix met aangepaste kleuren en bakken

De volgende code laat zien hoe u een spreidingsmatrix maakt met aangepaste kleuren en een specifiek aantal groepen voor de histogrammen:

 p.d. plotting . scatter_matrix (df, color=' red ', hist_kwds={' bins ': 30 , 'color': ' red '})

panda-spreidingsmatrix met aangepaste kleur

Voorbeeld 4: Dispersiematrix met KDE-plot

De volgende code laat zien hoe u een dispersiematrix kunt maken met een schatting van de kerneldichtheid langs de matrixdiagonalen in plaats van een histogram:

 p.d. plotting . scatter_matrix (df, diagonal=' kde ')

U kunt de volledige online documentatie van de functie scatter_matrix() hier vinden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere algemene diagrammen in Python kunt maken:

Hoe u hittekaarten maakt in Python
Hoe u een belcurve maakt in Python
Hoe u een Ogive-diagram maakt in Python

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert