Pandy: utwórz histogram dla każdej kolumny w dataframe


Możesz użyć następującej podstawowej składni, aby utworzyć histogram dla każdej kolumny ramki DataFrame pandy:

 import pandas as pd
import matplotlib. pyplot as plt

#define number of subplots
fig, axis = plt. subplots (1, 3)

#create histogram for each column in DataFrame
df. hist (ax=axis)

W tym konkretnym przykładzie zastosowano funkcję subplots() , aby określić, że w ramce danych znajdują się 3 kolumny, a następnie utworzono histogram dla każdej kolumny.

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Utwórz histogram dla każdej kolumny w histogramie Pandy

Załóżmy, że mamy następującą ramkę danych pand zawierającą trzy kolumny:

 import pandas as pd
import numpy as np

#make this example reproducible
n.p. random . seeds (1)

#createDataFrame
df = pd. DataFrame ({' points ': np. random . normal (loc=20, scale=2, size=300),
                   ' assists ': np. random . normal (loc=14, scale=3, size=300),
                   ' rebounds ': np. random . normal (loc=12, scale=1, size=300)})

#view head of DataFrame
print ( df.head ())

      points assists rebounds
0 23.248691 20.197350 10.927036
1 18.776487 9.586529 12.495159
2 18.943656 11.509484 11.047938
3 17.854063 11.358267 11.481854
4 21.730815 13.162707 10.538596

Możemy użyć następującej składni, aby utworzyć histogram dla każdej z trzech kolumn ramki DataFrame:

 import matplotlib. pyplot as plt

#define format for subplots (1 row and 3 columns)
fig, axis = plt. subplots (1, 3)

#create histogram for each column in DataFrame
df. hist (ax=axis)

Rezultatem jest siatka z jednym wierszem i trzema kolumnami, która wyświetla histogram dla każdej kolumny ramki DataFrame.

Jeśli chcesz, możesz użyć argumentu figsize , aby zmienić rozmiar histogramów, a także argumentów Edgecolor i Grid , aby poprawić wygląd histogramów:

 import matplotlib. pyplot as plt 

#define format for subplots
fig, axis = plt. subplots (1, 3, figsize=(8,3))

#create histogram for each column in DataFrame
df. hist (ax=axis, edgecolor=' black ', grid= False ) 

pandy tworzą histogram dla każdej kolumny w DataFrame

Możesz pobawić się argumentami funkcji subplots() , aby zdefiniować dokładny format i rozmiar histogramów.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Jak zmienić liczbę pojemników używanych w histogramie Pandy
Jak zmienić zakres osi X w histogramie Pandy
Jak wykreślić histogramy według grup w Pandach

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *