Pandas: створіть гістограму для кожного стовпця в dataframe


Ви можете використовувати такий базовий синтаксис, щоб створити гістограму для кожного стовпця pandas DataFrame:

 import pandas as pd
import matplotlib. pyplot as plt

#define number of subplots
fig, axis = plt. subplots (1, 3)

#create histogram for each column in DataFrame
df. hist (ax=axis)

У цьому конкретному прикладі використовується функція subplots() , щоб вказати, що у DataFrame є 3 стовпці, а потім створюється гістограма для кожного стовпця.

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Приклад: створіть гістограму для кожного стовпця в гістограмі Pandas

Припустімо, що у нас є такий фрейм даних pandas, який містить три стовпці:

 import pandas as pd
import numpy as np

#make this example reproducible
n.p. random . seeds (1)

#createDataFrame
df = pd. DataFrame ({' points ': np. random . normal (loc=20, scale=2, size=300),
                   ' assists ': np. random . normal (loc=14, scale=3, size=300),
                   ' rebounds ': np. random . normal (loc=12, scale=1, size=300)})

#view head of DataFrame
print ( df.head ())

      points assists rebounds
0 23.248691 20.197350 10.927036
1 18.776487 9.586529 12.495159
2 18.943656 11.509484 11.047938
3 17.854063 11.358267 11.481854
4 21.730815 13.162707 10.538596

Ми можемо використовувати такий синтаксис, щоб створити гістограму для кожного з трьох стовпців DataFrame:

 import matplotlib. pyplot as plt

#define format for subplots (1 row and 3 columns)
fig, axis = plt. subplots (1, 3)

#create histogram for each column in DataFrame
df. hist (ax=axis)

Результатом є сітка з одним рядком і трьома стовпцями, яка відображає гістограму для кожного стовпця DataFrame.

Якщо ви хочете, ви можете використовувати аргумент figsize , щоб змінити розмір гістограм, а також аргументи edgecolor і grid , щоб покращити вигляд гістограм:

 import matplotlib. pyplot as plt 

#define format for subplots
fig, axis = plt. subplots (1, 3, figsize=(8,3))

#create histogram for each column in DataFrame
df. hist (ax=axis, edgecolor=' black ', grid= False ) 

pandas створює гістограму для кожного стовпця в DataFrame

Не соромтеся грати з аргументами функції subplots() , щоб визначити точний формат і розмір гістограм.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в pandas:

Як змінити кількість бінів, що використовуються в гістограмі Pandas
Як змінити діапазон осі X на гістограмі Pandas
Як побудувати гістограми за групами в Pandas

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *