Pandas: як змінити форму dataframe із широкого на довгий


Ви можете використовувати такий базовий синтаксис, щоб перетворити pandas DataFrame із широкого формату на довгий формат:

 df = pd. melt (df, id_vars=' col1 ', value_vars=[' col2 ', ' col3 ', ...])

У цьому сценарії col1 — це стовпець, який ми використовуємо як ідентифікатор, а col2 , col3 тощо. це стовпці, опору яких ми скасовуємо.

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Приклад: змініть форму Pandas DataFrame із широкого на довгий

Припустімо, що у нас є наступні pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D'],
                   ' points ': [88, 91, 99, 94],
                   ' assists ': [12, 17, 24, 28],
                   ' rebounds ': [22, 28, 30, 31]})

#view DataFrame
df

	team points assists rebounds
0 A 88 12 22
1 B 91 17 28
2 C 99 24 30
3 D 94 28 31

Ми можемо використати наступний синтаксис, щоб змінити форму цього DataFrame із широкоформатного на довгий формат:

 #reshape DataFrame from wide format to long format
df = pd. melt (df, id_vars=' team ', value_vars=[' points ', ' assists ', ' rebounds '])

#view updated DataFrame
df

	team variable value
0 A points 88
1 B points 91
2 C dots 9 9
3 D dots 94
4 A assists 12
5 B assists 17
6 C assists 24
7 D assists 28
8 A rebounds 22
9 B rebounds 28
10 C rebounds 30
11 D rebounds 31

DataFrame тепер у довгому форматі.

Ми використали колонку «команда» як ідентифікаційну колонку та скасували обертання колонок «очки», «ассисти» та «підбирання».

Зауважте, що ми також можемо використовувати аргументи var_name і value_name , щоб указати імена стовпців у новому довгому DataFrame:

 #reshape DataFrame from wide format to long format
df = pd. melt (df, id_vars=' team ', value_vars=[' points ', ' assists ', ' rebounds '],
             var_name=' metric ', value_name=' amount ')

#view updated DataFrame
df

	team metric amount
0 A points 88
1 B points 91
2 C points 99
3 D dots 94
4 A assists 12
5 B assists 17
6 C assists 24
7 D assists 28
8 A rebounds 22
9 B rebounds 28
10 C rebounds 30
11 D rebounds 31

Примітка . Повну документацію щодо функції pandas melt() можна знайти тут .

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції в Python:

Як додати рядки до Pandas DataFrame
Як додати стовпці до Pandas DataFrame
Як підрахувати випадки появи певних значень у Pandas DataFrame

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *