Як видалити повторювані стовпці в pandas (з прикладами)


Ви можете використовувати наступний базовий синтаксис, щоб видалити повторювані стовпці в pandas:

 df. T. drop_duplicates (). T

Наступні приклади показують, як використовувати цей синтаксис на практиці.

Приклад: видаліть повторювані стовпці в Pandas

Припустімо, що у нас є наступні pandas DataFrame:

 import pandas as pd

#create DataFrame with duplicate columns
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

df. columns = ['team', 'points', 'points', 'rebounds']

#view DataFrame
df

	team points points rebounds
0 A 25 25 11
1 A 12 12 8
2 A 15 15 10
3 A 14 14 6
4 B 19 19 6
5 B 23 23 5
6 B 25 25 9
7 B 29 29 12

Ми можемо використати такий код, щоб видалити повторюваний стовпець «балів»:

 #remove duplicate columns
df. T. drop_duplicates (). T

team points rebounds
0 to 25 11
1 to 12 8
2 to 15 10
3 to 14 6
4 B 19 6
5 B 23 5
6 B 25 9
7 B 29 12

Зауважте, що стовпець «points» було видалено, а всі інші стовпці залишилися в DataFrame.

Варто також зазначити, що цей код видалятиме повторювані стовпці, навіть якщо стовпці мають різні назви, але містять ідентичні значення.

Наприклад, припустімо, що у нас є наступні pandas DataFrame:

 import pandas as pd

#create DataFrame with duplicate columns
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' points2 ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team points points2 rebounds
0 A 25 25 11
1 A 12 12 8
2 A 15 15 10
3 A 14 14 6
4 B 19 19 6
5 B 23 23 5
6 B 25 25 9
7 B 29 29 12

Зауважте, що стовпці «points» і «points2» містять ідентичні значення.

Ми можемо використати наступний код, щоб видалити повторюваний стовпець ‘points2’:

 #remove duplicate columns
df. T. drop_duplicates (). T

team points rebounds
0 to 25 11
1 to 12 8
2 to 15 10
3 to 14 6
4 B 19 6
5 B 23 5
6 B 25 9
7 B 29 12

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові функції в pandas:

Як видалити повторювані рядки в Pandas DataFrame
Як видалити стовпці в Pandas
Як виключити стовпці в Pandas

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *