Как удалить повторяющиеся столбцы в pandas (с примерами)
Вы можете использовать следующий базовый синтаксис для удаления повторяющихся столбцов в пандах:
df. T. drop_duplicates (). T
Следующие примеры показывают, как использовать этот синтаксис на практике.
Пример: удаление повторяющихся столбцов в Pandas
Предположим, у нас есть следующий DataFrame pandas:
import pandas as pd #create DataFrame with duplicate columns df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [25, 12, 15, 14, 19, 23, 25, 29], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) df. columns = ['team', 'points', 'points', 'rebounds'] #view DataFrame df team points points rebounds 0 A 25 25 11 1 A 12 12 8 2 A 15 15 10 3 A 14 14 6 4 B 19 19 6 5 B 23 23 5 6 B 25 25 9 7 B 29 29 12
Мы можем использовать следующий код, чтобы удалить повторяющийся столбец «точек»:
#remove duplicate columns df. T. drop_duplicates (). T team points rebounds 0 to 25 11 1 to 12 8 2 to 15 10 3 to 14 6 4 B 19 6 5 B 23 5 6 B 25 9 7 B 29 12
Обратите внимание, что столбец «точки» был удален, а все остальные столбцы остались в DataFrame.
Также стоит отметить, что этот код удалит повторяющиеся столбцы, даже если столбцы имеют разные имена, но содержат одинаковые значения.
Например, предположим, что у нас есть следующий DataFrame pandas:
import pandas as pd #create DataFrame with duplicate columns df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' points2 ': [25, 12, 15, 14, 19, 23, 25, 29], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame df team points points2 rebounds 0 A 25 25 11 1 A 12 12 8 2 A 15 15 10 3 A 14 14 6 4 B 19 19 6 5 B 23 23 5 6 B 25 25 9 7 B 29 29 12
Обратите внимание, что столбцы «points» и «points2» содержат одинаковые значения.
Мы можем использовать следующий код, чтобы удалить дубликат столбца «points2»:
#remove duplicate columns df. T. drop_duplicates (). T team points rebounds 0 to 25 11 1 to 12 8 2 to 15 10 3 to 14 6 4 B 19 6 5 B 23 5 6 B 25 9 7 B 29 12
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные функции в pandas:
Как удалить повторяющиеся строки в DataFrame Pandas
Как удалить столбцы в Pandas
Как исключить столбцы в Pandas