Как изменить порядок полос в seaborn barplot


Для изменения порядка столбцов на морском графике можно использовать следующие методы:

Способ 1. Сортировка столбцов в Barplot, созданных на основе необработанных данных.

 sns. barplot (x=' xvar ', y=' yvar ', data=df, order=df. sort_values (' yvar '). xvar )

Способ 2. Сортировка столбцов в Barplot, созданных на основе агрегированных данных.

 sns. barplot (x=' xvar ', y=' yvar ', data=df, order=df_agg[' xvar ']

Следующие примеры показывают, как использовать каждый метод на практике.

Пример 1. Столбцы сортировки в Barplot, созданные на основе необработанных данных

Предположим, у нас есть следующий DataFrame pandas, который содержит информацию об общем объеме продаж различных сотрудников компании:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' employee ': ['Andy', 'Bert', 'Chad', 'Doug', 'Eric', 'Frank'],
                   ' sales ': [22, 14, 9, 7, 29, 20]})

#view DataFrame
print (df)

  employee sales
0 Andy 22
1 Bert 14
2 Chad 9
3 Doug 7
4 Eric 29
5 Frank 20

Мы можем использовать следующий синтаксис для создания гистограммы, в которой столбцы сортируются в порядке возрастания на основе стоимости продаж :

 import seaborn as sns

#create barplot with bars sorted by sales values ascending
sns. barplot (x=' employee ', y=' sales ', data=df, order=df. sort_values (' sales '). employee )

Чтобы отсортировать столбцы в порядке убывания, просто используйте возрастающий=False в функции sort_values() :

 import seaborn as sns

#create barplot with bars sorted by sales values descending
sns. barplot (x=' employee ', y=' sales ', data=df,
            order=df. sort_values (' sales ', ascending= False ). employee ) 

Пример 2. Столбцы сортировки в Barplot, созданные на основе агрегированных данных.

Предположим, у нас есть следующий DataFrame pandas, который содержит информацию об общем объеме продаж различных сотрудников компании:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' employee ': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
                   ' sales ': [24, 20, 25, 14, 19, 13, 30, 35, 28]})

#view DataFrame
print (df)

  employee sales
0 to 24
1 to 20
2 to 25
3 B 14
4 B 19
5 B 13
6 C 30
7 C 35
8 C 28

Мы можем использовать следующий синтаксис для расчета средней стоимости продаж , сгруппированной по сотрудникам :

 #calculate mean sales by employee
df_agg = df. groupby ([' employee '])[' sales ']. mean (). reset_index (). sort_values (' sales ')

#view aggregated data
print (df_agg)

  employee sales
1 B 15.333333
0 to 23.000000
2 C 31.000000

Затем мы можем использовать следующий синтаксис для создания гистограммы в Seaborn, которая отображает средний объем продаж на одного сотрудника, причем столбцы отображаются в порядке возрастания:

 import seaborn as sns

#create barplot with bars ordered in ascending order by mean sales
sns. barplot (x=' employee ', y=' sales ', data=df,
            order=df_agg[' employee '], errorbar=(' ci ', False )) 

По оси X отображается имя сотрудника, а по оси Y отображается средний объем продаж для каждого сотрудника.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные функции в seaborn:

Как отображать значения на Seaborn Barplot
Как создать сгруппированную гистограмму в Seaborn
Как установить цвет столбцов на гистограмме Seaborn

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *