Pandas: classifique o dataframe por índice e coluna
Você pode usar a seguinte sintaxe para classificar um DataFrame do pandas por índice e coluna:
df = df. sort_values (by = [' column_name ', ' index '], ascending = [ False , True ])
Os exemplos a seguir mostram como usar essa sintaxe na prática.
Exemplos: classificar o DataFrame por índice e coluna
O código a seguir mostra como classificar um DataFrame do pandas pela coluna chamada pontos e depois pela coluna de índice :
import pandas as pd #createDataFrame df = pd. DataFrame ({' id ': [1, 2, 3, 4, 5, 6, 7, 8], ' points ': [25, 15, 15, 14, 20, 20, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}). set_index (' id ') #view first few rows df. head () points assists rebounds id 1 25 5 11 2 15 7 8 3 15 7 10 4 14 9 6 5 20 12 6 #sort by points and then by index df. sort_values (by = [' points ', ' id '], ascending = [ False , True ]) points assists rebounds id 8 29 4 12 1 25 5 11 7 25 9 9 5 20 12 6 6 20 9 5 2 15 7 8 3 15 7 10 4 14 9 6
O DataFrame resultante é classificado por pontos em ordem decrescente e depois por índice em ordem crescente (se houver dois jogadores que marcam o mesmo número de pontos).
Observe que se não usarmos o argumento ascendente , cada coluna usará a ordem crescente como método de classificação padrão:
#sort by points and then by index df. sort_values (by = [' points ', ' id ']) points assists rebounds id 4 14 9 6 2 15 7 8 3 15 7 10 5 20 12 6 6 20 9 5 1 25 5 11 7 25 9 9 8 29 4 12
Se a coluna do índice não tiver nome no momento, você poderá renomeá-la e classificá-la de acordo:
#sort by points and then by index df. rename_axis (' index '). sort_values (by = [' points ', ' id ']) points assists rebounds id 4 14 9 6 2 15 7 8 3 15 7 10 5 20 12 6 6 20 9 5 1 25 5 11 7 25 9 9 8 29 4 12
Recursos adicionais
Pandas: como classificar colunas por nome
Pandas: classifique o DataFrame por data
Pandas: como remover linhas duplicadas