Pandas: encontre valores únicos na coluna e classifique-os
Você pode usar a seguinte sintaxe básica para encontrar valores exclusivos em uma coluna de um DataFrame do pandas e, em seguida, classificá-los:
df[' my_column ']. drop_duplicates (). sort_values ()
Isso retornará uma série de pandas contendo cada valor exclusivo em uma coluna classificada em ordem crescente.
Para classificar valores únicos em ordem decrescente, use ascendente=False :
df[' my_column ']. drop_duplicates (). sort_values (ascending= False )
O exemplo a seguir mostra como usar essa sintaxe na prática.
Exemplo: Encontre valores exclusivos na coluna Pandas e classifique-os
Suponha que temos o seguinte DataFrame do pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'], ' points ': [5, 5, 9, 12, 12, 5, 10, 13, 13, 19]}) #view DataFrame print (df) team points 0 to 5 1 to 5 2 to 9 3 to 12 4 to 12 5 B 5 6 B 10 7 B 13 8 B 13 9 B 19
Podemos usar a seguinte sintaxe para obter os valores exclusivos da coluna de pontos e depois classificá-los em ordem crescente:
#get unique values in points column and sort them
df[' points ']. drop_duplicates (). sort_values ()
0 5
2 9
6 10
3 12
7 13
9 19
Name: points, dtype: int64
A saída exibe cada um dos valores exclusivos na coluna de pontos classificados em ordem crescente:
- 5
- 9
- dez
- 12
- 13
- 19
Também podemos obter os valores únicos na coluna de pontos classificados em ordem decrescente, especificando ascendente=False na função sort_values() :
#get unique values in points column and sort them in descending order
df[' points ']. drop_duplicates (). sort_values (ascending= False )
9 19
7 13
3 12
6 10
2 9
0 5
Name: points, dtype: int64
A saída exibe cada um dos valores exclusivos na coluna de pontos classificados em ordem decrescente:
- 19
- 13
- 12
- dez
- 9
- 5
Nota : Você pode encontrar a documentação completa para a função drop_duplicates() do pandas aqui.
Recursos adicionais
Os tutoriais a seguir explicam como executar outras funções comuns em pandas:
Pandas: Como selecionar linhas únicas no DataFrame
Pandas: Como obter valores únicos da coluna do índice
Pandas: como contar combinações únicas de duas colunas