Como executar uma função countif em python
Muitas vezes você pode querer contar apenas o número de linhas em um DataFrame do pandas que atende a determinados critérios.
Felizmente, isso é fácil de fazer usando a seguinte sintaxe básica:
sum(df. column_name == some_value )
Os exemplos a seguir mostram como usar essa sintaxe na prática no seguinte quadro de dados:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' x ': [3, 4, 5, 6, 7, 8, 9, 10, 10, 12, 13],
' y ': [3, 4, 5, 7, 9, 13, 15, 19, 23, 24, 29]})
#view head of DataFrame
df. head ()
x y
0 3 3
1 4 4
2 5 5
3 6 7
4 7 9
Exemplo 1: contar linhas iguais a um determinado valor
O código a seguir mostra como contar o número de linhas onde a variável x é igual a 10:
sum( df.x == 10 ) 2
O código a seguir mostra como contar o número de linhas onde a variável x é igual a 10 ou a variável y é igual a 5:
sum((df. x == 10 ) | (df. y == 5 )) 3
O código a seguir mostra como contar o número de linhas onde a variável x não é igual a 10:
sum( df.x != 10 ) 9
Exemplo 2: contagem de linhas maiores ou iguais a um determinado valor
O código a seguir mostra como contar o número de linhas onde x é maior que 10:
sum( df.x > 10 ) 2
O código a seguir mostra como contar o número de linhas onde x é menor ou igual a 7:
sum(df. x <= 7 ) 5
Exemplo 3: contar linhas entre dois valores
O código a seguir mostra como contar o número de linhas onde x está entre 10 e 20:
sum((df. x >= 5 ) & (df. x <= 10 )) 7
Recursos adicionais
Pandas: como encontrar a diferença entre duas linhas
Pandas: como deletar linhas contendo uma string específica
Pandas: Como remover linhas duplicadas em um DataFrame