Como executar uma função countif em python


Muitas vezes você pode querer contar apenas o número de linhas em um DataFrame do pandas que atende a determinados critérios.

Felizmente, isso é fácil de fazer usando a seguinte sintaxe básica:

 sum(df. column_name == some_value )

Os exemplos a seguir mostram como usar essa sintaxe na prática no seguinte quadro de dados:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' x ': [3, 4, 5, 6, 7, 8, 9, 10, 10, 12, 13],
                   ' y ': [3, 4, 5, 7, 9, 13, 15, 19, 23, 24, 29]})

#view head of DataFrame
df. head ()

x y
0 3 3
1 4 4
2 5 5
3 6 7
4 7 9

Exemplo 1: contar linhas iguais a um determinado valor

O código a seguir mostra como contar o número de linhas onde a variável x é igual a 10:

 sum( df.x == 10 )

2

O código a seguir mostra como contar o número de linhas onde a variável x é igual a 10 ou a variável y é igual a 5:

 sum((df. x == 10 ) | (df. y == 5 ))

3

O código a seguir mostra como contar o número de linhas onde a variável x não é igual a 10:

 sum( df.x != 10 )

9

Exemplo 2: contagem de linhas maiores ou iguais a um determinado valor

O código a seguir mostra como contar o número de linhas onde x é maior que 10:

 sum( df.x > 10 ) 

2

O código a seguir mostra como contar o número de linhas onde x é menor ou igual a 7:

 sum(df. x <= 7 )
 
5

Exemplo 3: contar linhas entre dois valores

O código a seguir mostra como contar o número de linhas onde x está entre 10 e 20:

 sum((df. x >= 5 ) & (df. x <= 10 ))

7

Recursos adicionais

Pandas: como encontrar a diferença entre duas linhas
Pandas: como deletar linhas contendo uma string específica
Pandas: Como remover linhas duplicadas em um DataFrame

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *