Come eseguire una funzione conta.se in python


Spesso potresti voler contare solo il numero di righe in un DataFrame panda che soddisfa determinati criteri.

Fortunatamente, questo è facile da fare utilizzando la seguente sintassi di base:

 sum(df. column_name == some_value )

I seguenti esempi mostrano come utilizzare in pratica questa sintassi sul seguente frame di dati:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' x ': [3, 4, 5, 6, 7, 8, 9, 10, 10, 12, 13],
                   ' y ': [3, 4, 5, 7, 9, 13, 15, 19, 23, 24, 29]})

#view head of DataFrame
df. head ()

x y
0 3 3
1 4 4
2 5 5
3 6 7
4 7 9

Esempio 1: contare le righe pari a un determinato valore

Il codice seguente mostra come contare il numero di righe in cui la variabile x è uguale a 10:

 sum( df.x == 10 )

2

Il codice seguente mostra come contare il numero di righe in cui la variabile x è uguale a 10 o la variabile y è uguale a 5:

 sum((df. x == 10 ) | (df. y == 5 ))

3

Il codice seguente mostra come contare il numero di righe in cui la variabile x non è uguale a 10:

 sum( df.x != 10 )

9

Esempio 2: conteggio delle righe maggiori o uguali a un determinato valore

Il codice seguente mostra come contare il numero di righe in cui x è maggiore di 10:

 sum( df.x > 10 ) 

2

Il codice seguente mostra come contare il numero di righe in cui x è inferiore o uguale a 7:

 sum(df. x <= 7 )
 
5

Esempio 3: contare le linee tra due valori

Il codice seguente mostra come contare il numero di righe in cui x è compreso tra 10 e 20:

 sum((df. x >= 5 ) & (df. x <= 10 ))

7

Risorse addizionali

Panda: come trovare la differenza tra due linee
Panda: come eliminare le righe contenenti una stringa specifica
Panda: come rimuovere le righe duplicate in un DataFrame

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *