Come eseguire una funzione conta.se in python
Spesso potresti voler contare solo il numero di righe in un DataFrame panda che soddisfa determinati criteri.
Fortunatamente, questo è facile da fare utilizzando la seguente sintassi di base:
sum(df. column_name == some_value )
I seguenti esempi mostrano come utilizzare in pratica questa sintassi sul seguente frame di dati:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' x ': [3, 4, 5, 6, 7, 8, 9, 10, 10, 12, 13],
' y ': [3, 4, 5, 7, 9, 13, 15, 19, 23, 24, 29]})
#view head of DataFrame
df. head ()
x y
0 3 3
1 4 4
2 5 5
3 6 7
4 7 9
Esempio 1: contare le righe pari a un determinato valore
Il codice seguente mostra come contare il numero di righe in cui la variabile x è uguale a 10:
sum( df.x == 10 ) 2
Il codice seguente mostra come contare il numero di righe in cui la variabile x è uguale a 10 o la variabile y è uguale a 5:
sum((df. x == 10 ) | (df. y == 5 )) 3
Il codice seguente mostra come contare il numero di righe in cui la variabile x non è uguale a 10:
sum( df.x != 10 ) 9
Esempio 2: conteggio delle righe maggiori o uguali a un determinato valore
Il codice seguente mostra come contare il numero di righe in cui x è maggiore di 10:
sum( df.x > 10 ) 2
Il codice seguente mostra come contare il numero di righe in cui x è inferiore o uguale a 7:
sum(df. x <= 7 ) 5
Esempio 3: contare le linee tra due valori
Il codice seguente mostra come contare il numero di righe in cui x è compreso tra 10 e 20:
sum((df. x >= 5 ) & (df. x <= 10 )) 7
Risorse addizionali
Panda: come trovare la differenza tra due linee
Panda: come eliminare le righe contenenti una stringa specifica
Panda: come rimuovere le righe duplicate in un DataFrame