Come confrontare due curve roc (con esempio)


Un modo per visualizzare le prestazioni deimodelli di classificazione nell’apprendimento automatico è creare una curva ROC , che sta per curva “caratteristica operativa del ricevitore”.

Questo tipo di curva mostra la sensibilità e la specificità di un modello di classificazione:

  • Sensibilità: probabilità che il modello preveda un risultato positivo per un’osservazione quando il risultato è effettivamente positivo.
  • Specificità: probabilità che il modello preveda un risultato negativo per un’osservazione quando il risultato è effettivamente negativo.

L’ asse x di una curva ROC rappresenta (1-Specificità) e l’ asse y rappresenta la Sensibilità :

Quanto più la curva ROC si avvicina all’angolo superiore sinistro del grafico, tanto meglio il modello è in grado di classificare i dati in categorie.

Per quantificarlo, possiamo calcolare l’ AUC (area sotto la curva) che ci dice quanta parte del grafico si trova sotto la curva.

Più l’AUC è vicino a 1, migliore è il modello.

Quando si confrontano due curve ROC per determinare quale modello di classificazione è migliore, spesso osserviamo quale curva ROC “abbraccia” più da vicino l’angolo superiore sinistro del grafico e quindi ha un valore AUC più elevato.

Esempio: come confrontare due curve ROC

Supponiamo di adattare un modello di regressione logistica e un modello con gradiente migliorato a un set di dati per prevedere il risultato di una variabile di risposta.

Supponiamo quindi di creare curve ROC per visualizzare le prestazioni di ciascun modello:

confrontare due curve ROC

La linea blu mostra la curva ROC per il modello di regressione logistica e la linea arancione mostra la curva ROC per il modello con gradiente potenziato.

Dal nostro grafico, possiamo vedere i seguenti valori AUC per ciascun modello:

  • AUC del modello di regressione logistica: 0,7902
  • AUC del modello potenziato con gradiente: 0,9712

Poiché il modello con gradiente migliorato ha un valore AUC più elevato, diremmo che prevede meglio il risultato della variabile di risposta.

Nota : in questo esempio abbiamo confrontato solo due curve ROC, ma è possibile adattare diversi modelli di classificazione a un set di dati e confrontare ancora più curve ROC per determinare il modello migliore da utilizzare.

Risorse addizionali

Le seguenti esercitazioni forniscono informazioni aggiuntive sui modelli di classificazione e sulle curve ROC:

Introduzione alla regressione logistica
Come interpretare una curva ROC
Cosa è considerato un buon punteggio AUC?

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *