Valutazione delle prestazioni

Dato un classificatore addestrato su un determinato insieme di addestramento (Training Set) è necessario valutarlo su un altro insieme (Validation Set o Certification Set). Da questo confronto è possibile estrarre degli indici che permettono di valutare il classificatore e permettono di confrontare diversi classificatori tra loro. È assolutamente indispensabile che gli indici di prestazione vengano calcolati su un insieme di campioni non usati durante la fase di addestramento (il validation set) in modo da rilevare problemi come l'overfitting dei dati ovvero la mancata generalizzazione.

Fissati i parametri del classificatore si può creare la tabella di contingenza (Confusion Matrix):


    Valore Vero
    p n
Classificazione p' VP FP
  n' FN


I Falsi Positivi (FP) vengono indicati anche come Falsi Allarmi. I Falsi Negativi (FN) come miss.

Dalla tabella vengono normalmente estratti alcuni valori di prestazione, come:

Ogni classificatore ha uno o più parametri che, se modificati, cambiano il rapporto tra i riconoscimenti corrette e il numero di falsi positivi. Risulta pertanto difficile poter confrontare in maniera obiettiva due classificatori perché magari uno presenta, a parità di tale soglia, un numero di individuazioni corrette più elevato dell'altro ma magari un numero più alto di falsi positivi. Per confrontare pertanto le prestazioni di diversi classificatori binari ottenuti da diverse sessioni di addestramento si fa normalmente uso di curve al variare di questa soglia interna del classificatore.

Le curve di prestazioni che si possono trovare sono

È infine da notare che questi indici si riferiscono a qualunque classe di problemi che contempli il concetto di risultato corretto o sbagliato. È pertanto applicabile non solo ai classificatori, ma per esempio alle associazioni di punti caratteristici e altro ancora.

Recentemente, per poter fare un confronto più snello per le prestazioni di un classificatore, sono state proposte delle funzioni che applicate alle curve ROC permettono di ricavare un unico scalare rappresentante un voto della bontà di classificazione. Tali funzioni sono solitamente delle medie di campionamenti della curva ROC nelle sole zone di interesse pratico.

Paolo medici
2025-03-12