Classificatori bayesiani

Il teorema di Bayes, associato alla Visione Artificiale, rappresenta una tecnica fondamentale per la classificazione di pattern, basata sull'esperienza (training set).

Per capire il teorema di Bayes è necessario fare un semplice esempio. Si supponga di voler classificare della frutta che viene mostrata a un osservatore (un elaboratore nel caso estremo). Per semplicità si supponga che i tipi di frutta (le categorie del classificatore) siano solo due, per esempio, arance e mele. Per gli esseri umani, ma allo stesso modo deve essere fatto per le macchine, determinare la tipologia di frutta che si stà osservando, avviene esaminando determinate caratteristiche (feature) estratte dall'osservazione della frutta, attraverso opportune tecniche.

Se i frutti vengono scelti in maniera totalmente casuale e non è possibile estrarre alcuna altra informazione da essi, l'approccio ottimo per classificarli sarebbe fornire una risposta totalmente a caso.

La teoria bayesiana di decisione svolge un ruolo importante solo quando risultano conosciute alcune informazioni a priori sugli oggetti.

Come primo passo, si supponga di non avere comunque conoscenza alcuna su come siano fatti i frutti, ma si sa che l'80% della frutta sono mele ed il resto siano arance. Se questa è l'unica informazione su cui basare la decisione, istintivamente si tenderà a classificare la frutta come mela (il classificatore ottimo): ogni frutto verrà classificato come mela in quanto, in mancanza di altre informazioni, è l'unico modo per minimizzare l'errore. Le informazioni a priori in questo caso sono le probabilità che il frutto scelto sia una mela o un'arancia.

Esaminiamo a questo punto il caso in cui sia possibile estrarre qualche informazione in più dalla scena osservata. Il concetto di Bayes applicato alla classificazione è molto intuitivo anche da questo punto di vista: se osservo una particolare caratteristica misurabile dell'immagine $x$ (features) riesco a stimare la probabilità che tale immagine rappresenti una certa classe $y_i$ a posteriori dell'osservazione. Sotto questo punto di vista i classificatori bayesiani forniscono esattamente la probabilità che il vettore di dati in ingresso rappresenti la determinata classe in uscita.


Subsections
Paolo medici
2025-03-12