Elementi di analisi per Visione Artificiale

Paolo Medici
Dipartimento di Ingegneria dell'Informazione di Parma

12. marzo 2025

Questo libro vuole essere una introduzione ragionevolmente sintetica ai fondamenti di geometria, algebra e statistica necessari alla comprensione e all'utilizzo delle tecniche più avanzate di visione artificiale. Come si vedrà, sono stati inseriti diversi elementi non propriamente di elaborazione di immagini ma che risultano utili a chi interessa sviluppare applicazioni complesse basate sull'elaborazione di immagini, coinvolgendo concetti come il tracking o la fusione sensoriale di alto livello. Per non appesantire la trattazione ho cercato, ove possibile, di non entrare nelle dimostrazioni dei diversi teoremi ma, con lo scopo di stimolare la curiosità, ha lasciato la loro trattazione al lettore. L'obiettivo originale di questo libro infatti non è mai stato quello di realizzare una trattazione rigorosa ed esaustiva dove spesso ci si perde in calcoli e dimostrazioni con il rischio di stancare il lettore e distogliere l'attenzione verso invece alcuni concetti importanti. Allo stesso modo non mi sono posto come obiettivo quello di voler parlare di ogni qualsiasi argomento relativo all'elaborazione di immagini e alla visione artificiale ma mi sono limitato di fatti a quei soli argomenti inerenti alle sperimentazioni che ho direttamente affrontato nelle mie attività di ricerca, di cui sono più confidente e su cui posso dare un minimo di contributo. La stesura di questo libro è stata infatti fortemente influenzata dalle mie aree di ricerca le quali riguardano principalmente applicazioni della Visione Artificiale alla percezione di robot e allo sviluppo e controllo di veicoli autonomi.

La Computer Vision è un campo della scienza estremamente stimolante, anche per i non addetti ai lavori. Il fatto stesso che nella visione artificiale geometria, statistica, ottimizzazione sono argomenti così strettamente correlati ne fa un ambito di studio completo e degno di interesse anche ad esterni alla materia. Questa ampia correlazione tra gli argomenti tuttavia non ha aiutato l'attività di divisione in capitoli di questo libro e di conseguenza i rimandi tra un capitolo e gli altri, come si vedrà, sono ampiamente diffusi.

Le citazioni inserite nel testo sono molto ridotte e faccio riferimento solo a testi che io ritengono fondamentali e, quando possibile, ho citato i primi che hanno proposto l'idea alla base della teoria: la lettura degli articoli citati in bibliografia è caldamente consigliata.

Ho introdotto, quando possibile, il termine inglese corrispondente al termine italiano non per anglofilia ma per suggerire le eventuali parole chiave da cercare su internet in modo da individuare argomenti collegati a quello trattato.

Per l'organizzazione di questo volume ho tratto spunto da diversi libri, libri di cui consiglio la lettura, tra cui “Multiple View Geometry” (HZ04) di Hartley e Zisserman, “Pattern Recognition and Machine Learning” (Bis06) e “Emerging Topics In Computer Vision” (MK04) redatto da Medioni e Kang. Per tematiche più strettamente legate all'elaborazione delle immagini, un ottimo libro, disponibile anche online, può essere “Computer Vision: Algorithms and Applications” di Szeliski (Sze10).

La sintassi matematica che verrà usata è minimalista:

Rimando infine all'appendice C per avere una breve carrellata sul significato dei simboli usati in questo libro.

È possibile trovare l'ultima versione di questo documento a http://www.ce.unipr.it/medici. Tutto il materiale di “Elementi di analisi per Visione Artificiale” è rilasciato sotto licenza Creative Commons 4.0. Il testo completo della licenza è disponibile, in inglese, alla pagina https://creativecommons.org/licenses/by-nc-sa/4.0/.

This document is a brief introduction to the fundamentals of geometry, algebra and statistics needed to understand and use computer vision techniques. You can find the latest version of this document at http://www.ce.unipr.it/medici. This manual aim to give technical elements about image elaboration and artificial vision. Demonstrations are usually not provided in order to stimulate the reader and left to him. This work may be distributed and/or modified under the conditions of the Creative Commons 4.0. The latest version of the license is in https://creativecommons.org/licenses/by-nc-sa/4.0/.

Copyright 2006,2025 Paolo Medici



Paolo medici
2025-03-12