Harris è un individuatore di punti notevoli non invariante alle variazioni di scala. Per superare questa serie di limiti, Lindeberg (Lin14,Lin94) introduce il concetto di selezione automatica della scala, permettendo di individuare i punti caratteristici a un determinato livello di risoluzione. La rappresentazione piramidale della scena, algoritmo computazionalmente efficiente ampiamente usato in precedenza, diventa di fatto un caso particolare di questa rappresentazione scala-spazio.
Sia la gaussiana bidimensionale di varianza
, di equazione
![]() |
(5.7) |
La convoluzione tra l'immagine
e la gaussiana
![]() |
(5.8) |
È da notare che applicare un filtro gaussiano a un immagine non crea nuove strutture: tutta l'informazione generata dal filtro era già contenuta nell'immagine originale.
![]() ![]() ![]() ![]() ![]() ![]() |
Il fattore di scala è un numero continuo ma, per motivi computazionali, vengono usati passi discreti di questo valore, normalmente successioni esponenziali,
come
o
.
Applicare a una immagine scala-spazio un operatore derivata, per la proprietà commutativa tra la convoluzione e la derivata, è uguale ad eseguire la convoluzione dell'immagine originale con la derivata della gaussiana:
![]() |
(5.9) |
Alcuni operatori interessanti per trovare punti caratteristici sono per esempio il modulo del gradiente , il laplaciano
e il determinante dell'hessiana
.
Tutti questi operatori sono invarianti alle rotazioni, ovvero il punto di minimo/massimo esiste indipendentemente dalla rotazione che assume l'immagine.
Tra questi operatori, uno molto diffuso per individuare punti caratteristici è il Laplaciano della Gaussiana (LoG) normalizzato (scale-normalized Laplacian operator):
![]() |
(5.10) |
Attraverso l'operatore LoG, è possibile individuare punti caratteristici come massimi o minimi locali nelle coordinate spaziali e scala.
Per esempio, un cerchio di raggio ha la massima risposta al laplaciano al fattore di scala
.
Lowe (Low04), nell'algoritmo Scale-invariant feature transform (SIFT), per aumentare le prestazioni, approssima il Laplaciano della Gaussiana (LoG) con una Differenza tra Gaussiane (DoG):
![]() |
(5.11) |
Questo procedimento è più performante in quanto l'immagine gaussiana a scala può venire calcolata dall'immagine gaussiana
applicando un filtro
, più piccolo e perciò nel complesso molto più veloce rispetto ad eseguire la convoluzione
con l'immagine originale.
Se in LoG i punti caratteristici erano i minimi/massimi locali, sia nello spazio che nella scala, dell'immagine del laplaciano, in questo caso i punti caratteristici sono i punti minimo e massimo nell'immagine differenza tra le immagini scala
attraverso le quali viene processata l'immagine (figura 5.4).
![]() |
Con l'introduzione del passo , il dominio della variabile
viene di fatto suddiviso in passi logaritmici discreti, raccolti in ottave, e ogni ottava viene suddivisa in
sottolivelli.
In questo modo
assume i valori discreti
![]() |
(5.12) |
I punti caratteristici, trovati come massimo/minimo in scala e spazio, entrambi discreti, vengono interpolati usando una regressione a una quadrica tridimensionale per trovare il punto caratteristico con precisione subpixel e subscala.
Tra un ottava e quella successiva l'immagine viene sottocampionata di un fattore 2: oltre all'analisi a scale multiple all'interno di ogni ottava, l'immagine viene processata nuovamente nell'ottava successiva dimezzando la dimensione orizzontale e verticale e tale procedimento viene ripetuto più volte.
La seconda fase di un algoritmo di individuazione e associazione di punti caratteristici consiste nell'estrarre un descrittore per eseguire i confronti, descrittore centrato nel punto caratteristico individuato. Di fatto, per essere invariante alla scala il descrittore deve essere estratto al medesimo fattore di scala associato al punto caratteristico.
Per essere invariante invece alla rotazione il descrittore deve essere estratto da una immagine che ha subito una qualche forma di normalizzazione rispetto alla direzione dominante estratta in intorno del punto valutato.
Da questa immagine ruotata alla scala del punto caratteristico è possibile estrare un descrittore che da importanza ai bordi nell'intorno per essere infine inviariante alla luminosità.
Tra le innumerevoli varianti va segnalato PCA-SIFT che usa PCA per ridurre le dimensioni del problema a un descrittore di soli 36 elementi. PCA viene usato in una fase precedente di addestramento.
Paolo medici