Calibrazione con il metodo Sturm-Maybank-Zhang

Zhang (Zha99) e contemporaneamente Sturm e Maybank (SM99) individuano un metodo per ottenere una equazione lineare per ricavare i parametri della camera, eseguendo anche un aggiornamento delle tecniche di calibrazione (sempre valide, ma ormai relative agli anni 80) fatte principalmente da Tsai (Tsa87) e altri (WM94).

Questa tecnica sfrutta il calcolo di diverse matrici omografiche $\mathbf{H}$ ottenute dall'osservazione di un piano (per esempio una griglia di calibrazione con marker equispaziati) e da queste cerca di ricavare i parametri intrinseci della camera in maniera esplicita. Come già discusso in precedenza la matrice $\mathbf{H}$, trasformazione omografica di un piano, possiede 8 gradi di libertà ma non è possibile direttamente ricavare i 10 parametri espliciti che l'hanno generata. Metodi per ottenere la matrice omografica date le corrispondenze tra punti immagine e punti del piano sono discussi in sezione 8.5.1.

La matrice $\mathbf{H}$ e in particolare l'equazione (8.30) può essere esplicitata come

\begin{displaymath}
\mathbf{H} = \begin{bmatrix}
\mathbf{h}_1 & \mathbf {h}_2 ...
...atrix}
\mathbf{r}_1 & \mathbf {r}_2 & \mathbf{t} \end{bmatrix}\end{displaymath} (8.68)

dove $\lambda$ è indicato per sottolineare la presenza di un fattore moltiplicativo, incognito, nel calcolo della matrice omografica. Concentriamo l'attenzione sulla parte di matrice di rotazione formata dai vettori colonna $\mathbf{r}_1$ e $\mathbf{r}_2$ ortonormali tra loro.

Nonostante la presenza del fattore $\lambda$ è infatti possibile esprimere delle relazioni basate sull'ortogonalità tra i vettori $\mathbf{r}_1$ e $\mathbf{r}_2$ in modo da forzare i seguenti due vincoli:

\begin{displaymath}
\begin{array}{l}
\mathbf{h}_1^{\top} \mathbf{W} \mathbf{h}...
...h}_1 = \mathbf{h}_2^{\top} \mathbf{W} \mathbf{h}_2
\end{array}\end{displaymath} (8.69)

avendo definito $\mathbf{W}$, tralasciando lo skew per semplicità, come
\begin{displaymath}
\mathbf{W} = (\mathbf{K}^{-1})^{\top} \mathbf{K}^{-1} = \beg...
...dfrac{u_0^2}{k_u^2} + \dfrac{v_0^2}{k_v^2} + 1\\
\end{bmatrix}\end{displaymath} (8.70)

matrice simmetrica. Tale equazione è l'equazione di una conica ed è in effetti l'equazione della “conica assoluta” (LF97).

Le 4 (o 5 incognite non trascurando lo skew) della matrice $\mathbf{W}$ sotto i 2 vincoli (8.69) possono essere risolte usando almeno 2 (o 3) piani diversi, ovvero matrici $\mathbf{H}$ le cui colonne non siano linearmente dipendenti tra loro.

Ottenuta la matrice $\mathbf{W}$, con la decomposizione di Cholesky si può determinare infine la matrice originale. Alternativamente Zhang fornisce le equazioni per ottenere i parametri intrinseci della camera direttamente dalla matrice $\mathbf{W}$. Si può infatti trasformare $\mathbf{h}_i^{\top} \mathbf{W} \mathbf{h}_j = \mathbf{v}_{ij}^{\top} \mathbf{w}$, con opportuni valori del vettore $\mathbf{v}_{ij}$ e con $\mathbf{w}$, vettore da determinare, con i valori non nulli della matrice triangolare superiore di $\mathbf{W}$. In questo modo il sistema di equazioni (8.69) si trasforma nella soluzione di un sistema lineare omogeneo in $\mathbf{w}$.

Determinati i parametri intrinseci e la matrice $\mathbf{K}$, per ogni matrice omografica $\mathbf{H}$ usata nella fase di ottimizzazione è possibile stimare la rotazione e la traslazione:

\begin{displaymath}
\begin{bmatrix}\mathbf{r}_1 & \mathbf{r}_2 & \mathbf{t} \end{bmatrix} = \lambda \mathbf{K}^{-1}\mathbf{H}
\end{displaymath} (8.71)

Le colonne $\mathbf{r}_1$ e $\mathbf{r}_2$ sono normalmente sufficienti per ricavare gli angoli di rotazione. Da ogni griglia è possibile ricavare tutti i parametri estrinseci e misurare in questo modo l'errore di riproiezione.

Il sistema nel suo complesso è comunque mal condizionato e difficilmente si giunge a una soluzione stabile dopo ripetute prove. I valori ottenuti attraverso questa tecnica lineare servono però come punto di inizio in una fase di Maximum Likelihood Estimation per minimizzare gli errori di riproiezione (sezione 8.5.6).

Una sola nota: Zhang nel suo articolo fa coincidere il Principal Point con il centro di distorsione, cosa generalmente non esatta.

Paolo medici
2025-03-12