Ricostruzione tridimensionale e omografia

L'equazione (9.21) è facilmente esprimibile in forma omogenea. La matrice che permette dalle coordinate immagine-disparità di ricostruire direttamente le coordinate del punto tridimensionale espresso nel sistema di riferimento camera è

\begin{displaymath}
\begin{bmatrix}
\tilde{x}  \tilde{y}  \tilde{z}  1
\...
...x} = \mathbf{Q} \begin{bmatrix}
u  v  d  1
\end{bmatrix}\end{displaymath} (9.22)

mentre la sua inversa
\begin{displaymath}
\begin{bmatrix}
u  v  d  1
\end{bmatrix} =
\begin{b...
...matrix}
\tilde{x}  \tilde{y}  \tilde{z}  1
\end{bmatrix}\end{displaymath} (9.23)

è la matrice che permette di proiettare un punto da coordinate camera a coordinate immagine-disparità (sono matrici conosciute a meno di un fattore moltiplicativo, perciò possono essere espresse in diverse forme). La ricostruzione tridimensionale del punto immagine-disparità nel sistema di riferimento mondo, equazione (9.17), è equivalente. La matrice $\mathbf{Q}$ è chiamata reprojection matrix (FK08).

In condizioni reali, essendo la camera rototraslata rispetto alle condizioni ideali, è sufficiente moltiplicare la matrice $\mathbf{Q}$ per la matrice $4 \times 4$, rappresentante la trasformazione tra coordinate camera a mondo, per ottenere una nuova matrice che permette di passare da coordinate disparità a coordinate mondo e viceversa.

L'utilizzo di tale formalismo permette di trasformare punti disparità acquisiti da coppie di camere posizionate in punti di vista differenti (ad esempio una coppia stereo che si sposta nel tempo o due coppie stereo rigidamente connesse tra loro). In questo caso la relazione che lega punti disparità acquisiti nei due punti di vista è anche rappresentata da una matrice $4 \times 4$:

\begin{displaymath}
\mathbf{H}_{2,1} = \mathbf{Q}_1^{-1} \begin{bmatrix}
\math...
...{1}{}{\mathbf{t}}_{2,1} \\
0 & 1
\end{bmatrix} \mathbf{Q}_2
\end{displaymath} (9.24)

che permette di trasformare $(u_2,v_2,d_2)$ in $(u_1,v_1,d_1)$ (è una trasformazione omografica in 4 dimensioni del tutto simile a quelle in 3 dimensioni viste finora). Da notare che si è usato come posa $\left( \mathbf{R}, \mathbf{t} \right)$ la sintassi di equazione (1.64) volendo esprimere il punto dal sistema di riferimento 2 nel sistema 1. Siccome tutti i punti coinvolti sono espressi in coordinate camera se si hanno trasformazioni tra sensori espresse in coordinate mondo, come normalmente accade, occorre aggiungere il cambio di sistema di riferimento. Tale classe di trasformazioni vengono normalmente indicate come 3D Homographies.

Paolo medici
2025-03-12