Il piano epipolare

Nei capitoli precedenti è stato fatto più volte notare che da una sola immagine non è possibile ottenere le coordinate mondo dei punti che compongono l'immagine, senza informazioni addizionali.

Figura 9.1: Geometria epipolare tra due camere: $\mathbf {t}_1$ e $\mathbf {t_2}$ sono i pin-hole, $\mathbf {e}_1$ e $\mathbf {e}_2$ sono gli epipoli e il punto mondo $\mathbf {x}$ viene proiettato nei due punti immagine $\mathbf {p}_1$ e $\mathbf {p}_2$ rispettivamente. Tutti i punti coinvolti appartengono al medesimo piano.
Image fig_epipolar

L'unica cosa che un generico punto dell'immagine $\mathbf {p}$ può fornire, data l'equazione (8.19) della camera pin-hole, è una relazione tra le (infinite) coordinate mondo $\mathbf {x}$ sottese al punto immagine ovvero il luogo delle coordinate mondo che proiettate darebbero esattamente quel particolare punto immagine. Tale relazione è l'equazione di una retta passante per il pin-hole $\mathbf{t}$ e per il punto sul sensore corrispondente al punto $\mathbf {p}$ immagine. Riportando nuovamente l'equazione (8.19), è facile vedere qual'è la dipendenza tra i parametri della camera i-esima, il punto immagine $\mathbf {p}_i$ e la retta che rappresenta tutti i possibili punti mondo $\mathbf {x}$ sottesi a $\mathbf {p}_i$:

\begin{displaymath}
\mathbf{x} = \lambda (\mathbf{K}_{i}\mathbf{R}_{i})^{-1} \ma...
...t}_{i} = \lambda \mathbf{v}_{i}(\mathbf{p}_i) + \mathbf{t}_{i}
\end{displaymath} (9.7)

dove $\mathbf{v}_i$ ha lo stesso significato che aveva in equazione (8.20), vettore direzione tra il pin-hole e il punto sensore. Come si evince sia dall'esperienza che dalla relazione lineare che lega tali punti, si può dire che il punto sotteso $\mathbf {x}$ è conosciuto a meno di un fattore di scala $\lambda$.

Nel caso della visione stereo abbiamo due sensori e pertanto dobbiamo definire due sistemi di riferimento con parametri $\mathbf{K}_1\mathbf{R}_1$ e $\mathbf{K}_2\mathbf{R}_2$ rispettivi e posizione dei pin-hole $\mathbf{t_1}$ e $\mathbf {t_2}$ espressi sempre in coordinate mondo.

La retta (9.7), luogo dei punti mondo associabili al punto immagine $\mathbf {p}_1$ visto nel primo sistema di riferimento, può essere proiettata nella vista della seconda camera:

\begin{displaymath}
\begin{array}{rl}
\mathbf{p}_2 & = \lambda \mathbf{K}_2 \mat...
...\mathbf{K}^{-1}_1 \mathbf{p}_1 + \mathbf{e}_2 \\
\end{array}
\end{displaymath} (9.8)

dove compare una parte variabile, che dipende dal punto considerato e dal valore $\lambda$, e un vettore $\mathbf {e}_2$ sempre costante che non dipende dal punto considerato.

Questo punto costante è l'epipolo. L'epipolo è il punto di intersezione di tutte le linee epipolari e rappresenta la proiezione del pin-hole di una camera nell'immagine dell'altra ovvero il “punto di fuga” delle linee epipolari.

Date due camere le proiezioni delle coordinate dei pin-hole $\mathbf {t}_1$ e $\mathbf{t}_2$ sull'opposta immagine sono

\begin{displaymath}
\begin{array}{l}
\mathbf{e}_1 = \mathbf{P}_1 \mathbf{t}_2 = ...
...K}_2 \mathbf{R}_2 (\mathbf{t}_1 - \mathbf{t}_2) \\
\end{array}\end{displaymath} (9.9)

dove $\mathbf{P}_1$ e $\mathbf{P}_2$ sono le matrici proiettive. I punti $\mathbf {e}_1$ e $\mathbf {e}_2$ sono gli epipoli. Se nell'equazione (9.9) inseriamo le definizioni di posa relative espresse in (9.4), le coordinate immagine degli epipoli, intese come la proiezione su una immagine del pin-hole dell'altra camera, sono
\begin{displaymath}
\begin{array}{l}
\mathbf{e}_1 = \mathbf{K}_1 \mathbf{R}^{\t...
...thbf{t} \\
\mathbf{e}_2 = \mathbf{K}_2 \mathbf{t}
\end{array}\end{displaymath} (9.10)

sole funzioni della posa relativa tra le due camere.

La matrice $\mathbf{R}$, per costruzione, converte da coordinate camera 1 a coordinate camera 2 e $\mathbf{t}$ rappresenta la posizione del pin-hole della camera 1 espresso nel sistema di riferimento della camera 2.

Le rette generate dai punti della prima immagine passano tutte per uno stesso punto formato dalla proiezione del pin-hole $\mathbf {t}_1$ sulla seconda immagine: di fatto il punto in coordinate mondo e i due epipoli creano un piano (il piano epipolare) dove vivono le possibili soluzioni, i punti in coordinate camera, del problema della ricostruzione tridimensionale (figura 9.1).

La geometria epipolare è la geometria che lega due immagini acquisite da due punti di vista differenti. Le relazioni che intercorrono tra le immagini tuttavia non dipendono dalla scena osservata ma dipendono solamente dai parametri intrinseci delle camere e dalle pose relative.

Per ogni punto osservato, il piano epipolare è il piano formato dal punto in coordinate mondo e dai 2 centri ottici.

La linea epipolare è l'intersezione tra il piano epipolare e il piano immagine nella seconda immagine. Di fatto il piano epipolare interseca in entrambe le immagini il piano nelle rette epipolari e definisce le corrispondenze tra le linee.

Nelle prossime sezioni verrà discusso sia come ricavare la retta lungo la quale un punto appartenente ad una immagine deve trovarsi in un'altra immagine, sia come dati due (o più) punti omologhi ottenere il punto tridimensionale corrispondente.

Paolo medici
2025-03-12