ZCA

PCA è una tecnica che permette di decorrelare le componenti ma questo non impedisce agli autovalori di essere essere differenti. Se si forzano tutti gli autovalori ad essere uguali (si veda anche 2.4.1), e di fatto viene cambiata l'unita di misura, in modo tale che tutte le componenti principali siano uguali (le varianze siano uguali) la distribuzione viene detta sferizzata e il procedimento viene indicato come sbiancamento (whitening) dei dati.

$\mathbf{W}$ è chiamata matrice di sbiancamento (whitening matrix) ed è indicata come la soluzione Zero Components Analysis (ZCA) dell'equazione

\begin{displaymath}
\mathbf{Y}^{\top} \mathbf{Y} = \mathbf{I}
\end{displaymath} (2.77)

Dopo la trasformazione di sbiancamento, i dati, oltre ad avere media zero e decorrelati, avranno covarianza identità.

La matrice sbiancata dalla PCA è ottenuta come

\begin{displaymath}
\mathbf{X}_{PCA} = \mathbf{V}^{\top} \mathbf{X}^{\top} = \mathbf{S} \mathbf{U}^{\top}
\end{displaymath} (2.78)

ovvero $\mathbf{W}_{PCA} = \mathbf{V}^{\top}$ mentre la matrice sbiancante dalla ZCA si può ottenere da
\begin{displaymath}
\mathbf{X}_{ZCA} = \boldsymbol\Delta^{-1} \mathbf{X}_{PCA}=...
...}^{-1} \mathbf{V}^{\top} \mathbf{X}^{\top} = \mathbf{U}^{\top}
\end{displaymath} (2.79)

ovvero $\mathbf{W}_{ZCA} = \mathbf{S}^{-1} \mathbf{V}^{\top}$ ma soprattutto il risultato notevole $\mathbf{X}_{ZCA} = \mathbf{U}^{\top}$.

È da notare che la matrice dopo la trasformazione PCA potrebbe avere un numero di componenti inferiore ai dati di ingresso, mentre ZCA ha sempre lo stesso numero di componenti.

Paolo medici
2025-03-12