Die Whitening-Transformation bezeichnet eine lineare Transformation, bei der ein Vektor von Zufallsvariablen mit bekannter Kovarianzmatrix in eine Reihe von neuen Variablen umgewandelt wird, deren Kovarianzmatrix der Einheitsmatrix gleicht. Angestrebt wird ein Zustand, in dem die einzelnen Variablen unkorreliert sind und jeweils eine Varianz von 1 haben. Die Transformation wird als „Whitening“ bezeichnet, da nach der Umwandlung die Verteilungseigenschaften des Inputvektors denen des Weißen Rauschens entsprechen. Ziel ist eine Stetige Gleichverteilung.
Einige andere Transformationen stehen in enger Beziehung zum Whitening:
- die Dekorrelationstransformation entfernt nur Korrelationen aber lässt die Varianzen intakt,
- die Standardisierungstransformation setzt die Varianzen 1 aber lässt die Korrelationen intakt,
- die Coloring-Transformation übersetzt einen Vektor mit „weißen“ Zufallsvariablen in einen Zufallsvektor mit einer spezifischen Kovarianzmatrix.
Definition
Angenommen ist ein Zufalls-Spalten-Vektor mit nicht-singulärer Kovarianzmatrix und Mittelwert . Dann führt die Transformation mit einer Whitening-Matrix , welche die Bedingung erfüllt, zu einem „whitened“ Zufallsvektor mit einheitlicher diagonaler Kovarianz.
Es gibt eine unendliche Anzahl möglicher Whitening-Matrizen . Gebräuchliche Auswahlen sind (Mahalanobis or ZCA whitening), die Cholesky-Zerlegung von (Cholesky whitening) oder die Eigenvektoren von (PCA whitening).
Kessy et al. (2018) demonstrieren, dass optimale Whitening-Transformationen durch Untersuchen der Kreuzvarianzen und Kreuzkorrelationen von und erkannt werden können. Zum Beispiel, die singuläre optimale Whitening-Transformation zum Erreichen der maximalen komponentenweisen Korrelation zwischen dem ursprünglichen und geweißten wird durch die Whitening-Matrix erzeugt. Hierbei ist die Korrelationsmatrix und die Varianzmatrix.
Eine Datenmatrix „weißen“
Das Whitening einer Datenmatrix folgt den gleichen Transformationen wie Zufallsvariablen. Eine empirische Whitening-Transformation erfolgt durch die Schätzung der Kovarianz (z. B. durch die Maximum-Likelihood-Methode) und anschließender Konstruktion einer entsprechend geschätzten Whitening-Matrix (z. B. durch die Cholesky-Zerlegung).
Siehe auch
- Hauptkomponentenanalyse
- Kanonische Korrelation
- Symmetrische Orthogonalisierung
Weblinks
- courses.media.mit.edu (PDF)
- The ZCA whitening transformation. (PDF; 4,0 MB) Appendix A von A. Krizhevsky: Learning Multiple Layers of Features from Tiny Images.
Einzelnachweise



