pozitivní korelace - jde v diagonále a skoro k 1, negativní je naopak a třeba -9, žádná korelace má záznamy rozptýlené všude
cílem PCA je zjednodušit popis lineárné závislých (tj. korelovaných znaků), a to rozkladem matice dat do matice strukturní (využité hlavní komponenty) a matice šumové (nevyužité hlavní komponenty)
Využitím PCA je snížení dimenze úlohy čili redukce počtu znaků bez velké ztráty informace, užitím pouze prvních několika hlavních komponent.
Hlavní komponenty jsou nekorelované.
latentní proměnná / hlavní proměnná
určení počtu komponent:
musí být větší než 1
tolik komponent, které vysvětlují např, 90 % původní variability