PCA
개요
PCA는 데이터 집합을 분석하는 기법 중 하나로 우리말로 번역하면 주성분 분석이라고 한다. 아래 그림에서 대각선으로 분포되어 있는 2-dimensional 데이터에 대하여 가장 잘 표현하고 있는 주성준 벡터는 대각선 방향의 벡터(우상단 방향의 벡터)임을 알 수 있다.

위 그림에서처럼 주성분 벡터를 구하기 위해서는 주어진 2-dimensional 벡터 데이터를 이용하여 2차원 covariance matrix를 계산하고, 그 행렬(covarian matrix)에 대한 eigen vector를 구하면 된다.
유사한 방법으로 N-dimension 벡터에 대해서도 확장할 수 있으며, 역시나 그 벡터들을 가장 잘 표현하는 주성분을 추출하고 그 주성분 벡터로 원래 데이터들을 표현하면 원래 데이터의 차수(dimension)이 낮아져 데이터간 그룹핑이나 식별이 쉽게 될 수 있다. 이런 기법들을 얼굴 인식에 사용되기도 한다.
Recent Comments