이론과 실제가 다를 수 있지만, 차원을 줄여서 얼굴인식에 쓸 수 있겠다고 막연히 생각했던 PCA(Principal Component Analysis) 알고리즘이 스마트팩토리에서 활용되는 알고리즘이란 걸 알게 되어, 엇! PCA가 뭐지? 알아봐야겠다는 생각에 오늘은 차원의 저주를 해결한다는, 얼굴인식에 활용된다는 주성분 분석, PCA(Principal Component Analysis) 에 대해 알아보려고 한다.
주성분 분석으로 다차원 특징 벡터의 정보를 유지하며, 저차원으로 차원을 축소하는 다변량 데이터 분석 기법으로, 안면인식 등 영상인식에서 널리 활용 됨 |
(출처: 아이리포카페 http://café.naver.com/itlf)
PCA의 개념에 소개한 다변량 데이터 분석 기법은 변수들 간의 인과관계를 규명하거나, 변수들 간의 상관 관계를 이용하여 변수들을 축약하거나 개체들을 분류하는 분석 기법이다. 변수들 간의 인과관계를 규명하는 다변량 데이터 분석기법으로는 다중회귀분석(Multiple Regression Analysis), 다중 분산분석(Multiple ANOVA) 이 있으며, 변수들을 축약하거나 개체들을 분류하는 분석기법으로는 PCA 등을 활용하기도 한다.
다변량 데이터 분석 기법 |
인과관계 분석 |
|
|
||
변수들의 축약 |
|
이와 같이 다변량 데이터를 대상으로 하는 데이터 분석에서는 여러 변수들 간의 상관관계를 소수의 주성분으로 차원을 축소하여 데이터를 쉽게 이해할 수 있고, IoT의 활성화로 다수의 센서를 통해 수집되는 센서데이터를 주성분분석으로 차원을 축소한 후에 시계열 분포나 추세의 변화를 분석하면 스마트팩토리에서 기계의 고장을 예측, 사전 감지하는데 활용할 수 도 있다고 한다. 그래서 스마트팩토리의 데이터 분석에 PCA알고리즘이 활용된다.
PCA를 이해하기 위해 기본적인 수학지식으로 공분산(covariance), 고유값(eigen value), 고유벡터(eigen vector)등의 개념 이해가 필요하다. 각각을 알아보고, PCA알고리즘 동작 절차 및 얼굴인식에 활용된 사례를 알아본다.
상세한 내용은 첨부파일을 확인하세요.