- 지도 학습: 모든 훈련 샘플 레이블 有
- 비지도 학습: 모든 훈련 샘플 레이블 無
- 준지도 학습: 반반
- 매니폴드 가정 (manifold hypothsis)
- 매니폴드 = 저차원 sub-space
- 데이터집합은 하나의 매니폴드 OR 여러 개의 매니폴드를 구성
- 모든 샘플은 매니폴드와 가까운 곳에 존재 가정
- 매끄러움 가정 (smoothness hypothesis)
비지도 학습의 세가지 일반 과업
- 군집화 (Clustering)
- 유사한 샘플을 모아 묶음
- 응용: 맞춤 광고, 영상 분할 등
- 밀도 추정
- 데이터로부터 확률분포를 추정
- 응용: 분류, 생성 모델 구축 등
- 공간 변환
- 특징공간을 저차원 또는 고차원으로 변환
- 응용, 데이터 가시화, 압축, 추출 등
군집화 (Clustering)
k-평균 알고리즘 (k-means)
- 원리 단순, 성능 좋음
- 군집 개수 알려줘야함
- 알고리즘
- 임의의 중심을 k개 지정
- 데이터들을 가장 가까운 군집 중심에 배정
- 군집 중심을 배정된 데이터들에 의해 수정
- 목적함수를 최소화하는 알고리즘
- 초기 random center에 민감
- 중심이 달라지면 다른 결과 경우 有
- 다중 시작 k-평균
- k-평균 여러개 실행 → 가장 적합한 결과 선택
EM
- Expectation Maximization Algorithm