- 확률 추론 문제
- 예) 흡연 환자의 엑스레이 진단에서 양성이 나타났을 때 폐암일 확률은?
- 실제 상황에서 많이 나타남
- 확률 그래피컬 모델 (probabilistic graphical model)
- 그래프를 활용 해 확률 추론 문제를 해결하는 방법
- 대표적 예시
- 베이지안 네트워크, 마르코프 랜덤필드, RBM과 DBN
확률과 그래프의 만남
그래프 표현
- 노드: 확률 변수
- 예) 폐암일 확률일 경우, 흡연 여부, 엑스레이 결과 등
- 에지: 인과관계
- 인과관계가 있는 확률 변수들을 edge로 연결
- 그래프는 확률변수의 상호작용을 표현하는 뼈대
- 베이지안 네트워크
- 마르코프 랜덤필드
- 인과관계가 명확하지 않거나 없는 경우 사용
- 인과관계가 없는 문제를 다루므로 무방향 에지 사용
- DBN (Deep Belief Network)
- RBM (Restricted Boltzmann Machine)을 여러 층으로 쌓아 만듦
- 무향 그래프
그래프 분해와 확률 표현
- 완전 그래프
- 결합확률을 부여해야 함
- 확률을 완벽히 분석하기 위해 모든 확률변수에 관한 결합 확률 분포 필요
- 결합확률
- 현실적으로 모든 확률변수에 대한 결합확률 파악 불가능
- 상호작용을 분석해 관계가 있는 것들만 edge로 열결
- 그래프 분해
- 직접 상호작용하는 확률변수만 에지로 연결
- 베이지안 네트워크
- 마르코프 랜덤필드
- DBN
- 분해된 그래프에서 부분집합의 확률분포만 알면 됨
베이지안 네트워크
- 셋 중 가장 엄격한 확률 모델
- 간접적인 확률 연산이 아닌 데이터로부터 직접 확률 추정
- 인과관계를 조건부 확률로 표현