기본수학
베이즈 정리
로-보-트
2024. 1. 1. 17:22
오늘은 통계학시간에 배웠지만, 실제로 왜 중요한지 몰랐던 베이즈 정리를 직관적으로 이해할 수 있도록 얘기 해보려 합니다.
베이즈 정리의 의의
- 베이즈 정리는 빈도기반 확률정의에서 신뢰기반 획률정의로의 관점 전환으로 부터 시작합니다.
- 빈도기반의 예시: 10회중 3번의 사건 발생하였다.
- 신뢰기반의 예시 : 그 주장이 30%의 신뢰성을 가지고 있다.
- 베이즈 정리는 간단히 말하면, 어떤 새로운 정보가 들어왔을때 그 신뢰성을 새롭게 갱신하기 위한 정리입니다.
- 예를들어, 사람이 감기에 걸릴 확률이 0.1%라고 해보겠습니다. 이때, 한 사람이 기침을하고 열이나는것이 관찰되었다면 우리는 감기가 걸렸을 확률을 70%로 신뢰성을 갱신할 수 있겠죠.
- 이처럼, 우리는 기존에 빈도적으로 단순히 사건을 바라봤던 관점에서 새로운 정보가 들어왔을때 신뢰성을 갱신하는 방향으로 관점을 전환시키게된 것 입니다.
베이즈 정리 공식
$$ P(H|E)=\frac{P(E|H)*P(H)}{P(E)} $$
여기서 H=Hypothesis 즉, 가설을 얘기하며 E는 새로운 정보입니다.
- H: 감기에 걸릴 확률, E: 기침, 열이 관측됨
P(H|E)는 사후확률(Posterior) 즉, E가 관측되어을때 H가 참일 확률.(주로 우리가 원하는 정보입니다.)
- 기침, 열이 발생하였을때 감기에 걸렸을 확률
P(H)는 사전확률(Prior) 즉, H가 참일 확률.
- 감기에 걸렸을 확률(아무런 정보가 존재하지 않음)
P(E|H)는 우도(likelihood) 즉, H가 참일때 E가 관측될 확률
- 감기에 걸렸을때, 열, 기침이 발생할 확률
로 간단히 표현할 수 있습니다.
이처럼, 베이즈 정리는 새로운 정보가 들어왔을때 어떤 가설들의 확률을 갱신한다는 관점을 잘 나타낸 정리입니다.
단순히, 수식으로만 이해하는 것이아닌 직관적으로 이해한다면 머신러닝에서 베이즈 정리가 왜 중요한지에대해 이해하실 수 있을 것 입니다.