믿음의 갱신 · June 20, 2026

증거가 들어올 때 믿음을 고치는 산수, 베이즈

드물게 발생하는 병을 잡아내는 검사가 있다고 하자. 정확도가 99퍼센트라 해도 검사에서 양성이 나온 사람이 실제로 그 병을 앓을 확률은 의외로 낮을 수 있다. 직관은 99라는 숫자에 압도되지만 답을 좌우하는 것은 그 병이 애초에 얼마나 드문가다. 이 어긋남을 깔끔하게 정리해 주는 도구가 베이즈 정리다.

먼저 알던 것과 새로 알게 된 것

베이즈의 뼈대는 단순하다. 우리는 어떤 일이 일어날 법한 정도를 미리 짐작하고 있다. 이것이 사전확률이다. 그러다 새 증거가 들어오면 그 짐작을 통째로 버리지도 그대로 두지도 않는다. 증거의 무게만큼 끌어올리거나 끌어내려 새 값을 만든다. 이렇게 갱신된 값이 사후확률이다.

숫자를 넣어 따라가 보면 분명해진다. 어떤 병이 만 명 중 한 명꼴로 나타난다고 하자. 검사가 병에 걸린 사람을 99퍼센트 잡아내고 건강한 사람도 99퍼센트 정확히 가려낸다고 하자. 만 명을 검사하면 실제 환자 한 명은 거의 양성으로 나오지만 건강한 9999명 가운데 1퍼센트인 약 백 명도 거짓 양성으로 나온다.

그러니 양성 판정을 받은 백한 명 가운데 진짜 환자는 한 명뿐이다. 양성이라는 새 증거에도 불구하고 실제로 병일 확률은 1퍼센트 안팎에 머문다. 병이 드물다는 사전 정보가 결과를 강하게 끌어내리기 때문이다. 한 번의 양성이 곧 확진을 뜻하지 않는 이유가 여기에 있다.

이 셈을 뒤집어 오용하면 법정에서도 위험한 결론이 나온다. 어떤 증거가 무죄인 사람에게서 우연히 나올 확률이 낮다는 사실을, 그 사람이 무죄일 확률이 낮다는 말로 바꿔 읽는 것이다. 두 확률은 전혀 다른 값인데도 자주 뒤바뀐다. 사전확률을 빼놓고 증거 하나만 들여다본 탓이다.

한 번의 결과로는 알 수 없다

확률을 무엇으로 볼 것인가는 해묵은 철학적 물음이다. 한쪽에는 같은 시행을 수없이 반복해 비율이 수렴하는 모습에서 확률을 읽는 빈도주의가 있다. 그쪽에서 확률은 긴 반복이 드러내는 객관적 비율이다. 베이즈 쪽은 다르다. 평생 한 번뿐인 사건에도 믿음의 정도라는 숫자를 매긴다.

내일 비가 올 확률이나 어떤 가설이 참일 확률처럼 반복이 불가능한 대상도 다룬다. 이 폭넓은 적용 덕분에 베이즈식 접근은 통계와 인식론을 가로지르는 믿음의 갱신 이론으로 자리 잡았다. 두 입장은 오래 논쟁해 왔지만 실전에서는 서로의 빈자리를 메운다.

직관이 헛디디는 자리

 

사람의 머리는 사전확률을 자주 무시한다. 생생한 증거 하나에 사로잡혀 배경이 얼마나 흔한지를 잊는다. 앞의 검사 이야기에서 99퍼센트라는 숫자에 휘둘려 양성을 곧 확진으로 받아들이는 것이 전형적인 실수다. 문이 열리고 정보가 더해질수록 답이 뒤집히는 몬티 홀 문제가 그토록 많은 사람을 당황시키는 까닭도 같다. 새 정보를 조건으로 받아 확률을 다시 계산하는 일에 우리는 본래 서툴다.

갱신된 확률은 결정으로도 이어진다. 각 선택의 결과에 그 확률을 곱해 기댓값을 따지면 어느 쪽이 유리한지 가늠할 수 있다. 검사 한 번의 양성에 곧장 큰 결정을 내리지 않고 추가 검사를 권하는 판단도 이 셈에서 나온다

bayesian probability conditional diagram

표본이 사전을 다듬는다

사전확률은 돌에 새긴 값이 아니다. 관측이 쌓이면 그 자체가 갱신된다. 작은 표본으로 출발하더라도 자료가 하나씩 들어올 때마다 믿음을 조금씩 옮기면 결국 현실에 가까운 값으로 수렴한다. 처음의 짐작이 거칠어도 증거가 충분하면 답은 제자리를 찾아간다.

이 점이 베이즈식 사고를 쓸모 있게 만든다. 완벽한 출발점을 요구하지 않는다. 거친 사전확률에서 시작해도 증거가 차곡차곡 그 값을 다듬어 나간다. 새 정보가 도착할 때마다 믿음을 어떻게 고쳐야 하는지를 한 줄의 관계식으로 못 박아 둔 것이 이 정리의 힘이다.

Scroll to Top