평균 회귀 · June 27, 2026

최고점 다음 시험이 내려가는 데는 이유가 없다

키 큰 부모에게서 난 아이는 대개 부모만큼 크지 않다. 키 작은 부모의 아이는 부모보다 조금 더 크는 쪽으로 기운다. 19세기 영국의 프랜시스 골턴은 부모와 자식 930쌍의 키를 재면서 이 경향을 발견하고 평범함으로의 회귀라 불렀다. 지금은 평균으로의 회귀라는 이름으로 통한다.

이것은 유전의 신비가 아니라 측정과 우연이 얽힌 통계 현상이다. 극단적인 값이 나온 뒤에는 그보다 덜 극단적인 값이 따라오기 쉽다. 이 단순한 성질을 모르면 우연의 출렁임을 자꾸 누군가의 공이나 탓으로 돌리게 된다.

극단은 오래 머물지 않는다

어떤 결과든 실력과 운이 함께 작용한다. 시험에서 최고점을 받은 학생은 아는 것이 많았을 뿐 아니라 그날 운도 따랐을 가능성이 크다. 헷갈리던 문제에서 찍은 답이 맞고 컨디션도 좋았던 식이다. 다음 시험에서 실력은 그대로여도 운은 평균 쪽으로 되돌아온다. 그래서 점수도 조금 내려간다.

반대로 바닥을 친 성적도 다음에는 살짝 오르기 쉽다. 가장 낮은 값에는 운이 유난히 나빴던 부분이 섞여 있고 그 불운은 다음번에 그대로 반복되지 않는다. 변화의 원인을 무언가의 개입에서 찾고 싶어지지만 실제로는 우연의 평형이 작동한 결과일 때가 많다. 야단을 친 뒤 성적이 올랐다고 해서 야단이 효과를 냈다고 단정하면 회귀를 인과로 착각한 것이다.

이 착각은 일상 곳곳에 숨어 있다. 컨디션이 최악이던 날 먹은 약이 유난히 신통하게 느껴지고 부진하던 선수가 코치 교체 직후 살아나는 듯 보인다. 바닥을 친 값은 어차피 위로 향하던 참이었다. 효과를 입증하려면 그냥 좋아졌다는 사실만으로는 부족하고 가만히 두었을 때보다 더 좋아졌는지를 따져야 한다.

스포츠 잡지 표지에 실린 선수가 이후 부진에 빠진다는 속설도 같은 원리로 설명된다. 표지에 오를 만큼 뛰어난 활약은 실력에 행운이 겹친 정점이었고 그 행운은 오래가지 않는다. 저주가 아니라 회귀다.

평균을 알아야 폭이 보인다

Galton regression scatter parent child height

회귀를 제대로 읽으려면 흩어짐의 크기를 함께 봐야 한다. 자료가 평균 둘레에 얼마나 퍼져 있느냐에 따라 극단값이 되돌아오는 정도가 달라진다. 분산이 큰 집단일수록 운의 진폭이 커서 회귀도 더 두드러진다. 운의 비중이 클수록 회귀의 힘도 세진다. 순전히 운으로 갈리는 일이라면 이번에 최고였던 대상이 다음에 평균 근처로 돌아올 가능성이 매우 크다.

같은 일을 길게 반복해 보면 운의 몫이 어디로 모이는지가 드러난다. 비율이 안정된 값으로 수렴하는 데서 확률을 읽는 빈도주의의 눈으로 보면 극단은 결국 평균에 자리를 내준다. 그래서 한 번의 관측만으로 판단하면 위험하다. 작은 표본에서 극단을 골라낸 뒤 다음 측정이 평범해졌다고 놀라는 일은 회귀를 모르는 데서 온다.

데이터를 오해하지 않으려면

두 시점의 값이 완벽하게 비례하지 않는 한 회귀는 늘 끼어든다. 골턴이 부모와 자식의 키에서 본 것이 바로 이 불완전한 상관이었다. 상관이 약할수록 회귀의 힘은 세지고 상관이 완벽에 가까울수록 회귀는 사라진다. 골턴이 흩어진 점들 사이에서 찾아낸 이 규칙성은 훗날 자료가 종 모양으로 모이는 까닭을 밝힌 중심극한정리와도 한 줄기로 이어졌다. 그래서 어떤 정책이나 처방의 효과를 평가할 때는 손대지 않은 비교 집단을 따로 두어야 한다. 평균으로의 회귀를 통계 현상으로 이해해 두면 우연의 출렁임을 실력이나 개입의 성과로 오독하는 일이 줄어든다.

Scroll to Top