개별 항목의 통계적 결과와 전체 항목의 통계적 결과가 다르게 나타나는 현상을 심슨의 역설이라고 한다. 이는 주로 잘못된 사례수의 선택에서 발생하지만 이때 나타난 개별 항목의 비율과 전체 항목의 비율은 각각 그 의미를 지니고 있으므로 비록 그 결과가 모순이 된다고 할지라도 반드시 오류가 있다고 할 수는 없다. 그러므로 총괄자료로부터의 결과는 세분화된 자료로부터의 결과와 달라질 수 있으므로 전체 항목의 결과만으로 섣부른 결론을 내려서는 안 된다.
예제 1. 어떤 대학교에서 남녀별 합격자/불합격자 수를 다음과 같이 발표하였다. 이때 이에 대한 설명 중 옳은 것을 모두 고르면?
ㄱ. 대학교 전체로 봤을 때, 남자의 합격률이 여자의 합격률보다 더 높다.
ㄴ. 이공계열의 경우 여자의 합격률이 남자의 합격률보다 더 높다.
ㄷ. 어문계열의 경우 여자의 합격률이 남자의 합격률보다 더 높다.
ㄹ. 만약 총괄자료로부터의 결과가 그 범주를 더 세분화한 자료로부터의 결과와 모순이 된다면 이는 반드시 잘못 측정된 자료가 있음을 의미한다.
(1) ㄱ (2) ㄱ,ㄴ (3) ㄴ,ㄷ
(4) ㄱ,ㄴ,ㄷ (5) ㄱ,ㄴ,ㄷ,ㄹ
* simpson’s paradox를 묻는 문제이다.
ㄱ. 남자의 합격률이 70%, 여자의 합격률은 68%이므로 맞다.
ㄴ. 이공계열의 경우 남자의 합격률은 70%이지만 여자의 합격률은 80%이므로 여자의 합격률이 높다고 할 수 있다.
ㄷ. 어문계열의 경우 남자의 합격률은 60%이지만 여자의 합격률은 67%이므로 여자의 합격률이 높다고 할 수 있다.
ㄹ.simpson’s paradox는 사례수 선정의 문제점으로 인해 발생하는 것이므로 총괄자료의 결과와 세분화된 자료의 결과가 모순이 된다고 할지라고 반드시 잘못 측정된 자료가 있음을 의미하는 것은 아니다.
정답 : (4)
이승일 에듀 PSAT연구소장
2007-8-30 0:0:0 9면
Copyright ⓒ 서울신문 All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지







































