백분율의 배수 차이에 너무 많은 의미를 부여
의료 관련 기사에서 자주 볼 수 있는 함정인데, 예를 들어 A그룹과 B그룹을 비교했을 때 암 발생률 차이가 2배였습니다. A군이 특정 음식을 주로 먹는 집단이고 , 특정 음식을 먹지 않은 B군의 암 발생률이 A군의 2배라면 이를 근거로 특정 음식이 항암 효과가 있다는 헤드라인이 나옵니다. 여기서 알아낸 것은 실제 암 발생률이 A그룹의 경우 1% B그룹의 경우 2% 였다면 이중 차이는 사실상 아무 의미가 없다는 것입니다. 물론 의료정책 수립의 관점에서 1~2%의 차이가 있더라도 전국적으로 엄청난 숫자이며, 출생 데이터를 기반으로 한 이러한 통계는 중요한 자료입니다. 기사 자체가 거짓은 아니지만 신중한 해석을 필요로 합니다. '아버지가 나이가 많으면 약한 아이가 태어날 확률이 높다' 이 글의 내용을 보면 가장 어린 그룹인 25~34세 그룹에서도 미숙아 출산 확률이 10%였고 가장 나이가 많은 그룹인 55세 그룹이 발견됐습니다. 물론 뒤집어 보면 84% 정도가 건강한 아이들입니다.
국민 정서상 민감한 사회적 이슈를 다룰 때 쉽게 범할 수 있는 오류입니다. 2018년 국정감사에서 일반인의 11배 연예인 보충역 전환율을 기준으로 연예인이 특권층이라는 결론을 내려 문제를 삼은 정치인들이 있었습니다. 물론 몰래 비리를 저지르는 경우도 있겠지만 실제로 보조역으로 전환된 연예인은 5명에 불과했습니다. 기사에 나온 표를 참고하면 병역특례 관리 대상 연예인의 5.81%가 실제 현역으로 간 연예인은 90%가 넘는다는 뜻입니다. 여기서 일반인 수의 11배 같은 경우인 1195명으로 일반인 비율이 0.52%달한다는 점을 근거로 합니다. 인원수만 놓고 비교하면 압도적으로 많은 일반 인구가 보조역할로 전환된 셈입니다. 즉 연예인의 표본 수가 너무 적었다고 볼 수 있습니다. 보조역으로 전환된 연예인이 총 5명, 전체의 5.81%인 경우 연예인의 표본은 86명으로 애초에 1% 미만이 나올 수 없다는 의미입니다. 따라서 보충역으로 전환된 연예인 1명만 일반인의 2배에 달한다는 계산이 나오고, 반대로 단 한 명도 없었다면 0%라는 계산이 나옵니다. 일반 국민의 11배, 일반 국민의 절반 수준인 5명만 차이가 나는 등 비중이 크게 요동칠 수 있다는 얘기입니다. 반면 일반인 수는 수십 명 안팎 이어서 보조역으로 전환된 인원이 압도적으로 많은 반면 비율은 낮습니다. 이 경우 어차피 5명 정도의 변화는 큰 영향을 미치지 못합니다. 따라서 숫자에만 초점을 맞추면 실제보다 더 과장된 문제를 인식할 위험이 있습니다. 성차별 문제를 다룰 때 쉽게 범할 수 있는 오류이기도 합니다.
철저한 점검과 조사로 인한 통계 사례 증가
이 역시 의료 관련 통계자료를 열람할 때 잘못 해석하기 쉬운 사례로 갑상선암 논란이 대표적입니다. 물론 통계자료 자체가 잘못된 것은 아니며, 이를 접한 사람들 대부분이 이를 확대 해석하고 있습니다. 과거에는 병원 문턱에 도달하지 못하고 조기 사망하는 사람이 많아 제대로 된 암 통계가 있을 수 없었지만 의료 환경이 개선되고 국민의 인식 수준이 높아지면서 최근에는 자연스럽게 갑상선암 발병률이 높아지고 있습니다. 하지만 이 점을 고려하지 않고 우리나라 환경오염이 악화돼 암 발생률이 높아진다고 막연하게 오해하는 사람들이 있습니다.
노사와 관련된 통계도 고려해야 하는데, 기대수명이 짧아 조혼이 많았던 시절에는 약품 수준이 낮아 유산하는 사례가 많았을 것이기 때문에 애초에 통계에 포함 되지 않은 아이들이 많았을 수도 있습니다. 물론 나이가 어릴수록 건강한 아이를 낳을 확률이 높은 것은 사실이지만, 조혼 시절에 건강한 아이가 더 많았다고 단정하기는 어렵습니다. 게다가 그 시절에는 35세가 되기 전에 사망한 여성이 많아 노동 통계를 작성하지 못하는 경우도 있었을 것입니다. 노산 문서에 나타난 바와 같이 현재 노산이 증가하는 주요 원인 중 하나는 의학의 발달로 인해 여전히 안전하게 태어난 아기가 많다는 것입니다. 당연히 의료환경이 좋을수록 관련 통계가 많이 작성 되고 관련 대책도 철저히 수립됩니다.
앞 절에서 언급한 기사에서 볼 수 있듯이, 이러한 통계는 당연히 공식 데이터에 기초합니다. 따라서 미성년자가 몰래 아기를 낳아 유기 또는 낙태했다면 통계는 나오지 않을 가능성이 높습니다. 또한 기형아 출신 관련 통계의 경우 아이가 태어나기도 전에 기형아를 출산할 수 있다는 우려 때문에 몰래 낙태하는 사례가 많다는 점을 고려해야 합니다. 우리나라는 유전질환에 대해서는 낙태가 허용되지만 다훈증후군은 원칙적으로 낙태가 불법입니다. 당연히 이런 상황을 감당할 수 있는 부부만 아이를 갖게 되는데, 이 경우 연상연하 커플이 관련 통계에 잡힐 가능성이 큽니다. 이와 같은 상황에서 범죄 통계의 상당 부분인데, 사기 관련 통계의 경우 2010년대 중반 국내 여러 언론이 한국을 사기 국가라고 비판한 기사를 무분별하게 수입하기도 했습니다.
'일상생활' 카테고리의 다른 글
추론통계 - 표본분표 알아보기 (0) | 2022.08.22 |
---|---|
통계학 하위 학문 추론 통계 (0) | 2022.08.20 |
통계의 함정 - 편향 (0) | 2022.08.17 |
통계의 함정 - 조사를 바로 잡기 (0) | 2022.08.16 |
통계의 함정 - 섣부른 판단 (0) | 2022.08.16 |
댓글