표본 분표
만약 우리가 한국 직장인들의 평균 연봉에 대해 알고 싶다면, 모든 직장인들의 데이터를 확인하는 것은 불가능하거나 매우 어려울 수 있습니다. 이 경우 별도로 200여 명의 직장인만을 무작위로 뽑아 평균 연봉을 구한 뒤. 이 통계를 토대로 당초 관심이 있었던 인구 평균을 유추해 볼 수 있습니다. 그러나 이러한 논리는 빠르게 문제에 직면하게 됩니다. 어떻게 샘플을 추출하는지에 대해 주변 지인들에게서 지식을 추출하는 것은 너무 주관적이고 편 항적입니다. 그래서, 무작위 체크를 통해, 컴퓨터에서 그것을 완전히 무작위 할 수 있다면, 그것이 해결이 되는가가 의문입니다. 때로는 그조차도 문제가 될 수 있습니다. 정말 운이 없고 극단적인 사람만 랜덤으로 표본으로 선정될 위험이 있기 때문입니다. 최대한 무작위로 표본 추출한 뒤 김앤장 등 로펌만 모이면 연봉은 평균 1억 원이 넘습니다.
표본 평균과 모집단 평균
표본 평균과 모집단 평균의 차이로 정의되는 표본오차는 이상하게 튀는 표본에서 특히 더 심각해집니다. 그러나 학자들이 표본 오차를 줄이려고 할 때 표본 오차는 모집단 크기에 비해 표본오차가 커짐에 따라 감소하는 경향을 보였습니다. 이것은 추론의 활동의 가치를 감소시킵니다. 추론의 목적은 작은 표본으로도 많은 개체군에 대한 믿을 만한 통찰력을 주기 위한 것이므로 무작정 표본을 키우라고 조언하는 것은 '추론을 포기하는 것이 편하다'라고 해도 과언이 아닙니다. 결국 학자들은 개별 표본 내부에서 스스로 해결책을 찾으려는 시도를 포기하고 여러 표본을 추출하는 상황에 직면합니다. 모집단에서 표본을 추출하는 것은 한 가지 상황에서 반드시 가능하지 않습니다. 인구가 100명이고 그중 10명만 표본으로 추출해도 많은 경우의 수가 가능합니다. 무선으로 표본을 추출하는 활동이 믿을 수 없는 활동이라면, 수많은 숫자는 완전히 임의 표본 평균을 가질 것입니다. 그러나 표본 추출이 나름대로 신뢰할 수 있을 경우 표본 평균이 많으면 분포 시 중심적인 경향을 드러낼 것이고, 그 중심에 모인 표본 평균이 많으면 소수의 홀수 표본 평균을 압도할 것입니다. 학자들은 미친 듯이, 반복적으로 그 표본 평균만을 수집하고, 새로운 분포를 만들었을 것입니다. 이러한 방식으로 생성된 표본 평균의 분포 또는 표본 평균의 분포는 뚜렷한 정규 분포를 드러내는 것으로 나타났습니다.
분포
분포에 대한 지식이 있는 경우 정규 분포가 매우 익숙한 분포일 수 있지만 정규 분포의 핵심 메시지가 있을 경우 정규 분포가 일반화될수록 극단적이 된다는 것입니다. 그렇다면 평균의 표본 분포는 정규분포의 형태를 갖는 것으로 해석할 수 있는데, 이는 일반적인 표본은 많이 만들어지는 반면 이상한 표본은 적게 만들어지는 것을 의미합니다. 표본에서 모집단을 추론하는 논리에 수학적 정당성의 첫 주춧돌이 놓이는 순간입니다. 왜냐하면 평균의 표본 분포가 정규 분포의 근사하다는 단순한 사실만 기억하면 되기 때문입니다. 즉, 적어도 단순한 무선 추출이 관찰되었다는 전제 하에, 그는 그의 샘플이 선택될 수 있었던 다른 많은 샘플들과 비교하여 그리 이상하지 않을 것이라고 확신하고 있습니다. 이 논리는 평균의 표준 오차와도 관련이 있으며, 추론 통계에서는 위에서 소개한 표본 오차와는 분명히 구분되지만 훨씬 더 많은 관심을 받습니다. SEM은 평균 표본 분포의 표준 편차이며, 이는 표본 평균이 여러 표본 평균의 분포에서 모든 방향으로 산재하는 정도를 의미합니다. 따라서 평균의 표본 분포를 정규 분포처럼 표현하면 N입니다. SEM이 클수록 중간에서 평균의 표본 분포가 얇고 높아 유추가 용이합니다. 위의 표본오차 개념은 특정 표본의 단일 표본 평균이 모집단 평균과 얼마나 유사한지를 비교하지만, SEM의 개념은 수많은 표본 평균이 모든 방향으로 튕기는 경향이 얼마나 심각한지를 보여줍니다.
'일상생활' 카테고리의 다른 글
통계학 - 추정의 오류 관리(구간추정) (0) | 2022.08.24 |
---|---|
통계학 - 추론통계학 - 추정 (0) | 2022.08.23 |
통계학 하위 학문 추론 통계 (0) | 2022.08.20 |
통계학 - 통계의 함정 (0) | 2022.08.19 |
통계의 함정 - 편향 (0) | 2022.08.17 |
댓글