1. 표본추출 오차와 비표본추출 오차의 개념
(1) 오차의 개념
오차는 참값(실제값)과 추정값의 차이를 말한다. 현실적으로 실제값을 정확히 측정한다는 것은 거의 불가능하다. 오차에는 표본오차와 비표본오차가 있다. 표본오차는 모집단의 일부인 표본에서 얻은 자료를 통해 모집단 전체의 특성을 추론함으로써 생기는 오차를 말하며 비표본오차는 표본오차를 제외한 조사의 전체과정에서 발생할 수 있는 모든 오차를 말한다.
「참고」표본추출오차, 비표본추출오차
1. 표본추출오차 = 표본오차 = 표집오차
표본조사하면 무조건 발샹하는 오차
2. 비표본추출오차 = 비표본오차
조사설계, 처리과정에서 발생하는 오차
(2) 표본추출오차(sampling error)
표본추출 과정에서 발생하는 오차로, 모집단의 일부를 추출하여 조사한 결과를 가지고 모집단 전체를 추론하는 과정에서 생기는 오차를 의미한다. 즉, 자료 전체가 아니라 일부의 표본만 뽑아 조사했기 때문에 발생하는 오차이다. 표본크기, 표본의 특성, 표본추출방법 등에 의해 영향을 받는다. 표본오차는 추출 방법에 따라 여러 가지 형식으로 나타날 수 있지만 보통 표본의 크기에 반비례한다. 따라서 표본의 크기가 증가하면 표본오차가 작아져 좀 더 정확한 추정값을 구할 수 있다. 표본오차를 완전히 억제하기는 불가능하므로 오차의 범위를 제시한다.
(3) 비표본추출오차(non sampling error)
비표본추출오차는 보통 면접방법이나 질문지 구성 방식의 오류, 조사원의 자질, 조사표의 작성 또는 집계, 분석단계 등 조사의 전체과정에서 발생할 수 있다. 비표본오차는 다양한 발생 원인이 혼합되어 있어서 본질파악이나 측정이 어려우므로 통계조사 기획단계에서부터 비표본오차의 존재가능성에 대하여 주의를 기울이고 이의 최소화 방안을 강구할 필요가 있다.
2. 표본추출오차의 크기 및 적정 표본의 크기 결정
(1) 표본추출오차의 크기
표본의 크기가 같다고 가정했을 때 표본추출오차를 비교해 보면,
집락표본추출법 > 단순무작위추출법 > 층화표본추출 순이다.
① 집락표본추출법(cluster sample)
무작위로 표본추출을 하는 것이 아니라 모집단에 존재하는 집단(집락)으로부터 표집하는 표본추출방법이다. 이것은 빠르고 비용이 싼 경향이 있지만, 만일 집락이 모집단을 대표하지 않는다면 치우친 표본이 될 수도 있다. 예를 들면, 정부정책에 대해 태도를 취합한 여론조사는 대표성이 있다고 생각되는 전국의 선별된 지역에서 수행될 수 있지만, 지역적인 정치적 역동성이 있는 경우는 사실이 아닐 수도 있다.
② 단순무작위추출법(simple random sampling)이 방법은 무작위추출법 가운데 가장 원시적인 추출법으로, 모집단에 포함되어 있는 모든 개체가 추출될 확률이 서로 같다는 점과 직접 추출하는 것이 특징이다. 제비뽑기 식으로 주머니 속의 10개의 공 중에서 세 개를 뽑을 경우, 흔들어서 무작위로 뽑는 경우이다.
③ 층화추출법(stratified sampling method)
표본(標本)을 조사할 때에 표본을 추출하는 방법의 하나이다.
층화추출법에서는 우선 조사대상이 되는 모집단(母集團)을 몇 개의 집단으로 나누는데, 그 하나하나를 층이라 부른다. 다음에, 각 층을 모집단으로 생각하여 어떤 방법으로 미리 할당된 수에 따라 각 층에서 표본을 추출한다. 이 때에는 보통 사용하는 임의추출법 ·집락추출법(集落抽出法)이나 기타 방법을 이용하게 된다. 이 경우 층마다 별개의 추출법을 써도 무방하다. 최후에 얻어낸 자료를 정리하고 이것을 근거로 하여 모집단에 대한 추측을 행한다. 일반적으로 모집단에 관하여 추측할 경우 무층화임의추출법(無層化任意抽出法)보다 층화추출법에 의한 쪽이 더 유리하다.
층화추출법에 의해, 예를 들면 어떤 시(市)에서의 중학교 3년생의 수학 성취테스트의 평균점을 추정하고 싶을 경우, 시 전역을 몇 개로 구획하고, 각 구획에서 할당된 수만큼 표본을 임의추출하게 된다. 또, 어떤 문제에 대한 세론(世論)의 찬반의 비율을 알고 싶을 때는 20대, 30대, 40대,…와 같이 연대별로 나누어 할당된 인수를 임의추출하는 것도 생각할 수 있다. 보통 부차추출법(副次抽出法)을 조합하여 시행하는 경우가 많다.
「참고」표본추출오차를 줄이는 방법
1. 오차의 범위를 제시한다.
2. 가능하면 표본의 크게 한다(표본이 커지면 비표본오차는 증가한다).
3. 목적에 맞는 표본설계를 통한 표본을 추출한다.
(2) 적정 표본의 크기 결정
확률추출법에 의하면 표본의 수가 많을수록 대표성이 높아지고, 이러한 대표성을 유지(표본의 적절성)하기 위해서는 표본크기 결정 시 다음의 사항을 고려하여야 한다.
① 모집단의 동질성 정도
모집단의 요소들이 유사한 속성을 많이 갖고 있다면 표본의 크기는 작아도 된다.
② 표본추출방법
표본의 크기가 같다고 가정했을 때 표본추출오차를 비교해 보면,
집락표본추출 > 단순무작위 > 층화표본추출 순이다.
층화표본추출이 오차가 가장 오차가 적으므로 적은 표본의 수로도 대표성을 확보할 수 있다.
③ 허용되는 비용, 시간, 인력 등
④ 신뢰수준
신뢰수준이 높아질수록 표본의 수는 많이 필요하다.
⑤ 이론과 표본설계
표본 선정 시 연구문제의 특성, 기존의 연구결과나 검증된 이론 등을 고려하여 표본을 선정하면 작은 크기의 표본이라도 의미 있는 정보를 제공할 수 있다.
⑥ 범주의 분석 및 변수의 수
한 변수 내의 범주가 많을수록, 각각의 범주에 일정한 수의 표본을 확보하여야 하기 때문에 전체 표본의 수는 증가하게 된다. 아울러 연구하고자하는 변수의 수가 증가할수록 표본의 크기는 커져야 한다.