본문 바로가기
Study/통계 공부 + R

기초통계. 기본 개념2 (표집오차, 신뢰도, 타당도)

by PhD_Ming 2020. 12. 3.
300x250

표집오차

우리는 저번 글에서 표본을 통해 모집단의 특성을 추론하는 방식으로 심리학 연구를 한다는 것을 배웠다. 그리고 여러 표집 방식도 배웠는데, 모집단의 특성과 동일한 표본집단을 뽑는다는 것이 쉬운 일이 아님을 쉽게 알 수 있었을 것이다. 인간 대상으로 실험을 할 때에는 여러 변수가 생기기 때문에, 거의 모든 경우 통계치는 모수치와 같지 않고, 표본집단은 모집단을 정확히 대표하지 않는다. 즉 표집오차(sampling error)가 생기게 되는 것이다.

아래 그림과 같이 우리가 서로 다른 표본을 뽑을 때마다, 다른 통계치를 얻게되며 이때 모수치와 통계치와의 차이가 표집오차라 할 수 있다. 모수치를 사용하지 않는 이유는 저번에도 설명했듯, 모집단 전체의 데이타를 얻는 것이 거의 불가능하고, 가능하다하더라도 시간과 비용 측면에서 효율적이지 않기 때문이다. 즉, 아래 예시에서는 모수치를 임의로 설정하였지만, 현실세계에서 우리는 모수치를 알 수 없다. 추론통계에서는 이러한 모수치가 고정적이고 (현실세계에서는 매 순간 누군가 죽고 누군가 태어나서 모수치가 계속 변화하지만), 실재하는 것이라 가정한다(적어도 통계에 대한 빈도주의적 관점에서는 이렇게 가정함). 우리는 이러한 오차를 지닌 표본집단의 통계치를 통해 모수치를 추정하게 된다.

표집오차 외에도 연구 과정에서 발생하는 다른 오차(error) 역시 존재한다.

1. 변인 측정에 오차가 있는 경우: 우리는 양적 연구에서 변인을 항상 수치화하여 측정하게 된다. 이 과정에서도 오차가 발생하게 된다. 예를 들어서 스트레스 수준을 1~7점 척도로 측정한다고 할 때, 개인이 보고하는 스트레스 수준이 각 개인마다 동일하다고 할 수 없다. 즉 내가 느끼는 스트레스 1점 정도의 수준이 다른 사람이 느끼기엔 3점 정도의 수준으로 느낀다고 할 때, 이러한 차이에서 오차가 발생한다. 또 다른 예를 들어보자. 미국에서 아시안 인구를 대상으로 인종차별을 느끼는 정도를 측정한다고 하자. 그런데 이때 인종차별을 측정하는 척도가 흑인을 대상으로 사용된 척도였고 그 안의 문항은 "경찰이 나의 인종 때문에 나에게 더 가혹하게 대한다고 느낀다" 등의 문항이었다고 해보자. 이러한 문항은 흑인을 대상으로 측정한다면 더 적합하겠지만, 아시안을 대상으로 이 척도를 사용한다면 아시안이 느끼는 인종차별이란 변인을 제대로 측정하지 못하게 되는 것이다. 

2. 방법론적 오류: 이는 연구 과정에서 나타날 수 있는 여러 오류들을 지칭하는데 연구방법론 등의 수업에서 더 자세히 배울 수 있을 것이다.

신뢰도 및 타당도

우리는 우리가 관심있는 어떤 개념을 수치로 측정하여 우리가 설정한 가설을 연구한다. 하지만 우리가 원하는 변인을 실제로 측정하는지, 그리고 일관적으로 측정하고 있는지 어떻게 알 수 있을까? 후자에 대한 질문은 신뢰도(reliability)랑, 또 전자에 대한 질문은 타당도(validity)와 관련이 있다고 할 수 있다. 더 자세히 알아보자.

다음 척도를 통해 자존감을 측정한다고 해보자. 위에도 설명했듯이 개인이 보고하는 점수가 개개인마다 절대적으로 동일하다고 할 수 없다. 여기서도 오차가 발생하게 되므로 관찰된 점수는 다음과 같다.

관찰된 점수 = 실제 점수 + 오차점수

신뢰도

여기서 신뢰도는 개인의 자존감을 "얼마나 일관적으로 측정하고 있는지"일 것이다. 즉 한 개인이 이 척도를 여러번 작성한다고 했을 때, 그 여러번에서 나온 점수가 일관적으로 동일하게 나타난다면 이 척도를 신뢰할 수 있을 것이다. 이를 검사-재검사 신뢰도(test/retest reliability)라고 한다. 또한 한 개인이 문항1에는 완전 동의한다고 체크하다가 문항5에는 완전 반대한다고 체크한다면 그 데이타에 대한 자료에 대한 신뢰성이 떨어질 것이다. 이와같이 각각의 문항들이 하나의 개념을 일관적으로 측정하는지에 대한 신뢰도를 내적 합치도(internal consistency)라 한다. 일반적으로 신뢰도는 크론바하 알파(Cronbach,1951)를 통해 측정하며, 이에 대한 더 자세한 설명은 다음에 작성할 예정이다.

타당도

타당도는 실제로 우리가 원하는 변인을 측정하는지를 살펴보는 것이다. 일반적으로 확인적 요인분석(confirmatory factor analysis)를 통하여 확인할 수 있다.

반응형

댓글