Z 점수 및 표준화(Standardization)
심리 연구에서는 설문, 반응시간 등 구성개념을 알아보기 위한 측정 척도가 다양하게 사용된다. 예를 들면 STEM(Science, Technology, Engineering, Math) 영역에 대한 태도를 측정하는 척도 중 한 문항으로 "나는 수학을 좋아한다"를 0점(전혀 아니다)부터 7점(정말 그렇다)까지 7점 리커트 척도로 측정할 수도 있고 반응시간을 1/1000초단위로 측정하여 분석하기도 한다. 이런 여러 명명, 동간, 비율 척도로 측정된 관찰값을 표준화시킨 것을 우리는 Z점수(z scores; 표준점수)라고 한다. Z 점수는 다음과 같다.
위 식에서 볼 수 있듯이 Z 점수는 편차를 표준편차로 나누어준 값이다.
예시를 들어 Z점수를 알아보자. STEM 영역에 대한 태도에 대한 데이타를 수집하여 다음과 같은 관찰값을 얻었다고 해보자.
STEM 영역에 대한 태도 |
2.3 |
6.4 |
3.3 |
1.1 |
... |
4.2 |
평균: 3.46, 표준편차: 2.0
이때 1.1에 대한 Z점수는 어떻게 될까? (1.1 - 3.46)/2= -1.18이 될 것이다. 이를 위 그래프에 표시해본다면, 다음 그림처럼 나타낼 수 있다. 그림에서 볼 수 있듯이, 평균값은 3.46이므로 정 중앙의 X바 값과 같을 것이다. 1.46은 평균(3.46)에서 1SD(2.0)만큼 빼준 값이고, -1.46은 평균(3.46)에서 2SD(2x2.0=4)만큼을 빼준값이 된다. 우리가 알아본 1.1에 대한 Z 점수는 1.1에서 평균을 뺀 후 표준편차로 나누어 -1.18 이 나왔으므로 빨간색으로 표시된 값처럼 나타내 줄 수 있을 것이다.
우리는 이때,
5.46을 평균으로부터 1표준편차 위의 값 (1 standard deviation above the mean),
7.46을 평균으로부터 2표준편차 위의 값 (2 standard deviation above the mean),
1.46을 평균으로부터 1표준편차 아래의 값 (1 standard deviation below the mean)
-1.46을 평균으로부터 2표준편차 아래의 값 (2 standard deviation below the mean)
이라고 표시할 수 있다. 1.1점은 평균으로부터 얼마만큼의 표준편차가 떨어져 있는 값이라 할 수 있을까?
"1.18 표준편차 아래의 값" 이라고 표시할 수 있을 것이다.
~~~~~~~~~
바빠서...원래는 확률이론까지 하려했는데 오늘은 여기까지 올림!
'Study > 통계 공부 + R' 카테고리의 다른 글
범주화하기: 로지스틱 회귀, r 통계 분석 (0) | 2021.01.01 |
---|---|
기초통계: 가설 검정 (0) | 2020.12.21 |
R 기초: 데이타 시각화. 예쁘고 깔끔한 그래프 그리기 (0) | 2020.12.08 |
R 기초: 평가자간 신뢰도 Cohen's kappa, 단순회귀분석 (2) | 2020.12.07 |
R 기초: 여러 유형의 상관분석 돌리기 (2) | 2020.12.06 |
댓글