본문 바로가기
반응형

통계 기초2

R기초: 데이타 클리닝(양질의 데이타란?, 데이타 일부 삭제하기) 사회과학의 경우 많은 경우 설문조사나 질문지를 통해 데이타를 수집하게 된다. 이 때 우리는 어떻게 양질의 데이타를 구분할 수 있을까? 이를 다루는 많은 문헌들이 존재하지만, 오늘은 가장 기본적인 부분을 다루도록 하겠다. 한 연구자가 여러 사람들에게 설문을 돌려 데이타를 수집하였다. 설문조사를 참여한 사람들 중 당연히 대충대충 설렁설렁 참여한 사람이 존재할 것이고, 심한 경우 문항을 읽지도 않고 모두 '예' 혹은 '아니오' 등을 일렬로 체크한 사람들도 있을 것이다. 이래서 어떤 설문의 경우 읽었는지 확인할 수 있는 문항("당신의 의사와는 무관하게 예를 선택하시오")을 포함시키기도 한다. 데이타를 최대한 보존하는 것이 좋지만, 일부의 경우 특정 참여자의 데이타를 삭제해야할 경우가 있다. 1. 내가 연구하고자.. 2020. 12. 5.
기초통계. 이변량 통계2: 변인 유형에 따른 상관 분석 피어슨 상관 (Pearson Correlation) 저번에 상관분석에 대해 알아보았다. 저번에 알아본 상관 분석 유형은 Pearson correlation이라 할 수 있다. 피어슨 상관분석은 상관을 구하고자 하는 변인이 모두 동간척도나 비율척도를 이용한 연속변인일 때 사용한다. 즉, 연구자들이 가장 많이 사용하는 상관분석이라고 생각할 수 있다. 저번에 살펴본 상관식을 좀만 변형시키면 다음과 같은 식이 된다. 피어슨은 저번에 깊게 알아봤으니 이제 다른 유형의 상관분석을 살펴보기로 하자. 양류상관(Point Biserial Correlation) 양분상관은 이진변수(binary variable) 혹은 이분변수(dichotomous variable)와 연속변수 간의 상관을 구할 때 사용된다. 이진변수/이분변수.. 2020. 12. 4.
반응형