반응형 r 데이타 클리닝2 R기초: 데이타 클리닝(양질의 데이타란?, 데이타 일부 삭제하기) 사회과학의 경우 많은 경우 설문조사나 질문지를 통해 데이타를 수집하게 된다. 이 때 우리는 어떻게 양질의 데이타를 구분할 수 있을까? 이를 다루는 많은 문헌들이 존재하지만, 오늘은 가장 기본적인 부분을 다루도록 하겠다. 한 연구자가 여러 사람들에게 설문을 돌려 데이타를 수집하였다. 설문조사를 참여한 사람들 중 당연히 대충대충 설렁설렁 참여한 사람이 존재할 것이고, 심한 경우 문항을 읽지도 않고 모두 '예' 혹은 '아니오' 등을 일렬로 체크한 사람들도 있을 것이다. 이래서 어떤 설문의 경우 읽었는지 확인할 수 있는 문항("당신의 의사와는 무관하게 예를 선택하시오")을 포함시키기도 한다. 데이타를 최대한 보존하는 것이 좋지만, 일부의 경우 특정 참여자의 데이타를 삭제해야할 경우가 있다. 1. 내가 연구하고자.. 2020. 12. 5. R 기초: 데이타 클리닝(변인 이름 변경, 변인 척도 변경) R 에서 특정 변인 지칭하기 R 내에서 변인을 지칭하기 위한 코드는 다음과 같다. 데이타에는 내 데이타셋 이름을 쓰고, $ 뒤에는 변인이름을 쓴다. data$variable "데이타 불러오기" 글에서 가져온 데이타셋을 계속 사용할 것이다. 우리가 가진 데이타셋에서 성별을 지칭한다고 해보자. 혼자 해보고 더보기를 통해 확인해보자. 더보기 child_data$gender *그 전 글에서 하위 데이타 관련해서 배운다고 child_new 데이타셋이 있을 텐데 보기 싫으면 rm(child_new) 하면 오른쪽 창에서 해당 데이타 셋이 사라질 것이다. 변인 이름 바꾸기 (변인명 변경) 현재 내가 준비해서 업로드한 데이타는 나름 변인 이름이 예쁘게 정리되어 있지만, 패널 데이타 등에서는 온갖 알파벳으로 이루어져있을 .. 2020. 12. 4. 이전 1 다음 반응형