본문 바로가기
반응형

r 초보4

R 기초: 데이타 시각화. 예쁘고 깔끔한 그래프 그리기 분석한 데이타를 항상 줄줄이 읊으면서 페이퍼에 보고하지 않는다. 어떨땐 표를 사용해서 기술치를 전부 한 표에 집어 넣어 간결하고 보기 좋게 제시하기도 하고, 그래프를 통해서 한눈에 데이타 특징을 볼 수 있게 나타내기도 한다. 많은 사람들이 SPSS를 사용하고 있는데, SPSS의 단점 중 하나는 그래프가 너무 못났다. 내가 SPSS를 사용할 때에는 SPSS에서 나타난 그래프를 사용할 생각도 안했고, 따로 엑셀로 작업했어야 했다. R을 사용하면 엑셀로 이중 작업을 할 필요 없이 예쁘고 깔끔한 그래프를 그릴 수 있다. 여기서 예쁘고는 알록달록한 그래프가 아니라, 정말 깔끔하게 한눈에 잘 보이는 그런 그래프를 의미한다. 예쁜 그래프는... 심플해야함 최대한 색깔을 적게 사용해야함 의미를 분명히 전달하여야 함 최.. 2020. 12. 8.
R기초: 데이타 클리닝(양질의 데이타란?, 데이타 일부 삭제하기) 사회과학의 경우 많은 경우 설문조사나 질문지를 통해 데이타를 수집하게 된다. 이 때 우리는 어떻게 양질의 데이타를 구분할 수 있을까? 이를 다루는 많은 문헌들이 존재하지만, 오늘은 가장 기본적인 부분을 다루도록 하겠다. 한 연구자가 여러 사람들에게 설문을 돌려 데이타를 수집하였다. 설문조사를 참여한 사람들 중 당연히 대충대충 설렁설렁 참여한 사람이 존재할 것이고, 심한 경우 문항을 읽지도 않고 모두 '예' 혹은 '아니오' 등을 일렬로 체크한 사람들도 있을 것이다. 이래서 어떤 설문의 경우 읽었는지 확인할 수 있는 문항("당신의 의사와는 무관하게 예를 선택하시오")을 포함시키기도 한다. 데이타를 최대한 보존하는 것이 좋지만, 일부의 경우 특정 참여자의 데이타를 삭제해야할 경우가 있다. 1. 내가 연구하고자.. 2020. 12. 5.
R기초: 데이타 클리닝 (문자값 수정하기) 인터넷을 사용해서 연구자료를 수집한다고 생각해보자. 여기서 우리는 인종이 어떻게 되나요? 하고 주관식 문항을 포함해놨다. 사람들이 모두 같게 입력하지 않을 것이다. 어떤 사람은 Asian 어떤 사람은 asian, 어떤 사람은 Asia 등등으로 적을 수 있다. R은 대문자와 소문자를 민감하게 구분하기 때문에 이 모든 대답을 다 다른 범주로 간주하게된다. 따라서 우리는 대답을 한가지로 통일시켜주어야 한다. 우리의 예시 데이타에는 이러한 변인이 없기 때문에 코드만 제공할 예정이다. 먼저 해당 변인 내의 모든 값을 소문자로 변화시킬 때 사용하는 코드는 다음과 같다. data$variable 2020. 12. 4.
R 시작하기: csv 및 excel 데이타 불러오기 R 스튜디오 시작하기 R 스튜디를 열면 다음과 같은 화면이 보인다. SPSS를 사용하던 사람들에겐 다소 당황스러운 화면이다. 먼저 작업창을 불러올 예정이다. 제일 왼쪽 상단에 빈종이같은 아이콘을 클릭하고 R Markdown을 불러오자. 프로젝트 이름과 본인 이름을 적고, output format은 뭐든 상관없지만 나는 Word를 선호한다. output format은 추후 작업파일을 저장할 때 저장되는 방식이다. ok를 선택하면 다음과 같은 창이 보일 것이다. 새로 보이는 저 창이 우리의 작업창이다. 여기서 파일을 불러오고 데이타 분석도 할 수 있다. 드래그 한 부분은 지저분하니 지워주자. 지워도 별 상관 없다. 데이타 불러오기 시작하기 전에, R에게 어디서 데이타 파일을 찾을 수 있는지 알려주어야 한다... 2020. 12. 3.
반응형