300x250
모델적합도
카이스퀘어 적합도(Chi-square Goodness of Fit); Joreskog
- SEM에서 적합도는 예측 공분산 구조 모형(내가 설정한 모형)을 관찰된 공분산 구조(나의 데이타)와 비교하는 함수라고 할 수 있음
- 부적합 정도는 예측 모형의 편차값이 데이타를 대표하지 못하는 정도를 나타냄
- 추정된 적합도 통계치 핵심 중 하나임
- lavaan에서 일반적인 ML 추정 적합도 함수는: 여기서 F hat값이 카이스퀘어로 변형됨
카이스퀘어는 두 가지 방식으로 사용됨
- 완전히 포화된 모형, 즉 완벽하게 적합한 모형과 비교할 때
- 다른 적합도를 가진, nested 모델과 비교할 때 (우리가 생성한 모델이랑 비교함)
이를 통해 카이스퀘어 검증은 우도비율검정(likelihood ratio test)의 특수한 변형이라 할 수 있음
- 모델들 간 적합도에 유의미한 차이가 없을 때 더 단순한 모델이 선호됨
- 차이가 있을 때 더 복잡한 모델이 선호됨
증분적합지수(Incremental Fit)
- TLI(Tucker-Lewis Index)나 CFI(Comparative Fit Index)와 같은 측정치로 얼마나 모델이 영가설 모델과 비교해서 적합한지 나타냄
- 영가설 모델이란 모델에 모든 변수 간 아무런 공분산이 존재하지 않음을 가정하는 모델로, 오직 분산만이 추정됨
- TLI와 CFI는 제안된 모델이 영가설모델과의 차이를 측정해, 제안된 모델이 영가설모델보다 얼마나 더 나은지를 나타내줌.
- 점수>.95는 상대적으로 좋은 적합도, >.90은 충분한 적합도를 나타냄
RMSEA(Root Mean Squared Error of Approximation)
- 모델이 데이타에 가까운 적합도로부터 얼마나 편차가 있는지 평가하기 위해 고안됨
- 점수<.06이면 좋은 적합도를 나타남(아주 적은 편차)
- RMSEA 90%CI가 추천됨
- 일부 소프트웨어는 영가설 검증을 하고 보고하는데, RMSEA가 .05 이하일 때; 기각 불가; 즉, 모델이 적합하다는 증거임
모델 적합도
- 모델이 적합한지 결정하는 데 완전한 합의는 없음
- 많은 연구자들은 여러 지표들을 평가하고, 모든 지표 혹은 대부분의 지표가 모델을 지지한다고 하면 완고하다고 생각함
- 여러 연구자들은 각각의 적합도 지표의 특정 역할에 대해 강한 의견을 가지고 있음
측정 동일성(Measurement Invariance)
- 측정이론(measurement theory) 은 관찰치가 여러 요소들에 대한 함수라 가정함: xi = Ti +ei
- 따라서 우리는 데이타에서 Ti를 확인할 방식을 찾고자 함: Ti = xi-ei
측정 신뢰도: 크론바하 알파(Cronbach's Alpha)
- 측정치에 대한 신뢰도는 지표들이 공통 분산을 가지는지를 검증하는 데 사용됨
- 알파 계수는 내적 신뢰도에 대한 가장 일반적인 측정치임
- 일반적으로 a > .70(연구), a > .80(적용) 정도가 충분하다고 생각됨
- 크론바하 알파는 가장 유명한 신뢰도 척도이지만, 요인 부하량이 모두 같다고 가정함. 즉 예측변수가 각각 특정요인을 설명하는 분산 크기가 같다고 가정하는 것임. 즉 집단/시간에 따른 지표의 동일성을 평가하지 못함. 즉, 두 집단이 .70 보다 큰 알파 점수가 있으면 두 집단 간 측정치가 신뢰할 수 있다고 가정하는 것임. 지표를 단일 점수로 합하거나 평균으로 만드는 것을 타당화할 때 사용됨(하지만 타당하지 않을 수 있음...부하량이 같다는 가정이 틀렸기 때문)
- 집단 간 예시: 남성과 여성의 toxic maculinity에 대한 크론바하 알파가 계산되었음. 즉 알파는 두 집단에서 측정치가 신뢰할 수 있음을 보여주지만, 두 집단에서 서로 다르게 작용하는지 알려주지 못함.
- 재밌는 사실: 크론바흐 알파는 표본 크기에 아주 민감함. N이 바뀔 때 예시
측정 신뢰도: 요인 동일성(Factorial Invariance)
- 요인모형은 요인 부하량을 동일하다고 가정하지 않음. 즉 모든 문항이 같은 정도로 잠재 변수과 관련 있다는 가정을 하지 않음
- 집단/시간에 따른 함수의 지표로서 동일성 검증을 할 수 있음. 즉 측정 모델이 같게 기능하는지를 검증함
- 요인 점수는 구조방정식 환경에서 점수를 추정하여 다음 모델에 포함됨
네개의 동일성 수준
- configural invariance: 요인 개수와 부하량 패턴이 두 집단에서 같음
- weak invariance: 부하량이 두 집단에서 같음
- strong invariance: 평균이 두 집단에서 같음
- strict invariance: 잔차가 두 집단에서 같음
하지만 현실 데이타는 모든 동일성을 가지는 것이 불가능함. 부분 동일성은 가능~
시사점
크론바하 알파 사용한 모델 관계
요인 모형 사용한 모델 관계
composite(알파 값) vs 요인
- 특정 검증은, 특정 조건 하에 composite 점수가 더 잘 작동함
- composite은 데이타에서 존재할 수 있는 상호관계를 단순화한것임
- 조건이 충족되지 않으면 composite 점수 사용은 데이타 관계를 상당히 잘못 대표할 수 있음
예시:
여기서 알파를 사용한 경우
- replication의 67.2%가 .70 이상의 알파값 나옴
- replication의 63.1%는 X가 Y를 예측하는 회귀 효과가 유의미하다고 나옴
- 타입 1 오류를 일으키는 replication의 68.9%가 .70이상의 알파값 나옴
여기서 확인적 요인 모형 사용한 경우
- replication의 5.7%만 X가 Y를 예측하는 회귀 효과가 유의미하다고 나옴
- 0.05 기준, 타입1 오류가 훨씬 일관적임
반응형
'Study > 통계 공부 + R' 카테고리의 다른 글
SEM 구조방정식 (4.1) (0) | 2022.02.12 |
---|---|
SEM 구조방정식 (4) (0) | 2022.02.12 |
SEM 책 정리 (3)상관 (0) | 2022.02.04 |
SEM 책 정리 (2)데이타 정리하기 (0) | 2022.02.04 |
SEM 책 정리 (1)구조방정식 소개 (0) | 2022.01.28 |
댓글