SEM에서 적합도는 예측 공분산 구조 모형(내가 설정한 모형)을 관찰된 공분산 구조(나의 데이타)와 비교하는 함수라고 할 수 있음
부적합 정도는 예측 모형의 편차값이 데이타를 대표하지 못하는 정도를 나타냄
추정된 적합도 통계치 핵심 중 하나임
lavaan에서 일반적인 ML 추정 적합도 함수는: E는 예측된 모형의 결정값, S는 표본 공분산, k는 관찰된 변수의 개수임 .. 그냥 특정한 모델의 공분산이랑 데이타 공분산 구조를 비교한다고 생각하면 됨, 가까우면 통계치가 작아지고, 차이가 크면 통계치 커짐
여기서 F hat값이 카이스퀘어로 변형됨df는 추정되지 않은(제한된)모수치의 개수, N이나 N-1은 정규성 가정에 따라 사용되는 데 라반은 N 사용
카이스퀘어는 두 가지 방식으로 사용됨
완전히 포화된 모형, 즉 완벽하게 적합한 모형과 비교할 때
다른 적합도를 가진, nested 모델과 비교할 때 (우리가 생성한 모델이랑 비교함)
이를 통해 카이스퀘어 검증은 우도비율검정(likelihood ratio test)의 특수한 변형이라 할 수 있음
모델들 간 적합도에 유의미한 차이가 없을 때 더 단순한 모델이 선호됨
차이가 있을 때 더 복잡한 모델이 선호됨
증분적합지수(Incremental Fit)
TLI(Tucker-Lewis Index)나 CFI(Comparative Fit Index)와 같은 측정치로 얼마나 모델이 영가설 모델과 비교해서 적합한지 나타냄
영가설 모델이란 모델에 모든 변수 간 아무런 공분산이 존재하지 않음을 가정하는 모델로, 오직 분산만이 추정됨
TLI와 CFI는 제안된 모델이 영가설모델과의 차이를 측정해, 제안된 모델이 영가설모델보다 얼마나 더 나은지를 나타내줌.
점수>.95는 상대적으로 좋은 적합도, >.90은 충분한 적합도를 나타냄
RMSEA(Root Mean Squared Error of Approximation)
모델이 데이타에 가까운 적합도로부터 얼마나 편차가 있는지 평가하기 위해 고안됨
점수<.06이면 좋은 적합도를 나타남(아주 적은 편차)
RMSEA 90%CI가 추천됨
일부 소프트웨어는 영가설 검증을 하고 보고하는데, RMSEA가 .05 이하일 때; 기각 불가; 즉, 모델이 적합하다는 증거임
모델 적합도
모델이 적합한지 결정하는 데 완전한 합의는 없음
많은 연구자들은 여러 지표들을 평가하고, 모든 지표 혹은 대부분의 지표가 모델을 지지한다고 하면 완고하다고 생각함
여러 연구자들은 각각의 적합도 지표의 특정 역할에 대해 강한 의견을 가지고 있음
측정 동일성(Measurement Invariance)
측정이론(measurement theory) 은 관찰치가 여러 요소들에 대한 함수라 가정함: xi = Ti +ei
따라서 우리는 데이타에서 Ti를 확인할 방식을 찾고자 함: Ti = xi-ei
측정 신뢰도: 크론바하 알파(Cronbach's Alpha)
측정치에 대한 신뢰도는 지표들이 공통 분산을 가지는지를 검증하는 데 사용됨
알파 계수는 내적 신뢰도에 대한 가장 일반적인 측정치임
일반적으로 a > .70(연구), a > .80(적용) 정도가 충분하다고 생각됨
N은 문항 갯수, c바는 문항간 공분산의 평균, v바는 분산의 평균
크론바하 알파는 가장 유명한 신뢰도 척도이지만, 요인 부하량이 모두 같다고 가정함. 즉 예측변수가 각각 특정요인을 설명하는 분산 크기가 같다고 가정하는 것임. 즉 집단/시간에 따른 지표의 동일성을 평가하지 못함. 즉, 두 집단이 .70 보다 큰 알파 점수가 있으면 두 집단 간 측정치가 신뢰할 수 있다고 가정하는 것임. 지표를 단일 점수로 합하거나 평균으로 만드는 것을 타당화할 때 사용됨(하지만 타당하지 않을 수 있음...부하량이 같다는 가정이 틀렸기 때문)
집단 간 예시: 남성과 여성의 toxic maculinity에 대한 크론바하 알파가 계산되었음. 즉 알파는 두 집단에서 측정치가 신뢰할 수 있음을 보여주지만, 두 집단에서 서로 다르게 작용하는지 알려주지 못함.
재밌는 사실: 크론바흐 알파는 표본 크기에 아주 민감함. N이 바뀔 때 예시
큰 샘플 사이즈에서는 알파에 의한 기각률이 아주 낮음을 볼 수 있음.
측정 신뢰도: 요인 동일성(Factorial Invariance)
요인모형은 요인 부하량을 동일하다고 가정하지 않음. 즉 모든 문항이 같은 정도로 잠재 변수과 관련 있다는 가정을 하지 않음
집단/시간에 따른 함수의 지표로서 동일성 검증을 할 수 있음. 즉 측정 모델이 같게 기능하는지를 검증함
요인 점수는 구조방정식 환경에서 점수를 추정하여 다음 모델에 포함됨
네개의 동일성 수준
configural invariance: 요인 개수와 부하량 패턴이 두 집단에서 같음
weak invariance: 부하량이 두 집단에서 같음
strong invariance: 평균이 두 집단에서 같음
strict invariance: 잔차가 두 집단에서 같음
하지만 현실 데이타는 모든 동일성을 가지는 것이 불가능함. 부분 동일성은 가능~
시사점
크론바하 알파 사용한 모델 관계
요인 모형 사용한 모델 관계
composite(알파 값) vs 요인
특정 검증은, 특정 조건 하에 composite 점수가 더 잘 작동함
composite은 데이타에서 존재할 수 있는 상호관계를 단순화한것임
조건이 충족되지 않으면 composite 점수 사용은 데이타 관계를 상당히 잘못 대표할 수 있음
댓글