본문 바로가기
Study/통계 공부 + R

SEM 구조방정식 (3)

by PhD_Ming 2022. 2. 5.
300x250

모델적합도

카이스퀘어 적합도(Chi-square Goodness of Fit); Joreskog

  • SEM에서 적합도는 예측 공분산 구조 모형(내가 설정한 모형)을 관찰된 공분산 구조(나의 데이타)와 비교하는 함수라고 할 수 있음
  • 부적합 정도는 예측 모형의 편차값이 데이타를 대표하지 못하는 정도를 나타냄
  • 추정된 적합도 통계치 핵심 중 하나임
  • lavaan에서 일반적인 ML 추정 적합도 함수는:  
    E는 예측된 모형의 결정값, S는 표본 공분산, k는 관찰된 변수의 개수임 .. 그냥 특정한 모델의 공분산이랑 데이타 공분산 구조를 비교한다고 생각하면 됨, 가까우면 통계치가 작아지고, 차이가 크면 통계치 커짐
    여기서 F hat값이 카이스퀘어로 변형됨
    df는 추정되지 않은(제한된)모수치의 개수, N이나 N-1은 정규성 가정에 따라 사용되는 데 라반은 N 사용

카이스퀘어는 두 가지 방식으로 사용됨

  • 완전히 포화된 모형, 즉 완벽하게 적합한 모형과 비교할 때
  • 다른 적합도를 가진, nested 모델과 비교할 때 (우리가 생성한 모델이랑 비교함)

이를 통해 카이스퀘어 검증은 우도비율검정(likelihood ratio test)의 특수한 변형이라 할 수 있음

  • 모델들 간 적합도에 유의미한 차이가 없을 때 더 단순한 모델이 선호됨
  • 차이가 있을 때 더 복잡한 모델이 선호됨

 

증분적합지수(Incremental Fit)

  • TLI(Tucker-Lewis Index)나 CFI(Comparative Fit Index)와 같은 측정치로 얼마나 모델이 영가설 모델과 비교해서 적합한지 나타냄
  • 영가설 모델이란 모델에 모든 변수 간 아무런 공분산이 존재하지 않음을 가정하는 모델로, 오직 분산만이 추정됨
  • TLI와 CFI는 제안된 모델이 영가설모델과의 차이를 측정해, 제안된 모델이 영가설모델보다 얼마나 더 나은지를 나타내줌.
  • 점수>.95는 상대적으로 좋은 적합도, >.90은 충분한 적합도를 나타냄

 

RMSEA(Root Mean Squared Error of Approximation)

  • 모델이 데이타에 가까운 적합도로부터 얼마나 편차가 있는지 평가하기 위해 고안됨
  • 점수<.06이면 좋은 적합도를 나타남(아주 적은 편차)
  • RMSEA 90%CI가 추천됨
  • 일부 소프트웨어는 영가설 검증을 하고 보고하는데, RMSEA가 .05 이하일 때; 기각 불가; 즉, 모델이 적합하다는 증거임

 

모델 적합도

  • 모델이 적합한지 결정하는 데 완전한 합의는 없음
  • 많은 연구자들은 여러 지표들을 평가하고, 모든 지표 혹은 대부분의 지표가 모델을 지지한다고 하면 완고하다고 생각함
  • 여러 연구자들은 각각의 적합도 지표의 특정 역할에 대해 강한 의견을 가지고 있음

 

측정 동일성(Measurement Invariance)

  • 측정이론(measurement theory) 은 관찰치가 여러 요소들에 대한 함수라 가정함: xi = Ti +ei
  • 따라서 우리는 데이타에서 Ti를 확인할 방식을 찾고자 함: Ti = xi-ei

측정 신뢰도: 크론바하 알파(Cronbach's Alpha)

  • 측정치에 대한 신뢰도는 지표들이 공통 분산을 가지는지를 검증하는 데 사용됨
  • 알파 계수는 내적 신뢰도에 대한 가장 일반적인 측정치임
  • 일반적으로 a > .70(연구), a > .80(적용) 정도가 충분하다고 생각됨

N은 문항 갯수, c바는 문항간 공분산의 평균, v바는 분산의 평균

  • 크론바하 알파는 가장 유명한 신뢰도 척도이지만, 요인 부하량이 모두 같다고 가정함. 즉 예측변수가 각각 특정요인을 설명하는 분산 크기가 같다고 가정하는 것임. 즉 집단/시간에 따른 지표의 동일성을 평가하지 못함. 즉, 두 집단이 .70 보다 큰 알파 점수가 있으면 두 집단 간 측정치가 신뢰할 수 있다고 가정하는 것임. 지표를 단일 점수로 합하거나 평균으로 만드는 것을 타당화할 때 사용됨(하지만 타당하지 않을 수 있음...부하량이 같다는 가정이 틀렸기 때문)

  • 집단 간 예시: 남성과 여성의 toxic maculinity에 대한 크론바하 알파가 계산되었음. 즉 알파는 두 집단에서 측정치가 신뢰할 수 있음을 보여주지만, 두 집단에서 서로 다르게 작용하는지 알려주지 못함.

  • 재밌는 사실: 크론바흐 알파는 표본 크기에 아주 민감함. N이 바뀔 때 예시

큰 샘플 사이즈에서는 알파에 의한 기각률이 아주 낮음을 볼 수 있음. 

 

측정 신뢰도: 요인 동일성(Factorial Invariance)

  • 요인모형은 요인 부하량을 동일하다고 가정하지 않음. 즉 모든 문항이 같은 정도로 잠재 변수과 관련 있다는 가정을 하지 않음

  • 집단/시간에 따른 함수의 지표로서 동일성 검증을 할 수 있음. 즉 측정 모델이 같게 기능하는지를 검증함
  • 요인 점수는 구조방정식 환경에서 점수를 추정하여 다음 모델에 포함됨

네개의 동일성 수준

  • configural invariance: 요인 개수와 부하량 패턴이 두 집단에서 같음

  • weak invariance: 부하량이 두 집단에서 같음

  • strong invariance: 평균이 두 집단에서 같음

  • strict invariance: 잔차가 두 집단에서 같음

하지만 현실 데이타는 모든 동일성을 가지는 것이 불가능함. 부분 동일성은 가능~

 

시사점

크론바하 알파 사용한 모델 관계

요인 모형 사용한 모델 관계

composite(알파 값) vs 요인

  • 특정 검증은, 특정 조건 하에 composite 점수가 더 잘 작동함
  • composite은 데이타에서 존재할 수 있는 상호관계를 단순화한것임
  • 조건이 충족되지 않으면 composite 점수 사용은 데이타 관계를 상당히 잘못 대표할 수 있음

예시:

여기서 알파를 사용한 경우

  • replication의 67.2%가 .70 이상의 알파값 나옴
  • replication의 63.1%는 X가 Y를 예측하는 회귀 효과가 유의미하다고 나옴
  • 타입 1 오류를 일으키는 replication의 68.9%가 .70이상의 알파값 나옴

여기서 확인적 요인 모형 사용한 경우

  • replication의 5.7%만 X가 Y를 예측하는 회귀 효과가 유의미하다고 나옴
  • 0.05 기준, 타입1 오류가 훨씬 일관적임
반응형

'Study > 통계 공부 + R' 카테고리의 다른 글

SEM 구조방정식 (4.1)  (0) 2022.02.12
SEM 구조방정식 (4)  (0) 2022.02.12
SEM 책 정리 (3)상관  (0) 2022.02.04
SEM 책 정리 (2)데이타 정리하기  (0) 2022.02.04
SEM 책 정리 (1)구조방정식 소개  (0) 2022.01.28

댓글