숭늉의 연구일지

[생물 임용 노트]멘델의 법칙 기본 원리 - 4) 적합도 카이자승 검정(카이제곱 적합도 검정) 본문

생물학 임용노트/유전학

[생물 임용 노트]멘델의 법칙 기본 원리 - 4) 적합도 카이자승 검정(카이제곱 적합도 검정)

OrtSol 2024. 9. 11. 15:12

적합도 카이자승 검정

관찰 값과 기대 값 사이의 편차를 만들어내는 우연성을 평가하는 것이다. 확률이 높으면 우연성이 높은 것이며, 확률이 낮으면 중요한 변수가 존재한다고 볼 수 있다.

예시 - 고양이의 털색

대립유전자 R은 우성이며, 검은색 형질 / 대립유전자 b는 열성이며, 회색 형질
부모가 모두 Rb인 부모 사이에서 총 50마리의 자손이 나왔다고 했을 때,

  • 실제 관찰 값 - 검정 : 회색 = 30마리 : 20마리
  • 기대 값 - 검정 : 회색 = 3 : 1 = 37.5마리 : 12.5마리

적합도 카이자승 검정 과정

위의 고양이 털색과 관련한 예시로 제시한 적합도 카이자승 검정 과정은 다음과 같다.

1단계 : 기대값 결정

검정 : 50 x 0.75(3/4) = 37.5
회색 : 50 x 0.25(1/4) = 12.5

2단계 : 적합도 카이자승 검정 공식 대입

  • 적합도 카이자승 공식
    • O : 관찰 값 / E : 기댓값
    • X2 = ∑((관찰값-기대값)2/기대값) = ∑((O-E)2/E)

위 공식에 따라 적합도 카이자승 검정 공식에 값을 대입하면,
X2 = 7.52 / 37.5 + 7.52 / 12.5 = 6.0이 나온다.

3단계 : 확률 조사

확률 조사를 위해서는 자유도와 카이자승 값이 필요하다.

  • 자유도(df) = n-1 (n: 기대 표현형 수)
  • 카이자승 : 2단계에서 구함

이를 카이자승 분포표(카이제곱 분포표)에서 찾으면 된다.
여기서는 df=1, 카이자승 = 6.0 일 때의 α 값을 찾으면 된다.

 

α 값이 0.05를 기준으로,
크거나 같으면 우연적인 것으로, 작으면 유의미한 변수가 존재한다고 볼 수 있다.

 

위 예시에서는 α < 0.05이므로 유의미한 변수가 존재한다고 본다.