F-통계량
덤프버전 : (♥ 0)
1. 개요[편집]
F-통계량(F-statistics)은 개체 집단에서 통계학적으로 예상되는 다양한 모집단 간의 대립 유전자 빈도의 분산을 의미한다. [1]
특히, 유전적 유사성을 측정하는 고정지수(FST, Fixation index)와 밀접한 관련이 있다.
2. 소개[편집]
F-통계량은 좀 더 구체적으로 집단유전학에서 사용되는 지표 중 하나로, 주로 모집단 내의 유전적 다양성과 모집단 간의 유전적 차이를 평가하는 데 사용된다.
특히, F-통계량은 유전적 유사성, 즉 유전적 유사성(유전적 거리, 유전적 다양성 등)을 측정하는 FST(Fixation index)와 관련이 있다.
바꿔 말하면 하디-바인베르크 법칙의 기댓값과 비교할 때 예상되는 이형접합성 감소 정도를 의미한다.
F- 통계량은 소의 근친 교배에 관심이 있던 미국의 유전학자 Sewall Wright에 의해 1920년 대에 개발됐다.
그러나 표현형 중 완전 우성은 동형접합체 우성과 이형접합체의 표현형이 동일하게 하기 때문에 분자유전학이 탄생하기 시작한 1960년대 이전까지는 개체 집단의 이형접합을 측정할 수 없었다. [2]
통계학의 F-분포와는 다른 것이다. t-분포와도 연관 없다.
들어가기 전에 반드시 알아야 할 것은 집단구조와 하디-바인베르크 법칙이다.
위 두 개념에 대한 이해나 기본기가 없다면 본 문서에서 소개할 내용은 이해한 게 이해한 것이 아닐 것이다.
3. 정의[편집]
F-통계량의 구성은 집단구조와 동일하게 [math(F_{IS})], [math(F_{ST})], [math(F_{IT})]로 이루어져 있으며, 다양한 집단 구조에서 이형접합성의 양과 관련이 있고, 근친 교배 계수인 F에서 파생된다.
기본적으로 유전자의 빈도에 대한 것이며, 하디-바인베르크 법칙을 기반으로 한다.
하디-바인베르크 법칙을 기반으로 하는 만큼, 해당 법칙의 기본적인 이해와 어느정도의 문제 풀이 솔루션이 필요하니 본 문서를 읽기 전, 저 법칙에 대한 기본기를 쌓고 읽기 바란다. [3]
3.1. 근친교배가 포함된 대립유전자계 관점[편집]
하디-바인베르크 법칙을 근친 교배가 포함된 상황에 맞게 조정한 식이다.
+2 [br] [math(p^2(1-F) + pF + 2pq(1-F) + q^2(1-F) + qF = 1)]
여기서 [math(F)]
[0, 1]
는 근친교배 계수를 의미한다. [math(p^2, 2pq, q^2)]에 관한 건 하디-바인베르크 법칙을 참고하자.상술했듯 하디-바인베르크 법칙을 기반으로 하듯 기본 원리나 식의 개형 자체가 하디-바인베르크 법칙과 흡사하다.
여기서 의문이 발생할 수 있는데, 하디-바인베르크 법칙은 멘델 집단을 전제로하는, 멘델 집단이 성립하는 공간에서만 성립한다.
멘델 법칙에 의하면 여러 조건이 있지만 그 중 하나가 근친교배가 없어야 한다는 것이다.
하지만 이 적용된 식은 근친교배가 적용된 대립유전자계의 관점이다. 즉, 멘델 집단이 성립할 수 없는 상태란 것이다.
따라서 해당 방정식은 근친교배와 같은 외부 요인이 유전자 빈도에 영향을 미치는 경우에서만 사용된다.
위 식을 F에 대한 식으로 바꿔보면 다음과 같다.
+2 [br] [math(F = \frac {p(1+q)q^2 - (1 - F)} {p(1+q)q^2} = 1 - \frac {(1 - F)} {p(1+q)q^2} = 1 - \frac {O Aa} {E Aa})]
여기서 [math(O Aa)]는 관찰된 실제 빈도, [math(E Aa)]는 예상되는 표현형 빈도를 의미한다.
3.2. 집단구조로 인한 분할[편집]
집단 유전학에서는 세 가지의 집단구조(FIS, FST, FIT)로 나뉘는데, F-통계량의 구성에 대해 설명할 때 잠깐 소개했다.
자세한 개념에 대해선 집단구조의 문서를 확인하길 바라고 우리는 FIT에 집중할 필요가 있다.
FIT는 Fixation index for Total Population, 즉 전체 집단에 대한 고정지수를 의미한다.
이 FIT는 모집단 내의 근친교배 정도와 모집단 간의 유전적 차이를 모두 반영한다.
즉, 모집단의 유전적 다양성을 측정을 하기에 매우 적합한 척도란 것이다.
그렇기 때문에 집단구조를 구성하는 개념들의 특성들을 역으로 적용해보면 다음과 같이 나타낼 수 있다.
+2 [br] [math(1-F_{IT} = (1-F_{IS})(1-F_{ST}))]
그리고 이항정리에 의해 확장이 될 수 있고, 이는 집단 하위 구조에 대해 추가로 더 분할될 수 있음을 시사하므로 개체(I)에 대한 분할은 다음과 같이 나타낸다.
+2 [br][math(1-F = \displaystyle \prod_{i=0}^{i=I} (1-F_{i,i+1}))]
3.3. 고정지수에서[편집]
FST는 다방면의 정의로 나뉘어 혼동을 주기 쉽다. 하지만 F-통계에선 다음과 같은 간략한 정의로 적용돼서 직관적으로 이해하기 쉽다.
+2 [br] [math(F_{ST} = \frac {var(S)}{S(1-S)})]