최말짱 블로그

GWAS란? 본문

AI/의료 데이터 분석

GWAS란?

최말짱 2023. 1. 17. 15:58
728x90

 

 

 

GWAS란?

GWAS란?

📘 유전자와 연관된 형질을 찾는 하나의 탐색 방법

전장 유전체 연관 분석 (Genome Wide Association Study; GWAS)

  • Genome Wide = 전장 유전체 : 모든 유전체 위치에 대해서
  • Association Study = 연관 분석: 관심을 가진 형질(Target phenotype)과 연관성을 갖는 유전적 위치를 찾는다.

 

개념

일반적으로 **Case (관심 형질을 가진 집단; 환자군)**와 **Control (형질을 갖지 않는 집단; 정상군)**의 유전 정보를 서로 비교하여 → case에서 더 많은 빈도를 갖는 = 연관성을 가진 유전자를 찾는다.

  • 무수히 많은 형실이 어떤 유전자와 관련되어 있는지 실험적으로 찾는 것은 정말정말 어렵다 !
  • GWAS는 모든 유전자 위치에 대해 연관성의 정도를 분석하기 때문에, 1차적으로 관련되어 있는 후보 유전자를 찾아내는데 매우 유용한 탐색 도구이다.
  • BUT! GWAS에서 찾아낸 유전자라 하더라도, 그것이 항상 원인 유전자는 아니다. 즉 GWAS는 인과 관계를 찾는 것이 아니라 우연히 연관되어 나타나는 유전자들의 후보를 찾는 과정

 

일반적인 연구 과정

  1. GWAS를 통한 유전자 탐색
  2. 더 많은 환자군에서 확인(replication cohort)
  3. 동물&세포 실험에서 생물학적 입증

⇒ 이 과정을 통해 최종적으로 유전자-형질의 관계를 밝힘

 

중요

명확한 Case와 Control군을 확보하고, 통계적으로 분석이 가능한 충분한 수의 환자수를 확보해야 한다.

 

LD Block(연관 비평형)

LD Block (Linkage Disequilibrium; 연관 비평형) ****

우리는 부모로 부터 두 쌍의 염색체 쌍 (상동 염색체)을 물려 받아 무작위적으로 재조합이 일어난다.

그러나 유전자 재조합은 덩어리로 일어나기 때문에, 서로 거리가 가까운 유전자 위치 끼리는 유전형이 섞이지 않고 모자이크 패턴으로 함께 이동하게 되고 ⇒ 이러한 하나의 덩어리를 일반적으로 LD block이라고 한다.

  • 같은 LD block에 포함된 위치에 대해서 연관성 분석을 하게 되면, 동일한 연관성을 보인 p 값을 보인다.

 

LD Block으로 인한 GWAS 특징

  1. 분석 위치의 수 축소 => GWAS 분석은 30억쌍의 모든 염기 서열에 대해서 할 필요 없이 같은 LD block에서 대표적인 하나의 마커만 이용해도 된다.
  2. 정확한 원인 유전자의 위치는 LD block 내에 존재한 다른 위치일 수 있기 때문에 GWAS로 찾아낸 후보 위치 근처의 유전형을 상세하게 다시 살펴봐야 한다.
  3. LD Block으로 인해 GWAS에 흔히 이용되는 **Manhattan plot (맨하탄 플롯)**에서 시그널이 하나의 탑처럼 주위에서 모두 높게 나오게 된다.
  4. 흔히 Imputation이라고 부르는 과정을 통해, 같은 LD block 내의 검사하지 않은 부위의 유전형도 추정이 가능해진다.

 

추가

  • 많은 부분 형질과 유전형 간의 GWAS 연구 및 관계가 드러나는 중이다. 하지만연관성과 인과 관계는 달라서 확실한 생물학적 메카니즘으로 이를 설명하기 위해서는 후속 연구가 중요하다.
  • GWAS 연구를 통해 형질과 유전자 위치의 관계가 명확하게 드러난 데이터를 모아 놓은 것이 GWAS catalog 이다. ⇒ GWAS catalog 소개 영상

 

출처

 

전장 유전체 연관 분석, GWAS란 무엇인가?

어제 정신과 전문의 친구와 점심을 먹었습니다. 제가 병원 연구실에서 유전체 연구를 하는 것을 듣고, 함께 연구할 아이디어에 대해서 이야기를 나누자고 만났는데, 안타깝게도 GWAS에 대한 개념

2wordspm.wordpress.com

 

'AI > 의료 데이터 분석' 카테고리의 다른 글

MIMIC-3란?  (0) 2023.01.16