후보 유전자

Candidate gene

유전자 관련 연구를 수행하기 위한 후보 유전자 접근법은 사전 지정된 관심 유전자 내의 유전자 변이와 표현형 또는 질병 상태 사이의 연관성에 초점을 맞춘다.이것은 일반적인 유전자 변형(일반적으로 SNP)과 관심 특성 사이의 연관성을 위해 전체 게놈을 스캔하는 가설이 없는 접근법인 게놈 전체 연관성 연구(GWAS)와는 대조적이다.후보 유전자는 유전자의 생물학적 기능적 영향이 해당 [1][2]특성이나 질병에 미치는 선험적 지식을 바탕으로 연구를 위해 선택된다.게놈의 특정 생물학적으로 관련된 영역에서 대립 유전자의 변화에 초점을 맞춘 근거는 유전자 내의 특정 대립 유전자가 문제의 유전자의 기능에 직접 영향을 미칠 수 있고 표현형이나 질병 상태의 변화를 조사할 수 있다는 것이다.이 접근법은 종종 "후보 유전자의 대립 유전자가 질병이 없는 피험자보다 질병이 있는 피험자에게 더 자주 나타나는가?"라는 질문에 답하기 위해 환자-대조군 연구 설계를 사용합니다.[1]복잡한 특징과 관련이 있다고 가정된 후보 유전자는 일반적으로 후속 GWAS나[3][4][5][6] 고성능 복제 [7][8]시도에서는 복제되지 않았다.후보 유전자 연구가 그러한 특징의 기초가 되는 특정 유전자를 밝혀내지 못한 것은 통계적인 힘이 부족하고, 과학자들이 특징과 관련된 특정 유전자 내의 특정 대립 유전자를 정확하게 추측할 가능성이 낮기 때문이다.[9][6][10]

선택.

적절한 후보 유전자는 일반적으로 해당 질병에 대해 알려진 생물학적, 생리학적 또는 기능적 관련성에 기초하여 선택됩니다.이 접근법은 질병의 알려진 또는 이론적인 생물학에 대한 기존 지식에 의존함으로써 제한된다.하지만, 분자 도구는 질병 메커니즘에 대한 통찰력과 게놈에 대한 잠재적인 관심 영역을 정확히 파악할 수 있게 해준다.게놈 전체 연관 연구(GWAS)와 정량적 특성 궤적(QTL) 매핑은 전체 게놈에 걸친 공통의 변화를 조사하며, 따라서 잠재적 후보 유전자 내에 있거나 가까운 새로운 관심 영역을 검출할 수 있다.마이크로어레이 데이터를 통해 연구자들은 사례와 대조군 사이의 유전자 발현 차이를 조사할 수 있으며,[11] 관심 있는 새로운 잠재적 유전자를 찾아내는 데 도움을 줄 수 있다.

유기체 간의 큰 변동성은 때때로 질병과 관련된 [12]변이를 가진 후보 유전자와 단핵 다형(SNP)의 정상적인 변화를 구별하는 것을 어렵게 만들 수 있다.대량의 데이터를 분석할 때, 가장 가능성이 높은 변형을 도출하는 데 도움이 될 수 있는 몇 가지 다른 요인이 있습니다.이러한 요인에는 SNP의 우선순위, 유전자의 기능적 변화의 상대적 위험, SNP [13]간의 연관성 불균형 등이 포함된다.

또한 온라인 데이터베이스를 통한 유전자 정보의 가용성은 연구자들이 새로운 후보 유전자 [14]표적에 대한 기존 데이터와 웹 기반 자원을 채굴할 수 있게 해준다.여러 종의 유전자를 연구하기 위해 많은 온라인 데이터베이스를 이용할 수 있다.

  • 유전자는 표현형, 경로, 그리고 종에 걸친 많은 유전자의 변형에 대한 정보에 접근할 수 있게 해주는 데이터베이스입니다.
  • 경로에서 유전자 간의 기능을 조사할 때, Gene Ontology Consortium은 이러한 관계를 매핑하는 데 도움을 줄 수 있습니다.GO프로젝트는 유전자 생성물을 생물적 과정, 세포성분, 분자기능 등 3가지 방법으로 종에 구애받지 않는 방식으로 기술한다.이 정보를 사용하는 것은 경로에 대한 선험적 지식을 더 깊게 할 수 있고, 따라서 관련된 가장 가능성이 높은 후보 유전자를 선택하는 데 도움을 줄 수 있다.
  • Topp Gene은 사용자가 기능 주석이나 네트워크 [15]분석을 사용하여 후보 유전자의 우선순위를 지정할 수 있는 또 다른 유용한 데이터베이스입니다.ToppGene은 높은 처리량 게놈 기술을 통해 발견될 가능성이 높은 후보 유전자 집합에서 가능성 있는 후보 유전자의 서브셋을 선택하는 데 도움을 준다.
  • 링스는 기능 주석과 유전자 쌍 연결 네트워크를 [16]모두 사용하여 후보 유전자에 우선순위를 부여할 수 있는 통합 시스템 생물학 플랫폼입니다.링스는 치토와 [18]핀타라는 두[17] 가지 정교한 우선순위 부여 도구를 제공하여 사용자가 특정 질병이나 표현형에 기여하는 기존의 유전자 목록 또는 차세대 RNA 배열 기술에서 다르게 발현되는 유전자의 목록이 될 수 있는 입력 유전자 목록과의 관련성에 따라 전체 게놈에서 후보 유전자를 선택할 수 있도록 지원합니다.

후보-유전자 접근법 이전

후보 유전자 접근법이 완전히 개발되기 전에는 질병 상태와 관련된 유전자를 식별하기 위해 다양한 다른 방법이 사용되었다.이 방법들은 유전자 검사를 통해 유전자 연결과 위치 복제를 연구했고 멘델병에서 [13][19]상대적인 위험 유전자를 확인하는 데 효과적이었다.그러나, 이러한 방법들은 [13]몇 가지 이유로 복잡한 질병을 연구할 때 그다지 유익하지 않다.

  1. 복잡한 질병은 발병 연령과 심각도 모두에서 다른 경향이 있다.이는 투과도와 [20]표현력의 변화에 기인할 수 있습니다.대부분의 인간 질병의 경우, 질병 표현형의 가변적 표현성이 표준이다.따라서 특정 연령대 또는 표현형 마커를 선택하여 [13]연구하기 어렵습니다.
  2. 복잡한 질병의 기원은 많은 생물학적 경로를 포함하며, 그 중 일부는 질병 표현형에 [13]따라 다를 수 있다.
  3. 가장 중요한 것은, 복잡한 질병은 종종 유전적 이질성을 보여준다 – 하나의 질병 상태를 상호작용하고 생성하는 여러 유전자가 발견될 수 있다.종종, 각각의 단일 유전자는 부분적으로 생성된 표현형과 그 [13][21]장애의 전반적인 위험에 책임이 있다.

비판

후보 유전자에 대한 연구는 잘못된 양성 또는 음성 [13]결과를 생성할 가능성을 최소화하면서 데이터의 사용 균형을 맞추려고 합니다.이러한 균형은 종종 어려울 수 있기 때문에, 그러한 연구를 시작하기 전에 이해해야 할 중요한 유전자 후보 접근법에 대한 몇 가지 비판이 있다.예를 들어 후보-유전자 접근법은 높은 비율의 잘못된 양성을 생성하는 것으로 나타났으며, 이는 단일 유전자 연관성의 발견을 매우 [22]주의 깊게 다루어야 한다.

한 가지 비판은 후보-유전자 연구에서의 연관성 발견이 후속 [23]연구에서 쉽게 복제되지 않았다는 것이다.예를 들어, 18개의 잘 연구된 우울증 후보 유전자(각각 10개 이상의 출판물)에 대한 최근 조사는 원래 [24]출판물보다 더 큰 샘플 순서를 사용했음에도 불구하고 우울증과의 유의한 연관성을 식별하지 못했다.통계적 문제(예: 저전력 연구) 외에도 모집단 계층화는 종종 이러한 불일치의 원인으로 지목되어 왔다. 따라서 설계 연구의 [13]다른 변형뿐만 아니라 특정 표현형을 정의하는 기준에도 주의를 기울여야 한다.

게다가, 이러한 연구들이 선험적 지식을 포함하고 있기 때문에, 일부 비평가들은 우리의 지식이 유효한 예측을 하기에 충분하지 않다고 주장한다.따라서, 이러한 '열혈구 주도' 접근법에서 얻은 결과는 가설 없는 접근법을 사용하는 대신 게놈에서 그럴듯한 후보를 선택하는 능력에 달려 있다.

연구 연구에 사용

후보 유전자 접근법을 사용한 초기 성공 중 하나는 고트리글리세리드혈증아테롬성 동맥경화증의 [25]높은 위험과 관련된 APOC3(아폴리포단백질 C3 유전자)의 비코드 영역에서 단일 염기 돌연변이를 발견한 것이다.Kim 등의 연구에서, 돼지와 인간의 비만 형질과 관련된 유전자는 비교 유전체학 및 염색체 [26]유전성을 사용하여 발견되었다.이 두 가지 방법을 사용함으로써, 연구진은 후보 유전자 연구가 오로지 사전 지식에만 초점을 맞추고 있다는 비판을 극복할 수 있었다.비교 유전체학은 게놈 전체 복합 특성 분석(GCTA)으로 알려진 방법을 통해 인간과 돼지의 양적 특성 위치를 조사함으로써 완성되었으며, 이것은 연구자들이 유전자 차이를 특정 염색체에 매핑할 수 있게 했다.이를 통해 유전율 매개변수는 특정 염색체 영역에서 표현형 변이가 어디에 있는지 이해할 수 있었고, 따라서 이러한 영역 내의 후보 마커와 유전자로 확장되었다.Tiffin 등이 제2형 [12]당뇨병과 관련된 유전자를 연구한 한 연구와 같이, 다른 연구에서도 광범위한 보완적 방법으로 후보 유전자를 찾기 위해 계산 방법을 사용할 수 있다.

많은 연구들이 특성이나 표현형을 검사하기 위한 다학문적 접근의 일부로서 후보 유전자를 유사하게 사용해 왔다.후보 유전자를 조작하는 한 가지 예는 마틴 E에 의해 완료된 연구에서 볼 수 있다.열충격 단백질과 드로소필라 멜라노가스터[27]기능에 대한 연방정부의 연구입니다.Feder는 Hsp70을 연구하기 위해 전체적인 접근법을 고안했는데, Hsp70은 유기체가 스트레스에 어떻게 적응하는지에 대한 가설을 세운 후보 유전자이다.D. 멜라노가스터는 후보 유전자를 연구하기 위한 다양한 유전적 접근을 지원할 수 있기 때문에 이 특성을 연구하는데 매우 유용한 모델 유기체이다.이 연구는 Hsp70의 자연적 변이를 조사하는 것뿐만 아니라 후보 유전자를 유전자적으로 수정하는 것(부위 특이적 상동 재조합과 다양한 단백질의 발현을 사용)을 포함했다.그는 이러한 연구의 결과가 Hsp70에 대한 다면적인 관점을 제공한다고 결론지었다.후보 유전자의 조작은 Caspar C에서도 볼 수 있다.이끼인 Physcomitrella patens에서 기공의 기원과 기능에 대한 Chater의 연구.PpsSMF1, PpsSMF2, PpsSCRM1은 기공 발달의 변화를 보기 위해 상동 재조합에 의해 파괴된 세 가지 후보 유전자였다.녹다운 실험을 통해 Chater는 PpsMF1PpsCRM1이 P. patens의 [28]기공 발달을 담당한다는 것을 관찰했다.이러한 후보 유전자를 조작하고 수정함으로써, 그들은 이 유전자가 변화 표현형과 연결되는 방법을 확인할 수 있었다.자연 게놈 구조를 조사함으로써 이들 표현형이 작동하는 자연적, 역사적 맥락을 이해하는 것이 이를 보완했다.

레퍼런스

  1. ^ a b Kwon JM, Goate AM (2000). "The candidate gene approach" (PDF). Alcohol Research & Health. 24 (3): 164–168. PMC 6709736. PMID 11199286.
  2. ^ Zhu M, Zhao S (October 2007). "Candidate gene identification approach: progress and challenges". International Journal of Biological Sciences. 3 (7): 420–427. doi:10.7150/ijbs.3.420. PMC 2043166. PMID 17998950.
  3. ^ Johnson EC, Border R, Melroy-Greif WE, de Leeuw CA, Ehringer MA, Keller MC (November 2017). "No Evidence That Schizophrenia Candidate Genes Are More Associated With Schizophrenia Than Noncandidate Genes". Biological Psychiatry. 82 (10): 702–708. doi:10.1016/j.biopsych.2017.06.033. PMC 5643230. PMID 28823710.
  4. ^ Chabris CF, Hebert BM, Benjamin DJ, Beauchamp J, Cesarini D, van der Loos M, et al. (2012-09-24). "Most reported genetic associations with general intelligence are probably false positives". Psychological Science. 23 (11): 1314–1323. doi:10.1177/0956797611435528. PMC 3498585. PMID 23012269.
  5. ^ Bosker FJ, Hartman CA, Nolte IM, Prins BP, Terpstra P, Posthuma D, et al. (May 2011). "Poor replication of candidate genes for major depressive disorder using genome-wide association data". Molecular Psychiatry. 16 (5): 516–532. doi:10.1038/mp.2010.38. PMID 20351714.
  6. ^ a b Border R, Johnson EC, Evans LM, Smolen A, Berley N, Sullivan PF, Keller MC (May 2019). "No Support for Historical Candidate Gene or Candidate Gene-by-Interaction Hypotheses for Major Depression Across Multiple Large Samples". The American Journal of Psychiatry. 176 (5): 376–387. doi:10.1176/appi.ajp.2018.18070881. PMC 6548317. PMID 30845820.
  7. ^ Duncan LE, Keller MC (October 2011). "A critical review of the first 10 years of candidate gene-by-environment interaction research in psychiatry". The American Journal of Psychiatry. 168 (10): 1041–1049. doi:10.1176/appi.ajp.2011.11020191. PMC 3222234. PMID 21890791.
  8. ^ Culverhouse RC, Saccone NL, Horton AC, Ma Y, Anstey KJ, Banaschewski T, et al. (January 2018). "Collaborative meta-analysis finds no evidence of a strong interaction between stress and 5-HTTLPR genotype contributing to the development of depression". Molecular Psychiatry. 23 (1): 133–142. doi:10.1038/mp.2017.44. PMC 5628077. PMID 28373689.
  9. ^ Farrell MS, Werge T, Sklar P, Owen MJ, Ophoff RA, O'Donovan MC, et al. (May 2015). "Evaluating historical candidate genes for schizophrenia". Molecular Psychiatry. 20 (5): 555–562. doi:10.1038/mp.2015.16. PMC 4414705. PMID 25754081.
  10. ^ Risch N, Herrell R, Lehner T, Liang KY, Eaves L, Hoh J, et al. (June 2009). "Interaction between the serotonin transporter gene (5-HTTLPR), stressful life events, and risk of depression: a meta-analysis". JAMA. 301 (23): 2462–71. doi:10.1001/jama.2009.878. PMC 2938776. PMID 19531786.
  11. ^ Wayne ML, McIntyre LM (November 2002). "Combining mapping and arraying: An approach to candidate gene identification". Proceedings of the National Academy of Sciences of the United States of America. 99 (23): 14903–14906. Bibcode:2002PNAS...9914903W. doi:10.1073/pnas.222549199. PMC 137517. PMID 12415114.
  12. ^ a b Tiffin N, Adie E, Turner F, Brunner HG, van Driel MA, Oti M, et al. (2006). "Computational disease gene identification: a concert of methods prioritizes type 2 diabetes and obesity candidate genes". Nucleic Acids Research. 34 (10): 3067–3081. doi:10.1093/nar/gkl381. PMC 1475747. PMID 16757574.
  13. ^ a b c d e f g h Tabor HK, Risch NJ, Myers RM (May 2002). "Candidate-gene approaches for studying complex genetic traits: practical considerations". Nature Reviews. Genetics. 3 (5): 391–397. doi:10.1038/nrg796. PMID 11988764. S2CID 23314997.
  14. ^ Zhu M, Zhao S (October 2007). "Candidate gene identification approach: progress and challenges". International Journal of Biological Sciences. 3 (7): 420–427. doi:10.7150/ijbs.3.420. PMC 2043166. PMID 17998950.
  15. ^ Chen J, Bardes EE, Aronow BJ, Jegga AG (July 2009). "ToppGene Suite for gene list enrichment analysis and candidate gene prioritization". Nucleic Acids Research. 37 (Web Server issue): W305–W311. doi:10.1093/nar/gkp427. PMC 2703978. PMID 19465376.
  16. ^ Sulakhe D, Balasubramanian S, Xie B, Feng B, Taylor A, Wang S, et al. (January 2014). "Lynx: a database and knowledge extraction engine for integrative medicine". Nucleic Acids Research. 42 (Database issue): D1007–D1012. doi:10.1093/nar/gkt1166. PMC 3965040. PMID 24270788.
  17. ^ Xie B, Agam G, Balasubramanian S, Xu J, Gilliam TC, Maltsev N, Börnigen D (April 2015). "Disease gene prioritization using network and feature". Journal of Computational Biology. 22 (4): 313–323. doi:10.1089/cmb.2015.0001. PMC 4808289. PMID 25844670.
  18. ^ Nitsch D, Gonçalves JP, Ojeda F, de Moor B, Moreau Y (September 2010). "Candidate gene prioritization by network analysis of differential expression using machine learning approaches". BMC Bioinformatics. 11 (1): 460. doi:10.1186/1471-2105-11-460. PMC 2945940. PMID 20840752.
  19. ^ Teixeira LV, Lezirovitz K, Mandelbaum KL, Pereira LV, Perez AB (August 2011). "Candidate gene linkage analysis indicates genetic heterogeneity in Marfan syndrome". Brazilian Journal of Medical and Biological Research. 44 (8): 793–800. doi:10.1590/s0100-879x2011007500095. PMID 21789464.
  20. ^ Lobo I (2008). "Same genetic mutation, different genetic disease phenotype". Nature Education. 1 (1): 64.
  21. ^ Gizer IR, Ficks C, Waldman ID (July 2009). "Candidate gene studies of ADHD: a meta-analytic review". Human Genetics. 126 (1): 51–90. doi:10.1007/s00439-009-0694-x. PMID 19506906. S2CID 166017.
  22. ^ Sullivan PF (May 2007). "Spurious genetic associations". Biological Psychiatry. 61 (10): 1121–1126. doi:10.1016/j.biopsych.2006.11.010. PMID 17346679. S2CID 35033987.
  23. ^ Hutchison KE, Stallings M, McGeary J, Bryan A (January 2004). "Population stratification in the candidate gene study: fatal threat or red herring?". Psychological Bulletin. 130 (1): 66–79. doi:10.1037/0033-2909.130.1.66. PMID 14717650.
  24. ^ Border R, Johnson EC, Evans LM, Smolen A, Berley N, Sullivan PF, Keller MC (May 2019). "No Support for Historical Candidate Gene or Candidate Gene-by-Interaction Hypotheses for Major Depression Across Multiple Large Samples". The American Journal of Psychiatry. 176 (5): 376–387. doi:10.1176/appi.ajp.2018.18070881. PMC 6548317. PMID 30845820.
  25. ^ Rees A, Shoulders CC, Stocks J, Galton DJ, Baralle FE (February 1983). "DNA polymorphism adjacent to human apoprotein A-1 gene: relation to hypertriglyceridaemia". Lancet. 1 (8322): 444–446. doi:10.1016/s0140-6736(83)91440-x. PMID 6131168. S2CID 29511911.
  26. ^ Kim J, Lee T, Kim TH, Lee KT, Kim H (December 2012). "An integrated approach of comparative genomics and heritability analysis of pig and human on obesity trait: evidence for candidate genes on human chromosome 2". BMC Genomics. 13: 711. doi:10.1186/1471-2164-13-711. PMC 3562524. PMID 23253381.
  27. ^ Feder ME (July 1999). "Engineering Candidate Genes in Studies of Adaptation: The Heat-Shock Protein Hsp70 in Drosophila melanogaster". The American Naturalist. 154 (S1): S55–S66. doi:10.1086/303283. PMID 29586709. S2CID 4394996.
  28. ^ Chater CC, Caine RS, Tomek M, Wallace S, Kamisugi Y, Cuming AC, et al. (November 2016). "Origin and function of stomata in the moss Physcomitrella patens". Nature Plants. 2 (12): 16179. doi:10.1038/nplants.2016.179. PMC 5131878. PMID 27892923.

외부 링크