Contido GC
En bioloxía molecular e xenética, o contido GC, contido guanina-citosina, porcentaxe GC ou contido G+C (ás veces razón GC) é a porcentaxe de bases nitroxenadas dunha molécula de ADN que son guanina ou citosina de entre o total das catro baes posibles (adenina, timina, guanina e citosina). O contido GC pode referirse a un determinado fragmento de ADN, a un cromosoma completo ou a un xenoma enteiro. Pode aplicarse tamén ao ARN (que tería uracilo en vez de timina). Cando se refire a un fragmento do material xenético este pode ser unha parte dun xene (dominio), un só xene completo, un grupo de xenes (ou cluster), ou mesmo a unha rexión non codificante.
Nas medicións en xenomas bacterianos o normal é expresalo en %mol.
A guanina (G) e a citosina (C) emparéllanse no ADN formando 3 enlaces de hidróxeno, mentres que a timina (T) e a adenina (A) únense entre si por medio de dous destes enlaces. O ADN cun alto contido GC é máis estable que o de contido baixo porque forman máis pontes de hidróxeno, aínda que o que máis inflúe na estabilización do ADN son as interaccións entre as bases amoreadas.[1] A pesar da alta termoestabilidade que un alto contido GC lle dá ao material xenético, as células con alto contido GC de bacterias sofren autólise, reducindo dese modo a lonxevidade da célula.[2] Debido á robustez que lle dá ao material xenético ter un alto contido GC, críase tradicionalmente que un ADN cun contido GC elevado era unha adaptación importante ás altas temperaturas no medio, pero esta hipótese foi posta en dúbida recentemente nun estudo comparativo entre procariotas.[3] Porén, o mesmo estudo mostrou unha forte relación entre as temperaturas altas e o contido GC alto dos ARNs estruturados (como o ARN ribosómico, o ARN transferente, e moitos outros ARN non codificantes). Nos ARN os pares de bases GC son máis estables que os AU, debido a que forman un enlace e hidróxeno máis, e isto fai que as estruturas con ARN (que forman enlaces intracatenarios) sexan máis tolerantes ás altas temperaturas. Máis recentemente, a primeira análise xenómica a grande escala demostrou a correlación entre o contido GC e a temperatura para certas rexións xenómicas (as codificantes) pero non para outras.[4]
Nos experimentos de PCR, o contido GC dos cebadores utilízase para predicir a temperatura de annealing co ADN molde. Un maior contido GC indica unha maior temperatura de fusión.
Determinación do contido GC
editarO contido GC exprésase xeralmente como unha porcentaxe do contido en bases G e C no total de bases. A porcentaxe GC calcúlase coa seguinte fórmula:[5]
Outra forma distinta de medir a cantidade de G e C, que non se debe confundir coa anterior, é por medio da razón AT/GC, que é a razón entre o contido en G e C con respecto ao contido en A e T. A razón AT/GC calcúlase así:[6]
- .
O contido GC pode medirse de diversas maneiras, pero un dos métodos máis simples é medir a temperatura de fusión do ADN de dobre cadea utilizando espectrofotometría. A absorbancia do ADN á lonxitude de onda de 260 nm increméntase moito cando se separan as cadeas da dobre hélice do ADN ao ser quentadas.[7] Pode utilizarse tamén para a determinación a citometría de fluxo para grandes cantidades de mostras.[8]
De forma alternativa, se a molécula de ADN ou ARN estudada foi secuenciada entón o contido GC pode ser calculado con precisión por simple aritmética ou usando a calculadora GC en liña.
Contido GC e xenes
editarOs contidos GC entre rexións dun xenoma son moi variables. Estas variacións nos xenomas dos organismos máis complexos dan lugar a unha formación de tipo mosaico con rexións illa chamadas isocoros.[9] Isto dá lugar a variacións na intensidade de tinguidura dos cromosomas.[10] Os isocoros ricos en GC inclúen moitos xenes que codifican proteínas, e deste modo a determinación do contido GC desas rexións específicas contribúe a mapar as rexións ricas en xenes do xenoma.[11][12]
Por tanto, os xenes caracterízanse por ter un alto contido GC en comparación co contido GC de fondo de todo o xenoma. A lonxitude da secuencia codificante é directamente proporcional ao contido GC.[13][14]
Contido GC e filoxenia
editarO contido GC é moi variable entre os distintos organismos. O contido GC alto pode ter que ver co nesgo na reparación do ADN asociada á recombinación, que incrementa o contido GC, o que inflúe na evolución dos organismos.[15] O problema de determinar o límite das especies na taxonomía dos procariotas levou a que se fixesen diversas recomendacións para a clasificación dos procariotas, como a do Comité ad hoc sobre a reconciliación dos enfoques en sistemática bacteriana, que recomenda utilizar o contido GC para a clasificación dos niveis taxonómicos superiores.[16] Por exemplo, as Actinobacteria caracterízanse polo seu alto contido GC[17] (en Streptomyces coelicolor A3(2), o contido GC é 72%).[18] O contido GC do lévedo (Saccharomyces cerevisiae) é de 38%,[19] e o doutro organismo modelo común como a planta Arabidopsis thaliana é de 36%.[20]
Debido á natureza do código xenético (con codóns que utilizan todas as bases) é virtualmente imposible que un organismo teña un xenoma cun contido GC próximo a 0% ou 100%, por iso son raros os casos de especies cun contido GC extraordinariamente baixo como Plasmodium falciparum (GC% = ~20%),[21] que é un organismo rico en AT ou pobre en GC.[22]
Especie | Grupo filoxenético | Contido GC |
---|---|---|
Streptomyces coelicolor Myxococcus xanthus Halobacterium sp. Saccharomyces cerevisiae (lévedo) Arabidopsis thaliana Methanosphaera stadtmanae Plasmodium falciparum (axente da malaria) |
Actinobacteria Deltaproteobacteria Arquea Ascomiceto (fungo) Planta con flor Arquea Protozoo |
72 % 68 % 67 % 38 % 36 % 27 % ≈20 % |
Notas
editar- ↑ Yakovchuk P, Protozanova E, Frank-Kamenetskii MD (2006). "Base-stacking and base-pairing contributions into thermal stability of the DNA double helix". Nucleic Acids Res. 34 (2): 564–74. PMC 1360284. PMID 16449200. doi:10.1093/nar/gkj454.
- ↑ Levin RE, Van Sickle C (1976). "Autolysis of high-GC isolates of Pseudomonas putrefaciens". Antonie Van Leeuwenhoek 42 (1–2): 145–55. PMID 7999. doi:10.1007/BF00399459.
- ↑ Hurst LD, Merchant AR (2001). "High guanine-cytosine content is not an adaptation to high temperature: a comparative analysis amongst prokaryotes". Proc. Biol. Sci. 268 (1466): 493–7. PMC 1088632. PMID 11296861. doi:10.1098/rspb.2000.1397.
- ↑ Zheng H, Wu H (2010). "Gene-centric association analysis for the correlation between the guanine-cytosine content levels and temperature range conditions of prokaryotic species". BMC Bioinformatics 11: S7. PMC 3024870. PMID 21172057. doi:10.1186/1471-2105-11-S11-S7.
- ↑ Madigan,MT. and Martinko JM. (2003). Brock biology of microorganisms (10th ed.). Pearson-Prentice Hall. ISBN 84-205-3679-2.
- ↑ "Definition of GC-ratio on Northwestern University, IL, USA". Arquivado dende o orixinal o 20 de xuño de 2010. Consultado o 17 de xullo de 2013.
- ↑ Wilhelm J, Pingoud A, Hahn M (2003). "Real-time PCR-based method for the estimation of genome sizes". Nucleic Acids Res. 31 (10): e56. PMC 156059. PMID 12736322. doi:10.1093/nar/gng056.
- ↑ Vinogradov AE (1994). "Measurement by flow cytometry of genomic AT/GC ratio and genome size". Cytometry 16 (1): 34–40. PMID 7518377. doi:10.1002/cyto.990160106.
- ↑ Bernardi G (2000). "Isochores and the evolutionary genomics of vertebrates". Gene 241 (1): 3–17. PMID 10607893. doi:10.1016/S0378-1119(99)00485-0.
- ↑ Furey TS, Haussler D (2003). "Integration of the cytogenetic map with the draft human genome sequence". Hum. Mol. Genet. 12 (9): 1037–44. PMID 12700172. doi:10.1093/hmg/ddg113.
- ↑ Sumner AT, de la Torre J, Stuppia L (1993). "The distribution of genes on chromosomes: a cytological approach". J. Mol. Evol. 37 (2): 117–22. PMID 8411200. doi:10.1007/BF02407346.
- ↑ Aïssani B, Bernardi G (1991). "CpG islands, genes and isochores in the genomes of vertebrates". Gene 106 (2): 185–95. PMID 1937049. doi:10.1016/0378-1119(91)90198-K.
- ↑ Pozzoli U, Menozzi G, Fumagalli M; et al. (2008). "Both selective and neutral processes drive GC content evolution in the human genome". BMC Evol. Biol. 8: 99. PMC 2292697. PMID 18371205. doi:10.1186/1471-2148-8-99.
- ↑ Wuitschick JD, Karrer KM (1999). "Analysis of genomic G + C content, codon usage, initiator codon context and translation termination sites in Tetrahymena thermophila". J. Eukaryot. Microbiol. 46 (3): 239–47. PMID 10377985. doi:10.1111/j.1550-7408.1999.tb05120.x.
- ↑ Birdsell JA (1 July 2002). "Integrating genomics, bioinformatics, and classical genetics to study the effects of recombination on genome evolution". Mol. Biol. Evol. 19 (7): 1181–97. PMID 12082137.
- ↑ Wayne LG; et al. (1987). "Report of the ad hoc committee on reconciliation of approaches to bacterial systematic". International journal of systematic bacteriology 37 (4): 463–4. doi:10.1099/00207713-37-4-463.
- ↑ Taxonomy browser on NCBI
- ↑ Whole genome data of "Streptomyces coelicolor" A3(2) on NCBI
- ↑ Whole genome data of Saccharomyces cerevisiae on NCBI
- ↑ Whole genome data of Arabidopsis thaliana on NCBI
- ↑ Whole genome data of Plasmodium falciparum on NCBI
- ↑ Musto H, Cacciò S, Rodríguez-Maseda H, Bernardi G (1997). "Compositional constraints in the extremely GC-poor genome of Plasmodium falciparum" (PDF). Mem. Inst. Oswaldo Cruz 92 (6): 835–41. PMID 9566216. doi:10.1590/S0074-02761997000600020.