Vraag:
Wat zijn de beperkende factoren voor genlengte en aantal exons?
Daniel Standage
2011-12-15 04:11:58 UTC
view on stackexchange narkive permalink

Ik heb onlangs genannotaties voor Homo sapiens van Ensembl gedownload voor wat bioinformatische analyse. De overgrote meerderheid van de genannotaties heeft 20 exons of minder, hoewel er enkele zijn die er wel 250 hebben. Ik weet genoeg over genannotaties om deze voorspellingen met een korreltje zout te nemen, maar het zette me aan het denken ... wat zijn de biologisch relevante factoren die de lengte, het aantal exon, enz. van een gen kunnen beperken? Is er een reële mogelijkheid dat een gen 50 exonen heeft? 100 exonen? 250 exonen? Waar wordt de lijn getrokken vanuit biologisch standpunt en waarom?

Hoe heb je de genen / exon-annotaties teruggevonden? BioMart of EnsEMBL API?
Ik heb de gecomprimeerde (gzip) GTF-bestanden rechtstreeks van de FTP-site met wget.
De EnsEMBL Perl API is een coole manier om de precieze gegevens op te halen die je nodig hebt - http://www.ensembl.org/info/docs/api/index.html
Drie antwoorden:
#1
+10
user49
2011-12-15 04:43:37 UTC
view on stackexchange narkive permalink

Deze vraag valt stevig in de schoot van de moleculaire evolutie en de beperkingen die aan genen worden gesteld door de krachten van mutatie, selectie, drift en recombinatie.

Er zijn talloze situaties, met name genduplicatie, dat kan resulteren in een gen dat vrij is van de selectieve beperkingen van zijn ouder, waarvan er vele zoveel schadelijke mutaties zullen accumuleren als gevolg van stochastische processen dat ze niet-functioneel worden, bijvoorbeeld psuedogenes. Sommige kunnen worden gewijzigd en herschikt, waarbij exonen en introns worden verzameld, en als ze een fitnessvoordeel voor het organisme afleiden, kunnen ze worden verplaatst naar fixatie binnen een populatie.

Evolutie is een proces van populatiegenetica, en er zijn er veel variabelen die de uitkomst kunnen beïnvloeden, niet in de laatste plaats het verschil in populatiegrootte. De genomen van grotere populaties (zoals die van bacteriën) lijken veel kleinere genomen te hebben, en natuurlijk geen (althans niet spliceosomale) introns, misschien als gevolg van een verhoogde fitheid door de kortere generatietijd van een organisme met een meer slank genoom. Het zou een goed idee zijn om The Origins of Genome Architecture van Michael Lynch te lezen, aangezien ik denk dat hij uw vragen beter beantwoordt dan ik.

Veel van de genen die u uit EnsEMBL haalt, hebben natuurlijk experimenteel bewijs om ze te ondersteunen. De genen die in de pijplijn worden voorspeld, kunnen met minder vertrouwen worden bekeken, maar je kunt natuurlijk kijken naar de uitlijningen met nauw verwante soorten om te zien of je denkt dat de introns / exons inderdaad levensvatbaar zijn. Een voorbeeld van een gen met 79 exons is het Dystrophin (DMD) -gen, het langste geannoteerde gen bij 2.217.347 bp (zie Roberts et al., 1993 en Nishio et al, 1994 ).

#2
+3
user59
2011-12-15 04:49:47 UTC
view on stackexchange narkive permalink

Ik betwijfel of er echt een directe beperking is; de beste test zou zijn om te controleren of de grootte overeenkomt, d.w.z. dat 1kbp-gen met 100 exons liever veel te korte introns heeft.

Snel zoeken in NCBI-genen toont zelfs een 317-exon-gen aan, hoewel al die randgevallen enkele onduidelijke broers en zussen lijken te zijn van titine, dat op zichzelf gewoon enorm is.

Over kwaliteitscontrole van annotaties gesproken, men moet nadenken over de moleculaire beperkingen van de grootte van een exon, of intron trouwens. De (theoretische) minimale lengte van een exon zou 1 bp moeten zijn, hoewel men ook zou moeten nadenken over de binding van moleculaire machinerie die betrokken is bij de herkenning van exon-introngrenzen en de splitsing van aangrenzende exons. Ik zou moeten denken dat exons van minder dan 6 bp waarschijnlijk niet als functioneel worden beschouwd? Zie http://www.jbc.org/content/270/6/2411.full en http://mbe.oxfordjournals.org/content/23/12/2392.full
#3
+3
shigeta
2011-12-15 05:11:02 UTC
view on stackexchange narkive permalink

Ben het eens met mbq - titan is het langste gen dat ik ken en het heeft meer dan 100 exonen. Titin en dystrophin zijn genetisch goed gekarakteriseerd en geen voorspellingen. titin is de kampioen-exoner met 363 exons.

De enige voorbeelden zoals deze die de genvoorspellers kunnen laten draaien zolang ze dat doen, denk ik, aangezien de voorspellingen heuristisch worden bijgesneden om te lijken op de bekende genstructuren / lengtes / kruispunten enz.

Dystrofine is het langste gen, maar codeert niet voor het langste product, wat natuurlijk Titin is. 363 exons is een geweldig aantal! Lol :)


Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...