Voor het voorspellen van genen van een genoom waarvan de sequentie is bepaald, moet u een maximale intronlengte instellen. Hoe lang kunnen introns bij dieren komen? Is er een limiet?
Voor het voorspellen van genen van een genoom waarvan de sequentie is bepaald, moet u een maximale intronlengte instellen. Hoe lang kunnen introns bij dieren komen? Is er een limiet?
Ik denk dat de bovenstaande waarden (500-750 kb) verkeerd zijn. http://www.bioinfo.de/isb/2004040032/ laat zien dat de meeste introns kleiner zijn dan ongeveer 10 kb (en persoonlijke ervaring in Drosophila bevestigt dat - ik zelden een intron gezien groter dan ongeveer 5 kb). Er zijn enkele zeer grote, maar aangezien het bijna onmogelijk is om de splitsingsreactie te detecteren, vooral als ze erg groot zijn, is het niet duidelijk of ze zijn gesplitst als één GROOT intron of in plaats daarvan recursief zijn gesplitst (in kleine stappen, zoals in http://www.genetics.org/content/170/2/661.full.pdf+html). Ik denk dat het veilig is om te zeggen dat we niet weten hoe lang de grootste introns kunnen zijn.
Als je het menselijk genoom onderzoekt, is ~ 99% van de introns kleiner dan 500 kb. Ik neem aan dat een limiet tussen 250 kb - 500 kb redelijk is voor genvoorspelling. U kunt de juiste structuur van een klein aantal genen met deze zeer grote introns onjuist voorspellen, maar dit zou een klein aantal moeten zijn. Bovendien hebben de meeste populaire sequentie-aligners de neiging om een intronlengtegrens in te stellen tussen 500 kb en 750 kb.
Houd er rekening mee dat u het aantal valse positieve introns dat u detecteert, kunt verhogen als u deze limiet op hoog instelt. Daarom kan het de moeite waard zijn om een paar instellingen te proberen en de resultaten te evalueren.
BEWERK:
Ik vermoed dat grotere introns bij zoogdieren om twee redenen beperkt zijn.