Vraag:
Hoe worden de grenzen van een gen bepaald?
ghchinoy
2011-12-19 22:16:43 UTC
view on stackexchange narkive permalink

Welke statistische processen en methoden worden door genetici / moleculair biologen gebruikt om te weten waar het ene gen begint en het andere eindigt?

Waar verwijst de "basic" -tag naar?
Ik dacht dat de vraag meer een fundamentele vraag was om de groep te zaaien, dus ik tagde het _basic_. Als dat geen protocol is, kunt u deze verwijderen.
@ghchinoy: Ik heb het opnieuw getagged, ervan uitgaande dat het een [metatag] is (http://blog.stackoverflow.com/2010/08/the-death-of-meta-tags/) (hoewel het _is_ een vraag over basenparen)
Ter verduidelijking: we hebben het hier over * eiwitcoderende genen *, toch? Er zijn er nog veel meer waarvoor de methoden totaal verschillend zijn.
@KonradRudolph zou je misschien kunnen verwijzen naar de andere gentypes en methoden? Bedankt.
@ghchinoy Ter illustratie: ik werk momenteel aan tRNA-genen en aangezien ze een andere polymerase gebruiken, zien hun promotor en terminatiesite er duidelijk anders uit. Hetzelfde geldt voor alle andere niet-coderende RNA's en dan zijn er zaken als pseudogenen en LINE's / SINE's (die worden meestal niet als genen beschouwd, maar vanwege hun gelijkenis met niet-coderende RNA-genen bemoeilijken ze de analyse). Toch zijn er eigenlijk bioinformatische methoden om die genen te vinden. Voor zover ik weet, gebruiken ze overwegend zoeken naar motieven.
Vier antwoorden:
#1
+12
agrimaldi
2011-12-20 00:02:46 UTC
view on stackexchange narkive permalink

Ik ken maar één naïeve benadering om de grenzen van een gen te bepalen: RACE-PCR. Er zijn twee soorten, 3 'en 5' RACE, waarmee de respectievelijke extremiteiten kunnen worden gevonden.

De grondgedachte is de volgende:

  • Je voert een reverse transcriptie van het transcript van interesse met behulp van een specifieke primer. Bij deze stap heb je een specifiek enkelstrengs cDNA.

  • Vervolgens voeg je een stuk identieke nucleotiden toe, de homopolymere staart genaamd, in 5 'van het cDNA.

  • Ten slotte voer je een PCR uit met een specifieke primer en een universele primer die de homopolymere staart herkent. U kunt uw geamplificeerde cDNA sequencen en met een resolutie van 1 bp zoeken waar het zich in het genoom bevindt.

Voor de 3'RACE is het concept hetzelfde, maar de poly-A-staart wordt gebruikt in plaats van deze zelf te genereren met de terminale transferase.

Zie dit artikel voor een gedetailleerd protocol:

Sambrook J, Russell DW . 2006. Snelle versterking van 5 'cDNA-uiteinden (5'-RACE). CSH-protocollen 2006.

Het bijbehorende Wikipedia-artikel geeft u ook meer details over wat er bij elke stap gebeurt, maar let op, er is een fout: het is zei dat voor de 5'RACE, de terminale transferase de homopolymere staart toevoegt in 3 'terwijl hij deze toevoegt in 5'

-1: dat kan een goede benadering zijn om de grenzen van een ORF te zien (om eerlijk te zijn, je hebt niet altijd een RACE nodig, een simpele PCR kan ook werken), niet van een gen. Hoe zit het met de promotor en regulerende elementen? Wat is ook het voordeel vergeleken met bijvoorbeeld een bio-informatica-benadering na sequencing?
@nico: dus met de definitie die u opgeeft, heeft een gen geen grenzen.
@nico: Ok, ik begrijp je punt, maar ik denk niet dat het OP deze definitie van een gen in gedachten had. Ik ben het er ook volledig mee eens dat nieuwe technologieën zoals RNA-seq u een uitgebreider antwoord geven voor genoomannotatie.
we kunnen uren discussiëren over de juiste definitie van een gen, maar ik denk niet dat er veel te bespreken valt over het feit dat de promotor deel uitmaakt van een gen. En door retrotranscriptie van mRNA krijg je de promotor niet.
#2
+8
Gergana Vandova
2011-12-20 00:20:29 UTC
view on stackexchange narkive permalink

Er is verschillende software waarin u uw sequentie kunt invoeren (laten we zeggen de hele genoomsequentie) en het kan voor u de vermeende open reading frames (ORF's) identificeren, d.w.z. de startcodons en de stopcodons. Vervolgens kunt u, door deze vermeende genen te gebruiken, een sequentie-uitlijning uitvoeren door BLAST te gebruiken en vervolgens, op basis van de scores, kunt u bevestigen dat dit echt ORF's zijn. Aangezien dit de statistische benadering is, kunt u uw resultaten vervolgens in het natte laboratorium verifiëren, zoals agrimaldi suggereerde.

Maar * hoe * bepalen die software gengrenzen? Wat zoeken ze dat indicatief is voor een gengrens?
Misschien moet er nog een andere vraag worden gesteld, specifiek over welke programmatische technieken worden gebruikt? Misschien met een bioinformatica-tag.
@RichardSmith Ze zijn in feite op zoek naar startcodons (ATG, GTG) die het begin van het open leesframe (ORF) definiëren, en stopcodons (TAG, TAA, TGA), die het einde van de ORF definiëren, en ook controleren of de aantal basen tussen het startcodon en het stopcodon is deelbaar door 3.
@ghchinoy Ja, dat zou interessant kunnen zijn, maar ik denk niet dat het ingewikkelder is dan ik al aan Richard heb uitgelegd. Je kunt natuurlijk nog een paar "checks" toevoegen die de software kan doen, zoals de lengte van de ORF.
#3
+6
KAM
2011-12-24 18:28:09 UTC
view on stackexchange narkive permalink

Als het uw doel is om de grenzen van de transcriptie-eenheid (het deel van het DNA dat wordt getranscribeerd) te definiëren, is het bovenstaande antwoord juist, hoewel veel mensen alleen homologie gebruiken voor gekloonde cDNA's in plaats van RACE-reacties. Deze benadering heeft het voordeel dat tegelijkertijd alternatieve splitsingsvormen worden gedefinieerd.

Als het uw doel is om de "uiteinden" van het gen te definiëren, kan dit alleen empirisch en functioneel worden gedaan omdat controle-elementen (grenzen, enhancers, enz.) zijn onmogelijk te herkennen met behulp van informatica, en zelfs als men enhancers vindt, is het niet zeker dat die enhancers worden gebruikt met specifieke genen. Sommige genen kunnen miljoenen basenparen lang zijn, dus er zijn honderden andere genen tussenbeide. De "gouden standaard" voor het definiëren van de grenzen van genen is om het fenotype met verlies van functie van een mutatie te redden met een transgen dat het gen van belang bevat. Als het DNA dat weer in een organisme wordt getransformeerd, de wild-type toestand van een mutatie van een gen kan herstellen, wordt aangenomen dat alle belangrijke delen van dat gen zich in het transgen bevinden.

#4
+3
AnnaF
2011-12-19 23:04:57 UTC
view on stackexchange narkive permalink

Over het algemeen volg je het genoom op volgorde en zoek je naar aanwijzingen. Er zijn gewoonlijk specifieke sequenties die aan een gen voorafgaan en die de translationele apparatuur helpen te weten "hallo hier beginnen we", evenals gebieden waar eiwitten kunnen binden die worden gebruikt om de vertaling van het gen te versterken of te remmen.

Computers kan worden geprogrammeerd om door de reeks te zoeken en mogelijke kandidaten naar voren te brengen die mensen beter kunnen bekijken.



Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...