Vraag:
Hoeveel menselijke eiwitten hebben een opgeloste 3D-structuur?
Gergana Vandova
2011-12-23 10:27:46 UTC
view on stackexchange narkive permalink

Ik vroeg me af hoeveel menselijke eiwitten een opgeloste 3D-structuur hebben. Is er een database met alleen menselijke eiwitten? Ik heb naar pdb gekeken maar kon geen filter vinden.

Ik denk dat je veel problemen zult hebben met redundantie, vooral als je het aantal unieke eiwitten wilt weten.
@GWW Ik denk dat het schrijven van een klein script de redundantie kan wegnemen.
Misschien heb je meer geluk met het stellen van deze vraag op [biostar] (http://biostar.stackexchange.com).
Merk op dat "opgelost" erg subjectief is. Niet alle structuren zijn van hoge kwaliteit, en sommige zijn gewoonweg onjuist vanwege experimentele fouten.
Dit is een zeer subjectieve vraag om twee redenen: De Protein Databank accepteert NMR en kristalstructuren van eiwitten die verschillende graden van resolutie en nauwkeurigheid bieden. Deze structuren zijn ook enigszins subjectief omdat het eiwit verschillende conformaties kan aannemen, afhankelijk van de relevante biologische context. Ten derde kunnen de oplosmiddelextracties een foutieve structuur opleggen.
van veel van deze eiwitten is slechts een of twee domeinen opgelost als structuren. dierlijke eiwitten zijn zo moeilijk. dat is waar deze vraag een beetje moeilijk wordt imho.
Vier antwoorden:
#1
+19
Michael Kuhn
2011-12-23 17:17:45 UTC
view on stackexchange narkive permalink

6405 eiwitten die in kaart zijn gebracht op 5220 genen, volgens Ensembl.

In Ensembl's BioMart kunt u de PDB-ID als externe referentie selecteren. Exporteer de resultaten en tel de unieke eiwitten / genen die een VOB-ID hebben.

#2
+12
Aleksandra Zalcman
2012-01-15 06:06:53 UTC
view on stackexchange narkive permalink

PDB is een goede bron voor het beantwoorden van dergelijke vragen, omdat u hiermee resultaten kunt filteren op veel aanvullende parameters. Om 3D-structuren van menselijke eiwitten te tellen en te extraheren:

  1. Open het tabblad Geavanceerd van de PDB-website.
  2. Selecteer Biologie -> Bronorganisme uit het menu.
  3. Typ Homo sapiens (mens) .
  4. U kunt redundantie verminderen door check Vergelijkbare reeksen verwijderen op n% identiteit hieronder.
  5. Vraag indienen.

Om meer filters toe te voegen, klikt u op Zoekopdracht verfijnen met Geavanceerd zoeken . Daar kunt u structuren extraheren op afzettingsdatum, kwaliteit (bijv. Resolutie of R-factoren voor structuren opgelost door röntgendiffractie), liganden, enzymclassificatie, enz. (Door Zoekcriteria toevoegen aan te vinken)

Zoeken naar menselijke eiwitten met verwijdering van homologen met 90% identiteitsgrens haalt 7117 structuren op. Het aantal röntgenproteïnestructuren van goede kwaliteit (resolutie < 2.5A) is momenteel 3964 (met dezelfde identiteitsgrens).

U kunt vervolgens de opgehaalde lijst downloaden of aangepaste rapporten maken (menu's hieronder).

Een goed hulpmiddel (ook gebruikt door PDB) voor het genereren van niet-redundante eiwitdatasets is cd-hit.

#3
+3
GWW
2011-12-23 10:45:18 UTC
view on stackexchange narkive permalink

Op basis van uw opmerkingen lijkt het er niet op dat u tegen het schrijven van enkele aangepaste scripts bent, dus een optie zou zijn om te profiteren van de NCBI Structure-database. U kunt het filteren op organisme en de resultaten vervolgens downloaden als een tekstbestand / XML. Als u toegang nodig heeft tot de onbewerkte PDB-gegevens, kunt u het PDB-archief downloaden en de bestanden in uw gefilterde lijst bekijken.

#4
  0
PDB annotator
2015-04-19 10:53:55 UTC
view on stackexchange narkive permalink

Het nieuwe zoeksysteem van PDB is ontworpen om precies zulke vragen te beantwoorden http://www.ebi.ac.uk/pdbe/entry/search/index?organism_synonymous:HUMAN&view=macromolecules

toont aan dat er 6964 unieke menselijke macromoleculen zijn met structuurgegevens in het PDB.

Natuurlijk zullen veel fragmenten van eiwitten zijn in plaats van het hele molecuul.



Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...