Wat is de minimale populatiegrootte waarop de berekeningen van Hardy-Weinberg kunnen worden toegepast?

Vraag:

Ben

2013-03-14 17:38:48 UTC

view on stackexchange narkive permalink

Ik probeer uit te vinden of een bepaald allel in onevenwichtigheid van Hardy-Weinberg verkeert, maar de gegevens zijn slecht. Wat is het minimale populatie-aantal dat je kunt gebruiken om een respectabele conclusie te trekken?

Ik heb gehoord dat het minimaal 5 individuen is voor elk genotype, maar ik kan daar geen bron voor vinden.

Een antwoord:

timcdlucas

2013-05-22 06:17:14 UTC

view on stackexchange narkive permalink

U kunt energieanalyse gebruiken om antwoorden te vinden op basis van de specifieke kenmerken van uw gegevens. De dingen die u in overweging moet nemen zijn:

De kracht van de test . Dit is de kans dat de test de nulhypothese niet verwerpt, zelfs als deze in werkelijkheid onwaar is (type II-fout). Als de populatie niet in evenwicht is, hoe groot is de kans dat de test dit niet zal detecteren? Dit hangt grotendeels af van de kosten van een type II-fout. Als het experiment duur is in termen van tijd / geld / gebruikte dieren enz., Zou je er zeker van willen zijn dat het aan het eind een verkocht antwoord geeft.
Het significantieniveau . 0,05 wordt vaak gebruikt. De kans dat de nulhypothese wordt verworpen, ook al is deze waar (Type I-fout). Als de populatie in evenwicht is, wat is dan de kans dat de test ten onrechte zal zeggen dat ze in onevenwicht is.
De vrijheidsgraden . Het aantal allelen.
De effectgrootte . Dit is hoe ver weg van het evenwicht dat uw monsters verwijderd zijn. De grootste effectgrootte zou het uitsterven van één allel zijn. Als twee allelen echter een verhouding hebben van 100: 101 over de volledige populatie, is dit een kleine effectgrootte.

Voor de Pearson's Chi-squared test kan (in R)

  bibliotheek (pwr) pwr.chisq.test (w = 0.3, N = 40, df = 4, sig.level = 0.05)

Een grove richtlijn voor effectgrootte ( w ) is 0,1, 0,3 en 0,5 voor kleine, middelgrote en grote effectgroottes. hier vindt u meer informatie. N is het totale aantal datapunten, df is het aantal allelen. Deze functie geeft ons een waarde voor 1 min de kracht van onze test. Een waarde van 0,9 betekent dat er een kans van 10% is om een effect dat echt bestaat niet te detecteren.

Als we een geschikt aantal datapunten willen berekenen om te verzamelen, moeten we beslissen welk vermogen we willen. Stel dat we besluiten dat een kans van 0,01 om de test te doen, maar het niet detecteren van onevenwichtigheid als het bestaat, acceptabel is.

  pwr.chisq.test (w = 0.3, df = 4, sig.level = 0.05, power = 0.99)

vertelt ons dat 280 datapunten nodig zijn.

Zonder schattingen van effectgrootte of een aantal genotypen is het moeilijk om een rechtlijnig antwoord op uw vraag, maar 5 per genotype lijkt erg klein.

Als u slechts twee genotypen heeft, kunt u ervoor kiezen om de Fisher Exact Test te gebruiken, in welk geval u power.fisher.test () in het statmod -pakket. De definities van effectgrootte en vrijheidsgraden zijn iets anders, maar het idee is hetzelfde.

+1: leuk om te zien dat machtsanalyse zo nu en dan wordt genoemd ... maar al te vaak slaan biologen deze dingen over.

Bedankt, hoewel ik dit lang geleden heb gevraagd en het nu niet erg relevant voor mij is, weet ik zeker dat dit mensen in de toekomst zal helpen!

Ja, ik wist dat het oud was. Maar zoals je zegt, hopelijk nuttig voor anderen. Omdat ik een miljoen keer informatie van Stackexchange heb gekregen maar nooit een vraag heb gesteld, weet ik dat het potentieel waar is.

ⓘ

Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.

info - legalese