U kunt energieanalyse gebruiken om antwoorden te vinden op basis van de specifieke kenmerken van uw gegevens. De dingen die u in overweging moet nemen zijn:
- De kracht van de test . Dit is de kans dat de test de nulhypothese niet verwerpt, zelfs als deze in werkelijkheid onwaar is (type II-fout). Als de populatie niet in evenwicht is, hoe groot is de kans dat de test dit niet zal detecteren? Dit hangt grotendeels af van de kosten van een type II-fout. Als het experiment duur is in termen van tijd / geld / gebruikte dieren enz., Zou je er zeker van willen zijn dat het aan het eind een verkocht antwoord geeft.
- Het significantieniveau . 0,05 wordt vaak gebruikt. De kans dat de nulhypothese wordt verworpen, ook al is deze waar (Type I-fout). Als de populatie in evenwicht is, wat is dan de kans dat de test ten onrechte zal zeggen dat ze in onevenwicht is.
- De vrijheidsgraden . Het aantal allelen.
- De effectgrootte . Dit is hoe ver weg van het evenwicht dat uw monsters verwijderd zijn. De grootste effectgrootte zou het uitsterven van één allel zijn. Als twee allelen echter een verhouding hebben van 100: 101 over de volledige populatie, is dit een kleine effectgrootte.
Voor de Pearson's Chi-squared test kan (in R)
bibliotheek (pwr) pwr.chisq.test (w = 0.3, N = 40, df = 4, sig.level = 0.05)
Een grove richtlijn voor effectgrootte ( w
) is 0,1, 0,3 en 0,5 voor kleine, middelgrote en grote effectgroottes. hier vindt u meer informatie. N
is het totale aantal datapunten, df
is het aantal allelen. Deze functie geeft ons een waarde voor 1 min de kracht van onze test. Een waarde van 0,9 betekent dat er een kans van 10% is om een effect dat echt bestaat niet te detecteren.
Als we een geschikt aantal datapunten willen berekenen om te verzamelen, moeten we beslissen welk vermogen we willen. Stel dat we besluiten dat een kans van 0,01 om de test te doen, maar het niet detecteren van onevenwichtigheid als het bestaat, acceptabel is.
pwr.chisq.test (w = 0.3, df = 4, sig.level = 0.05, power = 0.99)
vertelt ons dat 280 datapunten nodig zijn.
Zonder schattingen van effectgrootte of een aantal genotypen is het moeilijk om een rechtlijnig antwoord op uw vraag, maar 5 per genotype lijkt erg klein.
Als u slechts twee genotypen heeft, kunt u ervoor kiezen om de Fisher Exact Test te gebruiken, in welk geval u power.fisher.test ()
in het statmod
-pakket. De definities van effectgrootte en vrijheidsgraden zijn iets anders, maar het idee is hetzelfde.