Sisältö
- TL; DR (liian pitkä; ei lukenut)
- Näytteen koon määritelmä
- Näytteen koon laskeminen
- Pienen näytteen koon vaarat
- Otoksen koko ja virhemarginaali
Otoskoko on yksittäisten näytteiden tai havaintojen lukumäärä missä tahansa tilastollisessa ympäristössä, kuten tieteellisessä kokeessa tai yleisen mielipidekyselyn yhteydessä. Vaikka otoskoko on suhteellisen suoraviivainen käsite, se on kriittinen määritys projektille. Liian pieni näyte tuottaa epäluotettavia tuloksia, kun taas liian suuri otos vaatii paljon aikaa ja resursseja.
TL; DR (liian pitkä; ei lukenut)
Otoksen koko on suora määrä mitattujen näytteiden tai tehtyjen havaintojen lukumäärästä.
Näytteen koon määritelmä
Otoskoko mittaa mitattujen yksittäisten näytteiden tai tutkimuksessa tai kokeessa käytettyjen havaintojen lukumäärää. Esimerkiksi, jos testaat 100 maata näytteestä happosateen osoittamiseksi, näytteesi koko on 100. Jos verkkokysely tuotti 30 500 täytettyä kyselylomaketta, näytteen koko on 30 500. Tilastoissa näytteen kokoa edustaa yleensä muuttuja "n".
Näytteen koon laskeminen
Koetta tai tutkimusta varten tarvittavan otoksen koon määrittämiseksi tutkijat ottavat huomioon useita halutut tekijät. Ensimmäinen, tutkittavan väestön koko on otettava huomioon - tutkimus, jonka tarkoituksena on tehdä johtopäätöksiä esimerkiksi koko New Yorkin osavaltiosta, tarvitsee paljon suuremman otoksen koon kuin erityisesti Rochesteriin keskittynyt otos. Tutkijoiden on myös harkittava virhemarginaali, luotettavuus, että kerätyt tiedot ovat yleensä tarkkoja; ja luottamustaso, todennäköisyys virhemarginaalin tarkkuuteen. Lopuksi tutkijoiden on otettava huomioon keskihajonta he odottavat näkevänsä tiedot. Vakiopoikkeamalla mitataan kuinka paljon yksittäiset tiedot eroavat mitatusta keskimääräisestä tiedosta. Esimerkiksi yhden puiston maa-näytteillä on todennäköisesti paljon pienempi standardipoikkeama typpipitoisuuksissaan kuin koko läänistä kerätyillä maaperäillä.
Pienen näytteen koon vaarat
Suuret otoskokot tarvitaan, jotta tilastot olisivat tarkkoja ja luotettavia, etenkin jos sen havainnot on ekstrapoloitava suurempaan joukkoon tai tietoryhmään. Oletetaan, että teit liikuntakyselyn ja haastattelit viittä ihmistä, joista kaksi sanoi, että he juoksevat maratonin vuosittain. Jos valitset tämän kyselyn edustamaan koko maan väestöä, tutkimuksesi mukaan 40 prosenttia ihmisistä juoksee vähintään yksi maraton vuodessa - odottamattoman suuri prosenttiosuus. Mitä pienempi näytteen koko, sitä todennäköisempi harha - epätavallisia tietoja - vinovat havaintosi.
Otoksen koko ja virhemarginaali
Tilastollisen tutkimuksen otoskoko liittyy myös suoraan tutkimuksen virhemarginaaliin. Virhemarginaali on prosenttiosuus, joka ilmaisee todennäköisyyden, että vastaanotetut tiedot ovat oikeita. Esimerkiksi uskonnollisia vakaumuksia koskevassa tutkimuksessa virhemarginaali on vastaajien prosenttiosuus, joiden voidaan odottaa antavan saman vastauksen, jos kysely toistetaan. Virhemarginaalin määrittämiseksi jaa 1 näytteen koon neliöjuurella ja kerro sitten 100: lla saadaksesi prosenttiosuus. Esimerkiksi 2400 näytteen koko on marginaalilla 2,04 prosenttia.