Vsebina
- TL; DR (Predolgo; Nisem prebral)
- Velikost vzorca
- Srednja vrednost in porabniki
- Nevarnost majhnih vzorcev
- Območje napake
Ko gre za znanstvene študije, je velikost vzorca ključnega pomena za kakovostno raziskovanje. Velikost vzorca, včasih predstavljena kot n, je število posameznih podatkov, ki se uporabljajo za izračun nabora statistik. Večje velikosti vzorcev raziskovalcem omogočajo, da bolje določijo povprečne vrednosti svojih podatkov in se izognejo napakam pri testiranju majhnega števila morda netipičnih vzorcev.
TL; DR (Predolgo; Nisem prebral)
Velikost vzorca je pomemben dejavnik za raziskave. Večje velikosti vzorca zagotavljajo natančnejše srednje vrednosti, identificirajo odbitke, ki bi podatke lahko prekrili v manjšem vzorcu in zagotovili manjšo mero napake.
Velikost vzorca
Velikost vzorca je število informacij, testiranih v anketi ali poskusu. Če na primer testirate 100 vzorcev morske vode na ostanke olja, je vaša velikost vzorca 100. Če pregledate 20.000 ljudi na znake tesnobe, je vaša velikost vzorca 20.000. Večje velikosti vzorcev imajo očitno prednost, saj raziskovalcem omogočajo več podatkov; vendar veliki poskusi velikosti vzorca zahtevajo večje finančne in časovne obveznosti.
Srednja vrednost in porabniki
Večje velikosti vzorcev pomagajo pri določanju povprečne vrednosti kakovosti med testiranimi vzorci - to povprečje je pomeni. Večja kot je velikost vzorca, natančnejša je srednja vrednost. Če na primer ugotovite, da je povprečna višina med 40 ljudmi 5 čevljev, 4 palca, toda med 100 osebami je povprečna višina 5 čevljev, 3 palca, je druga meritev boljša ocena povprečne višine posameznika, saj preizkušate bistveno več predmetov. Določitev srednje vrednosti omogoča tudi raziskovalcem, da lažje določijo outliers. Zunanji del je podatek, ki se močno razlikuje od povprečne vrednosti in lahko predstavlja zanimivost za raziskave. Torej na podlagi srednje višine bi bil nekdo z višino 6 čevljev, 8 centimetrov, zunanja podatkovna točka.
Nevarnost majhnih vzorcev
Možnost odpuščanja je del tistega, zaradi česar je pomembna velika velikost vzorca. Recimo, recimo, da pregledate štiri ljudi o njihovi politični pripadnosti, ena pa pripada neodvisni stranki. Ker gre za enega posameznika v velikosti vzorca 4, bo vaša statistika pokazala, da 25 odstotkov prebivalstva pripada Neodvisni stranki, kar je verjetno netočna ekstrapolacija. Če povečate velikost svojega vzorca, se boste izognili zavajajočim statistikam, če je v vzorcu prisoten zunanji del.
Območje napake
Velikost vzorca je neposredno povezana s statistiko meja napakeali kako natančno je mogoče izračunati statistiko. Za vprašanje da ali ne, na primer, ali ima posameznik lastnik avtomobila, lahko določite stopnjo napake za statistiko tako, da 1 delite s kvadratnim korenom velikosti vzorca in pomnožite s 100. Skupni odstotek . Na primer, velikost vzorca 100 bo imela 10-odstotno mero napake. Pri merjenju numeričnih lastnosti s srednjo vrednostjo, kot sta višina ali teža, to vsoto pomnožite za dvakratnik standardni odklon podatkov, ki meri, kako so razporejene vrednosti podatkov od povprečne. V obeh primerih je večja velikost vzorca, manjša je mera napake.