Vsebina
Chi-kvadrat, bolj znan kot Pearsonsov hi-kvadrat test, je sredstvo za statistično vrednotenje podatkov. Uporablja se pri primerjanju kategoričnih podatkov iz vzorčenja s pričakovanimi ali "resničnimi" rezultati. Če na primer verjamemo, da je 50 odstotkov vsega fižola v železi rdečega, mora vzorec 100 fižol iz tega koša vsebovati približno 50 rdečih. Če se naša številka razlikuje od 50, nam Pearsonsov test pove, ali je naša 50-odstotna domneva sumljiva ali če lahko razliko, ki smo jo videli, pripišemo normalnemu naključnemu spreminjanju.
Tolmačenje Chi-kvadratnih vrednosti
Določite stopnjo svobode vrednosti chi-kvadrat. Če primerjate rezultate za en vzorec z več kategorijami, je stopnja svobode število kategorij minus 1. Na primer, če ste ocenjevali porazdelitev barv v kozarcu meduze in so bile štiri barve, so stopnje stopinj svoboda bi bila 3. Če primerjate tabelarne podatke, je stopnja svobode enaka številu vrstic minus 1, pomnoženo s številom stolpcev minus 1.
Določite kritično vrednost p, ki jo boste uporabili za oceno svojih podatkov. To je odstotek verjetnosti (deljeno s 100), da je določena vrednost hi-kvadrata bila pridobljena samo po naključju. Drugi način razmišljanja o p je, da obstaja verjetnost, da so vaši opaženi rezultati odstopali od pričakovanih rezultatov za znesek, ki so ga storili izključno zaradi naključnega spreminjanja postopka vzorčenja.
Poiščite vrednost p, povezano z vašo statistično vrednostjo testa za hi-kvadrat s pomočjo tabele razdelitve chi-kvadrat. Če želite to narediti, poglejte vzdolž vrstice, ki ustreza vašim izračunanim stopnjam svobode. Poiščite vrednost v tej vrstici, ki je najbližje vaši statistični analizi. Sledite stolpcu, ki vsebuje to vrednost navzgor, do zgornje vrstice in preberite vrednost p. Če je vaša testna statistika v začetni vrstici med dvema vrednostma, lahko v zgornji vrstici preberete približno vmesno vrednost p med dvema vrednostma p.
Primerjajte vrednost p, dobljeno iz tabele, s kritično p vrednostjo, ki je bila predhodno določena. Če je vaša tabelarična p vrednost nad kritično vrednostjo, boste ugotovili, da je bilo vsako odstopanje med vrednostmi vzorčne kategorije in pričakovanimi vrednostmi posledica naključnega nihanja in ni bilo pomembno. Če bi na primer izbrali kritično vrednost p 0,05 (ali 5%) in našli tabelarno vrednost 0,20, bi sklepali, da ni pomembnih sprememb.