Kako preizkusiti Chi-Square

November 2024

Avtor: Judy Howell

Datum Ustvarjanja: 4 Julij. 2021

Datum Posodobitve: 14 November 2024

Vsebina

Vrsta potrebnih podatkov
Test primernosti
Izračun statistike Chi-Square
Razlaga statistike Chi-Square

Napovedi preizkusov eksperimentov Te napovedi so pogosto številčne, kar pomeni, da ko znanstveniki zbirajo podatke, pričakujejo, da se bodo številke na določen način razkadile. Podatki iz resničnega sveta se redko ujemajo z natanko napovedmi, ki jih imajo znanstveniki, zato znanstveniki potrebujejo test, s katerim bodo lahko ugotovili, ali je razlika med opaženimi in pričakovanimi številkami naključna ali zaradi nepredvidenega dejavnika, ki bo znanstvenika prisilil, da prilagodi osnovno teorijo . Čisti kvadratni test je statistično orodje, ki ga znanstveniki uporabljajo v ta namen.

Vrsta potrebnih podatkov

Za uporabo hi-kvadrat testa potrebujete kategorične podatke. Primer kategoričnih podatkov je število ljudi, ki so odgovorili na vprašanje "da" v primerjavi s številom ljudi, ki so odgovorili na vprašanje "ne" (dve kategoriji), ali število žab v populaciji, ki je zelena, rumena ali siva ( tri kategorije). Ne morete uporabiti hi-kvadrat testa na neprekinjenih podatkih, na primer, ki jih je mogoče zbrati iz ankete in vprašati ljudi, kako visoki so. Iz take raziskave bi dobili široko paleto višin. Če pa bi višine razdelili na kategorije, kot so "pod 6 čevljev visok" in "visok 6 čevljev in več", bi lahko potem uporabili test chi-kvadrat na podatkih.

Test primernosti

Test primernosti je običajen in morda najpreprostejši test, opravljen s statistiko hi-kvadrat. Znanstvenik v preizkusu primernosti ustreza specifičnim napovedim o številkah, ki jih pričakuje v vsaki kategoriji svojih podatkov. Nato zbira podatke iz resničnega sveta - imenovane opazovani podatki - in uporablja test chi-kvadrat, da preveri, ali se opaženi podatki ujemajo s njenimi pričakovanji.

Na primer, predstavljajte, da biolog proučuje vzorce dedovanja pri vrsti žab. Med 100 potomci roditeljev žab jo genetski model biologov pričakuje, da pričakuje 25 rumenih potomcev, 50 zelenih potomcev in 25 sivih potomcev. Dejansko opaža 20 rumenih potomcev, 52 zelenih potomcev in 28 sivih potomcev. Ali njeno napoved podpira ali je njen genetski model napačen? Za izvedbo lahko uporabi test s kvadratom chi.

Izračun statistike Chi-Square

Začnite izračunati statistiko hi-kvadrata, tako da odštejete vsako pričakovano vrednost od njene ustrezne opazovane vrednosti in vsak rezultat pomerite. Izračun za primer žabjega potomca bi izgledal takole:

rumena = (20 - 25) ^ 2 = 25 zelena = (52 - 50) ^ 2 = 4 siva = (28 - 25) ^ 2 = 9

Zdaj delite vsak rezultat z ustrezno pričakovano vrednostjo.

rumena = 25 ÷ 25 = 1 zelena = 4 ÷ 50 = 0,08 siva = 9 ÷ 25 = 0,36

Na koncu seštejte odgovore iz prejšnjega koraka.

chi-kvadrat = 1 + 0,08 + 0,36 = 1,44

Razlaga statistike Chi-Square

Statistični podatki o hi-kvadratu povedo, kako različne so bile vaše opažene vrednosti od predvidenih vrednosti. Večja kot je številka, večja je razlika. Lahko ugotovite, ali je vrednost vašega kvadratnega hi-kvadrata previsoka ali dovolj nizka, da podpira vaše napoved, tako da vidite, ali je pod določeno kritična vrednost na razdeljevalni tabeli chi-kvadrat. Ta tabela se ujema z vrednostmi hi-kvadrata z verjetnostmi, ki se imenujejo p-vrednosti. V tabeli je natančneje podana verjetnost, da so razlike med vašimi in pričakovanimi vrednostmi preprosto posledica naključne možnosti ali ali je prisoten kakšen drug dejavnik. Če je test ustreznosti, če je vrednost p 0,05 ali manj, morate napoved zavrniti.

Določiti morate stopinj svobode (df) v svojih podatkih, preden lahko v razdelilni tabeli poiščete kritično vrednost hi-kvadrata. Stopnje svobode se izračunajo tako, da se od števila kategorij v vaših podatkih odšteje 1. V tem primeru so tri kategorije, torej sta dve stopnji svobode. Pogled na ta razdelitveno tabelo chi-kvadrat vam pove, da je za 2 stopnji svobode kritična vrednost za 0,05 verjetnost 5,99. To pomeni, da če so vaše izračunane vrednosti hi-kvadrata manjše od 5,99, so vaše pričakovane vrednosti in s tem tudi osnovna teorija veljavne in podprte. Ker je bila statistika hi-kvadrat za podatke o potomcih žab 1,44, lahko biolog sprejme njen genetski model.