Povezava med dvema spremenljivkama opisuje verjetnost, da bo sprememba ene spremenljivke povzročila sorazmerno spremembo druge spremenljivke. Visoka korelacija med dvema spremenljivkama kaže, da imata skupni vzrok ali da je sprememba ene od spremenljivk neposredno odgovorna za spremembo druge spremenljivke. Vrednost Pearsons r se uporablja za količinsko določitev korelacije med dvema diskretnima spremenljivkama.
Označite spremenljivko, za katero menite, da povzroča spremembo druge spremenljivke kot x (neodvisna spremenljivka) in drugo spremenljivko y (odvisna spremenljivka).
Sestavite tabelo s petimi stolpci in toliko vrstic, kolikor je podatkovnih točk za x in y. Z leve proti desni označite stolpce od A do E.
V vsako vrstico izpolnite naslednje vrednosti za vsako (x, y) podatkovno točko v prvem stolpcu - vrednost x v stolpcu A, vrednost x v stolpcu B, vrednost y v stolpcu C, vrednost od y na kvadrat v stolpcu D, vrednost x krat y pa v stolpcu E.
Na koncu dna tabele naredite zadnjo vrstico in v ustrezno celico vstavite vsoto vseh vrednosti vsakega stolpca.
Izračunajte produkt končnih celic v stolpcih A in C.
Končno celico v stolpcu E pomnožite s številom podatkovnih točk.
Od vrednosti, dobljene v koraku 6, odštejte vrednost, pridobljeno v koraku 5, in poudarite odgovor.
Končno celico stolpca B pomnožite s številom podatkovnih točk. Od te vrednosti odštejemo kvadrat vrednosti končne celice stolpca A.
Končno celico stolpca D pomnožite s številom podatkovnih točk in odštejte kvadrat vrednosti končne celice stolpca C.
Vrednosti, najdene v korakih 8 in 9, pomnožite skupaj in nato vzemite kvadratni koren rezultata.
Vrednost, dobljeno v koraku 7, je treba razdeliti na vrednost, pridobljeno v koraku 10. To je Pearsons r, znan tudi kot korelacijski koeficient. Če je r blizu 1, obstaja močna pozitivna korelacija. Če je r blizu -1, obstaja močna negativna korelacija. Če je r blizu 0, je šibka korelacija.