Lineaarne korrelatsiooni­kordaja

Kahe juhusliku muutuja x ja y vaheline statistiline sõltuvus võib olla mingile funktsionaalsele seosele lähemal või erineda sellest rohkem.

Näiteks joonisel 1.27 kuhjuvad statistilist seost esitavad värvilised punktid tihedamini lineaarset sõltuvust väljendava sirge ümber kui joonisel 1.28. Seda mõtet väljendatakse ka sõnadega, et joonise 1.27 korral on juhuslike suuruste X ja Y vaheline seos (korrelatsioon) tugevam kui joonise 1.28 korral. Kuidas saab seda geomeetriliselt kirjeldatud situatsiooni esitada arvudes?

Joon 1.27
Joon. 1.28

Osutub, et seda näitab nn lineaarne korrelatsiooni­kordaja, mida tähistatakse tähega r ja arvutatakse valemiga

r=xy¯ - x¯ · y¯σx · σy,

kus \overline{xy}=\frac{x_1y_1f_{11}+x_1y_2f_{12}+...+x_1y_mf_{1m}+x_2y_1f_{21}+...+x_ny_mf_{nm}}{N}.

See on sisuliselt kõigi punktide (x; y) koordinaatide korrutiste aritmeetiline keskmine.

Näide.

Leiame eelmises pea­tükis koostatud korrelatsiooni­tabeli andmetel korrelatsiooni­kordaja r.

Kuna \overline{xy}=\frac{190\cdot98\cdot1+186\cdot90\cdot1+182\cdot90\cdot2+...+162\cdot70\cdot1}{15} ≈ 14427,47 ja eelmises pea­tükis leidsime, et \overline{x}\approx175,3, \overline{y}\approx82,0, σx = 7,48, σy = 7,30, siis r=\frac{14427,47-175,3\cdot82}{7,48\cdot7,3}=0,97.

Selleks, et leitud r meile midagi ütleks, vaatleme korrelatsiooni­kordaja omadusi:

1. Korrelatsiooni­kordaja –1 ≤ r ≤ 1 ehk | r | ≤ 1.

2. Mida lähemal on | r | arvule 1, seda tugevam on seos (korrelatsioon) tunnuste vahel.

Esitatud näite korral on r = 0,97, mis ütleb, et seos vaadeldud täis­kasvanud meeste pikkuse ja keha­kaalu vahel on väga tugev.

3. Kui | r | = 1, valitseb suuruste X ja Y vahel funktsionaalne seos.

Selline on näiteks seos kindla hinnaga (a) ostetud kauba koguse (x) ja kauba maksumuse (y) vahel, alati y = ax ja r = 1.

4. Mida lähemal on | r | arvule 0, seda nõrgem on seos tunnuste vahel.

5. Kui tunnused on sõltumatud, on r = 0.

6. Kui r > 0, vastavad üldiselt tunnuse X suurematele väärtustele tunnuse Y suuremad väärtused; kui r < 0, vastavad tunnuse X suurematele väärtustele tunnuse Y väiksemad väärtused.

Joonisel 1.23 esitatud korrelatsiooni­välja korral on r = 0,97 > 0, joonise 1.24 korral on aga r < 0.

Ülesanded B

Ülesanne 193. Pikkuse ja keha­kaalu korrelatsiooni­kordaja

Ülesanne 194. Kinga­numbrite ja pikkuse korrelatsiooni­kordaja

Ülesanne 195. Isa ja poja pikkuste korrelatsiooni­kordaja

Vastus. r