Zašto vrijednost R-Squared ne ukazuje na uzročnost?

Zašto vrijednost R-Squared ne ukazuje na uzročnost?
Anonim

Odgovor:

R-kvadrat pokazuje koliko dobro promatrani podaci odgovaraju očekivanim podacima, ali samo daje informacije o korelaciji.

Obrazloženje:

Vrijednost R-kvadrata pokazuje koliko dobro vaši promatrani podaci ili prikupljeni podaci odgovaraju očekivanom trendu. Ta vam vrijednost govori o snazi odnosa, ali, kao i svi statistički testovi, ne postoji ništa što vam govori o uzroku koji stoji iza odnosa ili njegove snage.

U donjem primjeru možemo vidjeti da grafikon na lijevoj strani nema veze, kao što pokazuje niska vrijednost R-kvadrata. Graf na desnoj strani ima vrlo jak odnos, kao što pokazuje R-kvadratna vrijednost 1. Ni u jednom od ovih grafova ne možemo reći što je u konačnici uzrok tom odnosu.

Korelacija ne znači uzročnost. Vaše vrijednosti X mogu vrlo dobro utjecati na vaše Y vrijednosti, ali drugi faktori mogu biti u igri ili veza može biti posljedica slučajnosti. Možeš zaključiti ali to je vaše tumačenje i ne može se dokazati statističkim testiranjem. Imati visoku vrijednost R-kvadrata još uvijek vam govori samo o jačini odnosa, ali ne io njegovom uzroku.

Dokazivanje uzročnosti vrlo je velik zadatak. Ako želite razumjeti uzročnost, najbolje je krenuti eksperimentima.