korelacija

Što je korelacija:

Korelacija znači sličnost ili odnos između dvije stvari, ljudi ili ideja . To je sličnost ili ekvivalentnost koja postoji između dvije različite hipoteze, situacije ili predmeta.

U području statistike i matematike korelacija se odnosi na mjeru između dvije ili više srodnih varijabli.

Izraz korelacija je ženska imenica koja potječe od latinske korelacije.

Riječ korelacija može se zamijeniti sinonimima kao što su: odnos, jednadžba, neksus, korespondencija, analogija i veza.

Koeficijent korelacije

U statistici, Pearsonov koeficijent korelacije (r), koji se također naziva koeficijent korelacije proizvoda-trenutak, mjeri odnos između dvije varijable unutar iste metričke ljestvice.

Funkcija koeficijenta korelacije je odrediti intenzitet odnosa koji postoji između poznatih skupova podataka ili informacija.

Vrijednost koeficijenta korelacije može varirati između -1 i 1, a dobiveni rezultat određuje je li korelacija negativna ili pozitivna.

Za tumačenje koeficijenta potrebno je znati da 1 znači da je korelacija između varijabli savršeno pozitivna i -1 znači da je savršena negativna . Ako je koeficijent jednak 0, to znači da varijable ne ovise jedna o drugoj.

U statistici postoji i Spearmanov koeficijent korelacije, koji nosi to ime u čast statističara Charlesa Spearmana. Funkcija ovog koeficijenta je mjerenje intenziteta odnosa između dvije varijable, bilo da su linearne ili ne.

Spearmanova korelacija služi za procjenu može li se intenzitet odnosa između dvije analizirane varijable mjeriti monotonom funkcijom (matematička funkcija koja čuva ili invertira početni odnos redoslijeda).

Izračun Pearsonovog koeficijenta korelacije

Metoda 1) Izračunavanje Pearsonovog koeficijenta korelacije pomoću kovarijance i standardne devijacije.

gdje

S XY je kovarijanca;

S x i S y predstavljaju standardnu ​​devijaciju varijabli x i y.

U ovom slučaju, izračun uključuje prvo pronalaženje kovarijance između varijabli i standardnu ​​devijaciju svake od njih. Tada se kovarijanca dijeli množenjem standardnih devijacija.

Često, izjava već daje ili standardne devijacije varijabli, ili kovarijancu između njih, samo primjenom formule.

Metoda 2) Izračunavanje Pearsonovog koeficijenta korelacije sa sirovim podacima (bez kovarijance ili standardne devijacije).

S ovom metodom najizravnija formula je sljedeća:

Na primjer, pod pretpostavkom da imamo podatke s n = 6 opažanja dviju varijabli: razina glukoze (y) i dob (x), izračun slijedi sljedeće korake:

Korak 1) Konstruirajte tablicu s postojećim podacima: i, x, y i dodajte prazne stupce za xy, x² i y²:

Korak 2: Pomnožite x i y kako biste ispunili stupac "xy". Na primjer, u retku 1 imat ćemo: x1y1 = 43 × 99 = 4257.

Korak 3: Podignite vrijednosti stupca x i zabilježite rezultate u stupcu x². Na primjer, u prvom retku imat ćemo x 1 2 = 43 × 43 = 1849.

Korak 4: učinite isto kao u koraku 3, sada koristite y stupac i zabilježite kvadrat vrijednosti u stupcu y². Na primjer, u prvom retku imat ćemo: y 1 2 = 99 × 99 = 9801.

Korak 5: Nabavite zbroj svih brojeva stupaca i stavite rezultat u podnožje stupca. Na primjer, zbroj stupca Age X jednak je 43 + 21 + 25 + 42 + 57 + 59 = 247.

Korak 6: Koristite gornju formulu za dobivanje koeficijenta korelacije:

Dakle, imamo:

Spearmanov koeficijent korelacije

Izračunavanje Spearmanovog koeficijenta korelacije je nešto drugačije. Za to trebamo organizirati naše podatke u sljedećoj tablici:

1. Nakon što smo izgovorili 2 para podataka, moramo ih uvesti u tablicu. Na primjer:

2. U stupcu "Rangiranje A" klasificirat ćemo opažanja koja su u "Datumu A" na rastući način, pri čemu je "1" najniža vrijednost u stupcu, en (ukupan broj opažanja), najviša vrijednost u stupcu "Datum A" ”. U našem primjeru to je:

3. Isto činimo kako bismo dobili stupac "Rangiranje B", sada koristeći napomene u stupcu "Podaci B":

4. U stupcu "d" stavljamo razliku između dva rangiranja (A - B). Ovdje signal nije važan.

5. Podignite svaku vrijednost u stupcu "d" i zabilježite u stupcu d²:

6. Dodajte sve podatke iz stupca "d²". Ova vrijednost je Σd². U našem primjeru Σd² = 0 + 1 + 0 + 1 = 2

7. Sada koristimo Spearmanovu formulu:

U našem slučaju, n je jednako 4, budući da promatramo broj redova podataka (što odgovara broju opažanja).

8. Konačno, zamjenjujemo podatke u prethodnoj formuli:

Linearna regresija

Linearna regresija je formula koja se koristi za procjenu moguće vrijednosti varijable (y) kada su poznate vrijednosti drugih varijabli (x). Vrijednost "x" je neovisna ili objašnjiva varijabla, a "y" je zavisna varijabla ili odgovor.

Linearna regresija se koristi za provjeru kako se vrijednost "y" može mijenjati kao funkcija varijable "x". Red koji sadrži vrijednosti provjere varijance naziva se linearna regresijska linija.

Ako eksplanatorna varijabla "x" ima jednu vrijednost, regresija se naziva jednostavna linearna regresija .