Regresija ir koreliacija
Statistikoje svarbu nustatyti santykį tarp dviejų atsitiktinių kintamųjų. Tai suteikia galimybę prognozuoti vieną kintamąjį kitų atžvilgiu. Regresijos analizė ir koreliacija yra taikomi orų prognozėms, finansų rinkos elgsenai, fizinių santykių nustatymui eksperimentais ir kur kas daugiau realaus pasaulio scenarijų.
Kas yra regresija?
Regresija yra statistinis metodas, naudojamas nustatyti ryšį tarp dviejų kintamųjų. Dažnai renkant duomenis gali būti kintamųjų, kurie priklauso nuo kitų. Tikslų šių kintamųjų ryšį galima nustatyti tik taikant regresijos metodus. Šio santykio nustatymas padeda suprasti ir nuspėti vieno kintamojo elgesį kitam.
Dažniausiai taikant regresijos analizę vertinama priklausomo kintamojo reikšmė tam tikrai vertei ar nepriklausomų kintamųjų reikšmių diapazonui. Pavyzdžiui, naudodamiesi regresija galime nustatyti prekės kainos ir vartojimo santykį, remdamiesi atsitiktinės imties duomenimis. Regresijos analizė sukuria duomenų rinkinio regresijos funkciją, kuri yra matematinis modelis, geriausiai atitinkantis turimus duomenis. Tai lengvai galima pavaizduoti sklaidos schema. Grafiškai regresija prilygsta davimo duomenų rinkinio geriausiai tinkančiai kreivei. Kreivės funkcija yra regresijos funkcija. Naudojant matematinį modelį, prekės paklausą galima numatyti už tam tikrą kainą.
Todėl regresinė analizė yra plačiai naudojama prognozuojant ir prognozuojant. Jis taip pat naudojamas nustatyti ryšius eksperimentiniuose duomenyse, fizikos, chemijos, daugelio gamtos mokslų ir inžinerijos disciplinų srityse. Jei santykis arba regresijos funkcija yra tiesinė funkcija, procesas vadinamas linijine regresija. Sklaidos diagramoje jis gali būti pavaizduotas tiesia linija. Jei funkcija nėra tiesinis parametrų derinys, tada regresija yra netiesinė.
Kas yra koreliacija?
Koreliacija yra santykio tarp dviejų kintamųjų stiprumo matas. Koreliacijos koeficientas kiekybiškai išreiškia vieno kintamojo pokyčio laipsnį pagal kito kintamojo pokytį. Statistikoje koreliacija siejama su priklausomybės sąvoka, kuri yra statistinis ryšys tarp dviejų kintamųjų.
Pearsonso koreliacijos koeficientas arba tiesiog koreliacijos koeficientas r yra vertė tarp -1 ir 1 (-1≤r≤ + 1). Tai dažniausiai naudojamas koreliacijos koeficientas ir galioja tik tiesiniam ryšiui tarp kintamųjų. Jei r = 0, ryšio nėra, o jei r ≥0, santykis yra tiesiogiai proporcingas; y. vieno kintamojo vertė didėja didėjant kitam. Jei r≤0, santykis yra atvirkščiai proporcingas; y. vienas kintamasis mažėja didėjant kitam.
Dėl tiesiškumo sąlygos koreliacijos koeficientas r taip pat gali būti naudojamas nustatyti tiesinį ryšį tarp kintamųjų.
Kuo skiriasi regresija ir koreliacija?
Regresija suteikia santykio tarp dviejų atsitiktinių kintamųjų formą, o koreliacija - santykio stiprumo laipsnį.
Regresijos analizė sukuria regresijos funkciją, kuri padeda ekstrapoliuoti ir numatyti rezultatus, o koreliacija gali suteikti informacijos tik apie tai, kokia kryptimi ji gali pasikeisti.
Tikslesni tiesinės regresijos modeliai pateikiami analizės būdu, jei koreliacijos koeficientas yra didesnis. (| r | ≥0,8)