Sisältö
Hajontakaavio on kuvaaja, joka näyttää kahden tietojoukon välisen suhteen. Joskus on hyödyllistä käyttää sirontakaavion sisältämiä tietoja saadakseen matemaattisen suhteen kahden muuttujan välillä. Hajotuskaavion yhtälö voidaan saada käsin käyttämällä jompaa kumpaa päätapaa: graafista tekniikkaa tai tekniikkaa, jota kutsutaan lineaariseksi regressioksi.
Hajontapiirron luominen
Luo sirontakaavio kuvaajapaperilla. Piirrä x- ja y-akselit, varmista, että ne leikkaavat ja merkitsevät alkuperän. Varmista, että myös x- ja y-akseleilla on oikeat otsikot. Seuraavaksi piirrä graafin jokainen datapiste. Kaikkien suuntausten piirrettyjen tietojoukkojen välillä pitäisi nyt olla ilmeinen.
Paras istuvuus
Kun sirontakuvio on luotu, olettaen, että kahden tietojoukon välillä on lineaarinen korrelaatio, voimme käyttää graafista menetelmää yhtälön saamiseksi. Ota viivain ja vedä viiva mahdollisimman lähelle kaikkia pisteitä. Yritä varmistaa, että linjan yläpuolella on yhtä monta pistettä kuin linjan alapuolella. Kun viiva on piirretty, käytä standardimenetelmiä suoran yhtälön löytämiseksi
Suoran yhtälö
Kun sirontagraafille on asetettu parhaiten sopiva rivi, yhtälö on helppo löytää. Suoran yleinen yhtälö on:
y = mx + c
Missä m on viivan kaltevuus (kaltevuus) ja c on y-leikkauspiste. Saadaksesi kaltevuuden, etsi kaksi pistettä linjalta. Oletetaan, että nämä kaksi esimerkkiä ovat (1,3) ja (0,1) tämän esimerkin vuoksi. Kaltevuus voidaan laskea ottamalla ero y-koordinaateissa ja jakamalla erolla x-koordinaateissa:
m = (3 - 1) / (1 - 0) = 2/1 = 2
Kaltevuus tässä tapauksessa on 2. Toistaiseksi suoraviivainen yhtälö on
y = 2x + c
C: n arvo voidaan saada korvaamalla tunnetun pisteen arvot. Esimerkin jälkeen yksi tunnetuista pisteistä on (1,3). Kytke tämä yhtälöön ja järjestele uudelleen c: lle:
3 = (2 * 1) + c
c = 3 - 2 = 1
Lopullinen yhtälö tässä tapauksessa on:
y = 2x + 1
Lineaarinen regressio
Lineaarinen regressio on matemaattinen menetelmä, jota voidaan käyttää sirontakaavion suoraviivaisen yhtälön saamiseksi. Aloita sijoittamalla tietosi taulukkoon. Oletetaan, että meillä on seuraavat tiedot tässä esimerkissä:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Laske x-arvojen summa:
x_sum = 4,1 + 6,5 + 12,6 = 23,2
Seuraavaksi laske y-arvojen summa:
y_sum = 2,2 + 4,4 + 10,4 = 17
Laske nyt yhteen kunkin datapistejoukon tuotteet:
xy_sum = (4,1 * 2,2) + (6,5 * 4,4) + (12,6 * 10,4) = 168,66
Seuraavaksi lasketaan x-arvojen neliön ja y-arvojen neliön summa:
x_square_sum = (4,1 ^ 2) + (6,5 ^ 2) + (12,6 ^ 2) = 217,82
y_square_sum = (2,2 ^ 2) + (4,5 ^ 2) + (10,4 ^ 2) = 133,25
Laske lopuksi, kuinka monta datapistettä sinulla on. Tässä tapauksessa meillä on kolme datapistettä (N = 3). Gradientti parhaiten sopivalle viivalle voidaan saada seuraavasta:
m = (N * xy_sum) - (x_sum * y_sum) / (N * x_square_sum) - (x_sum * x_sum) = (3 * 168,66) - (23,2 * 17) / (3 * 217,82) - (23,2 * 23,2) = 0,968
Leikkaus sopivimmalle linjalle voidaan saada osoitteesta:
c = (x_square_sum * y_sum) - (x_sum * xy_sum) / (N * x_square_sum) - (x_sum * x_sum)
= (217.82 17) - (23.2 168.66) / (3 * 217.82) - (23.2 * 23.2) = -1.82
Lopullinen yhtälö on siis:
y = 0,968x - 1,82