Sisältö
Yksi perusteellisimmista tekniikoiden tai tieteellisten analyysien välineistä on lineaarinen regressio. Tämä tekniikka alkaa kahden muuttujan tietojoukolla. Riippumatonta muuttujaa kutsutaan yleensä "x" ja riippuvaa muuttujaa kutsutaan yleensä "y". Tekniikan tavoitteena on tunnistaa viiva y = mx + b, joka lähentää tietojoukkoa. Tämä trendiviiva voi näyttää graafisesti ja numeerisesti riippuvaisten ja riippumattomien muuttujien välisiä suhteita. Tästä regressioanalyysistä lasketaan myös korrelaatioarvo.
Tunnista ja erota tietopisteidesi x ja y-arvot. Jos käytät laskentataulukkoa, kirjoita ne vierekkäisiin sarakkeisiin. X- ja y-arvojen tulisi olla yhtä monta. Jos ei, laskelma on epätarkka tai laskentataulukko-funktio palauttaa virheen. x = (6, 5, 11, 7, 5, 4, 4) y = (2, 3, 9, 1, 8, 7, 5)
Laske x-arvojen ja y-arvojen keskiarvo jakamalla kaikkien arvojen summa joukon arvojen kokonaismäärällä. Näihin keskiarvoihin viitataan nimellä "x_avg" ja y_avg. "X_avg = (6 + 5 + 11 + 7 + 5 + 4 + 4) / 7 = 6 y_avg = (2 + 3 + 9 + 1 + 8 + 7 + 5) / 7 = 5
Luo kaksi uutta tietojoukkoa vähentämällä x_avg-arvo jokaisesta x-arvosta ja y_avg-arvo jokaisesta y-arvosta. x1 = (6 - 6, 5 - 6, 11 - 6, 7 - 6 ...) x1 = (0, -1, 5, 1, -1, -2, -2) y1 = (2 - 5, 3 - 5, 9 - 5, 1 - 5, ...) y1 = (-3, -2, 4, -4, 3, 2, 0)
Kerro kukin x1-arvo jokaisella y1-arvolla järjestyksessä. x1y1 = (0 * -3, -1 * -2, 5 * 4, ...) x1y1 = (0, 2, 20, -4, -3, -4, 0)
Sijoita neliö x1-arvo. x1 ^ 2 = (0 ^ 2, 1 ^ 2, -5 ^ 2, ...) x1 ^ 2 = (0, 1, 25, 1, 1, 4, 4)
Laske arvojen x1y1 ja x1 ^ 2 summat. sum_x1y1 = 0 + 2 + 20 - 4 - 3 - 4 + 0 = 11 sum_x1 ^ 2 = 0 + 1+ 25 + 1 + 1 + 4 + 4 = 36
Jaa "sum_x1y1" luvulla "sum_x1 ^ 2" saadaksesi regressiokerroin. summa_x1y1 / summa_x1 ^ 2 = 11/36 = 0,306