Kuinka laskea korrelaatiomatriisi

Posted on
Kirjoittaja: John Stephens
Luomispäivä: 25 Tammikuu 2021
Päivityspäivä: 20 Marraskuu 2024
Anonim
Korrelaation laskeminen isolle datasetille
Video: Korrelaation laskeminen isolle datasetille

Sisältö

Korrelaatio (r) on kahden muuttujan välisen lineaarisen suhteen mitta. Esimerkiksi jalan pituus ja vartalon pituus korreloivat voimakkaasti; korkeus ja paino ovat vähemmän korreloivia, ja korkeus ja nimen pituus (kirjaimina) ovat korreloimattomia.


Täydellinen positiivinen korrelaatio: r = 1. (Kun yksi nousee, toinen nousee) Täydellinen negatiivinen korrelaatio: r = -1 (Kun yksi nousee, toinen laskee) Ei korrelaatiota: r = 0 (Lineaarista ei ole suhde)

Korrelaatiomatriisi on monien korrelaatioiden matriisi.

Korrelaatiomatriisin laskeminen R: llä

    Hanki tiedot. Jos tietosi ovat Excel-tiedostossa, helpoin tapa on tallentaa ne .csv-tiedostona (napsauta Excel 7: ssä "Tiedosto", sitten "Tallenna nimellä" ja sitten "muut muodot". "Vieritä sitten" Tallenna tyypinä "-kohdassa. CSV: ksi (pilkuin erotetut arvot) .Kullakin rivillä tulisi olla tietoja yhdestä aiheesta ja jokaisen sarakkeen tulisi olla yksi muuttuja.

    Lue tiedot R: ään read.csv: n avulla. Esimerkiksi, jos tietosi ovat "c: mydisk mydir data.csv", kirjoita tietotiedot <- read.csv ("c: /mydisk/mydir/data.csv").


    Laske korrelaatiomatriisi käyttämällä cor (). Esimerkiksi: cor (mydata). Voit myös tallentaa korrelaatiomatriisin objektina myöhempää käyttöä varten käyttämällä: kormaatti <- kor (oma tieto).

Lasketaan korrelaatiomatriisi SAS: n kanssa

    Hanki tiedot. SAS pystyy lukemaan tietoja monissa muodoissa. Jos tallennat tietoja Exceliin, on yksi aihe jokaisella rivillä ja yksi muuttuja jokaisessa sarakkeessa

    Lue tiedot SAS: iin. Voit käyttää tietoja IMPORT-ohjatulla toiminnolla. Napsauta "Tiedosto", sitten "Tuo tiedot" ja valitse sitten tietotyyppi avattavan valikon avulla. Napsauta Seuraava ja siirry tietoihisi ja napsauta sitten Valmis.

    Laske korrelaatiomatriisi. Jos tietosi tallennetaan SAS-tietokantaan mydatana, muuttujilla VAR1, VAR2 ja VAR3, kirjoita: PROC CORR data = mydata; VAR var1 var2 var3; JUOSTA;

    vinkkejä

    varoitukset