Sisältö
Yksinkertaista numerojoukkojen, etenkin suurten numerojoukkojen, vertailua laskemalla keskiarvot keskiarvon, moodin ja mediaanin avulla. Käytä sarjojen alueita ja keskihajontoja tutkiaksesi datan vaihtelevuutta.
Lasketaan keskiarvo
Keskiarvo tunnistaa numerojoukon keskiarvon. Tarkastellaan esimerkiksi tietojoukkoa, joka sisältää arvot 20, 24, 25, 36, 25, 22, 23.
Keskiarvon löytämiseksi käytä kaavaa: Keskiarvo on yhtä suuri kuin tietojoukon numeroiden summa jaettuna tietojoukon arvojen lukumäärällä. Matemaattisesti: keskiarvo = (kaikkien ehtojen summa) ÷ (kuinka monta termiä tai arvoa joukossa).
Lisää numerot esimerkkitietojoukkoon: 20 + 24 + 25 + 36 + 25 + 22 + 23 = 175.
Jaa kerralla olevien datapisteiden lukumäärällä. Tässä sarjassa on seitsemän arvoa, joten jaa se 7: llä.
Lisää arvot kaavaan laskeaksesi keskiarvon. Keskiarvo on yhtä suuri kuin arvojen (175) summa jaettuna datapisteiden lukumäärällä (7). Vuodesta 175 ÷ 7 = 25, tämän tietojoukon keskiarvo on 25. Kaikki keskiarvot eivät ole yhtä suuret kuin kokonaisluku.
Lasketaan mediaani
Mediaani tunnistaa numerojoukon keskipisteen tai keskiarvon.
Laita numerot järjestyksessä pienimmästä suurimpaan. Käytä esimerkillistä arvojoukkoa: 20, 24, 25, 36, 25, 22, 23. Järjestyksessä asetettu joukko muuttuu: 20, 22, 23, 24, 25, 25, 36.
Koska tällä numerojoukolla on seitsemän arvoa, mediaani tai arvo keskellä on 24.
Jos numerojoukolla on parillinen määrä arvoja, laske kahden keskiarvon keskiarvo. Oletetaan esimerkiksi, että numerojoukko sisältää arvot 22, 23, 25, 26. Keskimmäinen sijainti on välillä 23-25. 23 ja 25 lisäämällä saadaan 48. Jakamalla 48 kahdella, saadaan mediaaniarvo 24.
Laskentatila
Tila tunnistaa datajoukon yleisimmän arvon tai arvot. Tietoista riippuen voi olla yksi tai useampi tila tai ei ollenkaan tilaa.
Järjestää tietojoukko pienimmästä suurimpaan samoin kuin median löytäminen. Esimerkkijoukossa tilatut arvot muuttuvat: 20, 22, 23, 24, 25, 25, 36.
Tila esiintyy, kun arvot toistuvat. Esimerkkijoukossa arvo 25 esiintyy kahdesti. Mikään muu numero ei toistu. Siksi tila on arvo 25.
Joissakin tietojoukkoissa esiintyy useampaa kuin yhtä tilaa. Tietosarja 22, 23, 23, 24, 27, 27, 29 sisältää kaksi tilaa, yhden molemmissa 23 ja 27. Muissa datasarjoissa voi olla enemmän kuin kaksi tilaa, niissä voi olla enemmän kuin kaksi numeroa (kuten 23, 23) , 24, 24, 24, 28, 29: moodi on yhtä kuin 24) tai siinä ei voi olla ollenkaan moodia (kuten 21, 23, 24, 25, 26, 27, 29). Tila voi esiintyä missä tahansa tietojoukossa, ei vain keskellä.
Lasketaan alue
Alue näyttää matemaattisen etäisyyden tietojoukon pienimpien ja korkeimpien arvojen välillä. Alue mittaa tietojoukon vaihtelevuutta. Laaja alue osoittaa datan suuremman vaihtelevuuden tai kenties yhden poikkeavan kaukana muusta tiedosta. Poikkeamat voivat vääristää tai siirtää keskiarvoa tarpeeksi vaikuttaakseen tietoanalyysiin.
Otosryhmässä alin arvo on 20 ja suurin arvo 36.
Laskemaan alue vähentämällä pienin arvo korkeimmasta arvosta. Vuodesta 36-20 = 16 alue on yhtä suuri kuin 16.
Otosjoukossa korkea data-arvo 36 ylittää edellisen arvon 25, 11: llä. Tämä arvo vaikuttaa äärimmäiseltä, ottaen huomioon sarjan muut arvot. Arvo 36 voi olla ulkopuolinen datapiste.
Vakiopoikkeaman laskeminen
Vakiopoikkeamalla mitataan tietojoukon variaatio. Kuten alue, pienempi keskihajonta osoittaa vähemmän vaihtelua.
Vakiopoikkeaman löytäminen vaatii kunkin datapisteen ja keskiarvon välisen neliöeron summaamisen, kaikkien neliöiden lisäämisen, summan jakamisen yhdellä pienemmällä kuin arvojen lukumäärällä (N-1) ja lopuksi osingon neliöjuuren laskeminen. Aloita matemaattisesti keskiarvon laskemisesta.
Laske keskiarvo lisäämällä kaikki datapisteen arvot jakamalla sitten datapisteiden lukumäärä. Otosdatossa 20 + 24 + 25 + 36 + 25 + 22 + 23 = 175. Jaa summa 175 datapisteiden lukumäärällä 7, tai 175 ÷ 7 = 25. Keskiarvo on 25.
Seuraavaksi vähennä keskiarvo jokaisesta datapisteestä ja neliö sitten kukin ero. Kaava näyttää tältä: ∑ (x-µ)2, missä ∑ tarkoittaa summaa, x edustaa kutakin tietojoukon arvoa ja µ edustaa keskiarvoa. Jatkamalla esimerkkijoukkoa, arvoista tulee: 20-25 = -5 ja -52= 25; 24-25 = -1 ja -12= 1; 25-25 = 0 ja 02= 0; 36-25 = 11 ja 112= 121; 25-25 = 0 ja 02= 0; 22-25 = -3 ja -32= 9; ja 23-25 = -2 ja -22=4.
Lisäämällä neliöerot erot saadaan: 25 + 1 + 0 + 121 + 0 + 9 + 4 = 160.
Jaa neliöerojen summa yhdellä vähemmän kuin datapisteiden lukumäärä. Esimerkkidatajoukolla on 7 arvoa, joten N-1 on 7-1 = 6. Neliöerojen 160 summa jaettuna 6: lla on noin 26,6667.
Laske keskihajonta etsimällä N-1: n jaon neliöjuuri. Esimerkissä 26,6667: n neliöjuuri on noin 5,164. Siksi keskihajonta on noin 5.164.
Vakiopoikkeama auttaa arvioimaan tietoja. Tietojoukon numerot, jotka kuuluvat keskiarvon yhden standardipoikkeaman sisällä, ovat osa tietojoukkoa. Numerot, jotka eivät kuulu kahden standardipoikkeaman ulkopuolelle, ovat ääriarvoja tai poikkeamia. Esimerkkijoukossa arvo 36 on enemmän kuin kaksi vakiopoikkeamaa keskiarvosta, joten arvo 36 on poikkeava. Poikkeamat voivat edustaa virheellisiä tietoja tai ehdottaa odottamattomia olosuhteita, ja niitä tulisi harkita huolellisesti tulkittaessa tietoja.