Kaikki tilastollisiin tarkoituksiin kerätty tietojoukko, kuten Yhdysvaltain väestötiedot, sisältää tietoja, jotka vaativat summaamisen ja aggregoinnin. On melkein mahdotonta luetella ominaisuuksia esimerkiksi yksilöllisinä tuloina ja perheen kokoina. Tilastotieteilijät käyttävät taajuusjakaumakuvaa kuvaa kuvaakseen kokonaisvaltaisesti. Esimerkiksi histogrammi jakaa tiedot luokkaväleihin ja laskee taajuuden, jolla kaikki siihen luokkaväliin kuuluvat jäsenet esiintyvät.Vaikka luokkavälien koon ja lukumäärän laskemiseksi ei ole tiukkoja sääntöjä, on olemassa joitain hyödyllisiä perinteisiä perusteita.
Laske data-alue, ts. Korkeimman ja alimman datapisteen välinen ero. Oletetaan esimerkiksi, että Yhdysvaltain korkeimmin palkattu henkilö ansaitsee 30 miljardia dollaria vuodessa ja pienin ansaitsee nollan. Alue on yhtä suuri kuin 30 - 0, mikä on 30 miljardia dollaria.
Määritä luokkien lukumäärä näytteen koosta. Nyrkkisääntönä käytetään viidestä seitsemään luokkaa näytteen kokoon 50 asti, kahdeksalta 10 luokkaan näytteen koon ollessa 50–100, 10–15 luokkaa näytteen koolle 100–250 ja 15–20 luokkaa näytteen kokoon suurempi kuin 250.
Laske luokkaväli seuraavan kaavan avulla: Luokkaväli = alue ÷ luokkien lukumäärä. Jos tulojen jakautumisesimerkissä on 15 tuloluokkaa, treenaa 30 ÷ 15 = 2 miljardia dollaria. Tilastotieteilijät ohittavat usein erittäin korkeat ja matalat luvut ja keskittyvät keskitaajuuksiin. Tästä syystä tulojen jakauma Yhdysvalloissa esitetään pienemmillä välein 10 000 dollaria, tulot suuremmat kuin tietty luku, yleensä miljoona, kertyen yhteen luokkaväliin.
Käytä harkintasi laskemalla luokkaväli. Graafin, kuten histogrammin, pyhän graalin tarkoituksena on välittää merkityksellistä tietoa tarkoituksenmukaisella ja yksinkertaisella tavalla. Valitse luokkavälit välittääksesi tiedot, jotka pidät lukijoiden huomion arvoisina.