Näin yhteiskuntaluokat luotiin

HS:n viimekesäisen yhteiskuntaluokkakyselyn tulokset on julkaistu luokkakoneena. Koneella voit testata, mihin yhteiskuntaluokkaan kuulut.

Alkuperäisenä ajatuksena oli sisällyttää kyselyyn hieman kaikenlaisia asioita, joita ihmiset yleensä yhdistävät yhteiskuntaluokkiin, omista ja läheisten ammateista tuloihin, varallisuuteen, koulutukseen ja niin edelleen. Taustalla oli halu tehdä jotain samankaltaista kuin Mike Savage ja Fiona Devine BBC:lle. Itse kyselyn suunnitteluun lähdettiin kuitenkin Esa Mäkisen ja Saska Saarikosken kanssa täysin puhtaalta pöydältä, lattean empiristisesti ad hoc -periaatetta seuraten pikemminkin kuin akateemisesti (tai ehkäpä niin sanottua sateenvarjo/tiskipöytä-lähestymistapaa käyttäen, ks. Luokaton Suomi).

Lopulliseen luokitteluun käytettiin ainoastaan tietoa omasta, mahdollisen puolison, vanhempien ja parhaan ystävän nykyisestä tai viimeisestä ammatista, henkilökohtaisia tuloja, koulutusta, työttömyyttä ja itse ilmoitettua, subjektiivista luokka-asemaa. Ihmiset ilmoittivat itselleen, puolisoilleen, vanhemmilleen ja ystävilleen noin 16000 (!!) erilaista ammattinimikettä, jotka tosin kattavat myös kymmenillä eri tavoilla väärin kirjoitetut samat tittelit (kuten oapettaja, optaja jne). Nimikkeet koodattiin käsityönä ISCO88-ammattiryhmiin ja edelleen Eriksonin-Goldthorpen ammattipohjaisiin yhteiskuntaluokkiin, kuitenkin niin, että ylemmästä professioluokasta erotettiin johtajat omaksi ryhmäkseen (kiitokset tutkimusapulaisille, urakka oli valtava). Tulot jaettiin desiileihin datassa (ne eivät siis olleet oikeita väestön tulodesiileitä), koulutus karkeistettiin kolmeen ryhmään (perus/kansakoulu tai vähemmän, korkeakoulutetut, muut). Lisäksi otettiin huomioon työttömyys. Eläkeläiset ja opiskelijat rajattiin aineistosta pois. Jäljelle jääneistä otettiin 5000 tapauksen otos, jotta analyysit onnistuvat tolkullisissa aikarajoissa ja tilastollisista testeistä olisi jotain erottelevaa iloa. Itse luokittelu tehtiin Stata-ohjelmistolla latent class -analyysia käyttäen, saaden aikaisiksi Hesarissa kuvatut luokat . Sen jälkeen laskettiin ennustetut todennäköisyydet kuulua kuhunkin kuudesta luokasta sekä samoja muuttujia käyttäen että ihmisten harrastusten ja median seuraamisen mukaan.

Tulokset ovat sekä yllättäviä että hauskoja, mutta ovatko ne luotettavia?  Tähän kysymykseen on vaikeampi vastata. Itse luokkia pidän sisällöllisesti luotettavina, joskin kyselyyn vähän vastanneet jakautuvat väestössä luultavasti useampaan ryhmään. Data on kerätty nettikyselynä Helsingin Sanomien verkkosivulla. Se tarkoittaa, että ne joilla ei ole päivisin aikaa tai kiinnostusta surffailla Hesarin verkkosivuilla eivät ole kyselyyn vastanneet. Aliedustettuja  ryhmiä ovat perinteisissä duunariammateissa olevat ja etenkin pienituloiset miehet, vaikka aineisto onkin painotettu iän, koulutuksen ja alueen (pk-seutu vs. muu Suomi) suhteen. Valikoitumisen vuoksi nyt muodostettujen luokkien osuuksia todellisessa väestössä on vaikea määritellä tarkasti. Eläkeläisten ja opiskelijoiden osalta tulokset ovat suuntaa antavia, ensimmäisten kohdalla luultavasti enemmän kohdalleen osuvia viimeisen ammatin perusteella vastattaessa. Lisäksi molempien ryhmien luokka-asemien määrittelemistä helpottavat muut käytetyt tiedot läheisten ammateista, tuloista ja koulutuksesta.

Vastaava harjoitus — tosin ilman tietoa ystävien ammateista — on kuitenkin mahdollista toteuttaa Tilastokeskuksen rekisteriaineistoja hyödyntäen, jolloin tulokset vastaisivat myös todellista Suomen väestöä. Kukahan ehtii ensin?