Päivähoidollako positiivinen vaikutus lasten myöhempään kouluttautumiseen? Vastauksia kritiikkiin

Jani Erola, Aleksi Karhula ja Elina Kilpi-Jakonen

Aiemmin uutisoitu tutkimuksemme, jossa tarkastelimme varhaisen päivähoitoon osallistumisen yhteyttä myöhempään koulutukseen, on saanut melkoisen huomion mediassa (esim. 1, 2, 3). Samalla se on kirvoittanut niin tutkijoiden (1, 2) kuin tavallisten kansalaisten kritiikkiä. Pyrimme tässä kirjoituksessa vastaamaan osaan näistä kommenteista. Keskitymme kahtaalle: tuloksien tulkintaan ja politiikkasuosituksiin. Emme ota kantaa siihen, mikä päivähoidon vaikutus on mahdollisiin muihin tekijöihin, kuten lasten onnellisuuteen aikuisuudessa, koska olemme tutkineet koulutusta.

Ensinnäkin moni on sitä mieltä, että olemme tulkinneet väärin omia tuloksiamme. Kuten tutkimuksemme Taulukosta 2 näkyy, päivähoidon ja koulutuksen välistä yhteyttä kuvaava estimaatti on selvästi positiivinen ensimmäisissä malleissa. Tilanne vastaa alla näkyvää Kuviota 1.

Kuvio 1.

kuvio-1

Arvata saattaa, että kumpaankin liittyy ilmeinen sekoittava perhetaustatekijä (confounder), vanhempien koulutus. Vanhempien koulutuksen vakioiminen toisissa malleissa selittääkin suuren osan päivähoidon vaikutuksesta. Kuten tiedotteessamme mainittiin, tästä huolimatta päivähoidolle jää edelleen positiivinen efekti, joka on noin puolet tai hieman sen alle alkuperäisestä. Tilanne vastaa Kuviota 2. Koulutuksen vakioiminen ottaa huomioon myös muita tärkeitä koulutuksen kanssa korreloivia, sosioekonomista asemaa selittäviä tekijöitä, kuten pääosan yhteiskuntaluokan ja tulojen vaikutuksesta (esim. Erola et al 2016), mutta luultavasti myös rekisteriaineistolla vaikeammin mitattavissa olevia seikkoja, kuten perittyjen kognitiivisten kykyjen ja koulutusasenteiden vaikutusta. Sikäli, kun nämä tekijät eivät korreloi koulutuksen kanssa, niiden vaikutus jää huomioimatta.

Kuvio 2.

kuvio-2

Kolmansissa malleissa vakioimme vanhempien työttömyyden ja tulot. Nämä tekijät ovat ensisijaisesti välittäviä muuttujia (mediating), mutta myös mahdollisesti sekoittavia tekijöitä. Nyt päivähoidon positiivinen efekti häviää. Tilanne vastaa Kuviota 3. Sikäli kun vanhempien työttömyys ja tulot korreloivat koulutuksen kanssa, on niiden vaikutus jo vakioitu toisissa malleissa.

Kuvio 3.

kuvio-3

Kritiikin perusteella kolmannet mallit tarkoittaisivat, että päivähoidolla ei ole positiivista yhteyttä lasten myöhempään koulutukseen. Oikeampi tulkinta on kuitenkin, että päivähoidolla ei ole tuloista ja työttömyydestä riippumatonta suoraa vaikutusta myöhempään koulutukseen.

Esimerkiksi jos työssäkäyvä vanhempi jää kotiin hoitamaan lasta päiväkodin sijaan, perheen tulot yleensä pienenevät. Kotiin jäämisellä on myös negatiivinen vaikutus kotiin jäävän vanhemman myöhempään työuraan (esim. Kosonen 2014). Molemmilla tekijöillä on negatiivinen vaikutus lasten kouluttautumiseen. Onko vähäisemmän kouluttautumisen oikea syy tällöin päätös jäädä kotiin hoitamaan lasta vai tulot ja työura? Tähän ei ole itsestään selvää vastausta. Päivähoidon, työttömyyden ja tulojen vaikutus on tässä tapauksessa välttämättä päällekkäinen. Sama pätee myös työhön palaavaan vanhempaan – alle kouluikäinen lapsi ei voi jäädä päiviksi yksin kotiin, joten tässä tapauksessa päivähoidon ja työssäkäynnin vaikutuksia ei voida erottaa.

Niin kuin Tuomas Kosonen osuvassa blogi-kirjoituksessaan esittää, on toki mahdollista, että havaitsemamme vaikutus on selitettävissä täysin taustan mukaisella valikoitumisella. Toisin kuin tämä kritiikki indikoi, taustan mukainen valikoituminen ei kuitenkaan ole malleissamme täysin vakioimatta; ainoastaan sikäli, kun valikoitumiseen vaikuttavat muut tekijät kuin vanhempien koulutus, tulot ja työttömyys tai näiden kanssa korreloivat muuttujat. Asetelmamme ei kuitenkaan ole sillä tavoin kausaalinen, että voisimme poissulkea tämän vaihtoehdon täysin. Toivoa sopii, että Kososen suunnitelma tulevan tutkimuksen suhteen toteutuu. Omien lisäanalyysiemme mukaan esimerkiksi kuntavarianssin huomiomisella ei kuitenkaan ole vaikutusta tuloksiin ainakaan tutkimissamme syntymäkohorteissa. Havaitsemattomien tekijöiden vakioiminen tämän tapaisin asetelmin tai esimerkiksi sisarusmalleilla veisivät lähemmäksi kausaalista tulkintaa, mutta valitettavasti aineistomme ei mahdollistanut niiden käyttämistä tässä tapauksessa.

Kokonaan toinen keskustelu on se, millaisen evidenssin perusteella pitäisi olla sallittua puhua syyseuraus-suhteista tai antaa politiikkasuosituksia. Sikäli kun kirjoittelu eri medioissa on ollut hallittavissamme, olemme olleet kausaaliväitteiden suhteen varovaisia – emme väitä, että oma tutkimusasetelmamme olisi kausaalinen. Mutta niinkuin yllä kuvataan, meillä on hyvät syyt uskoa omankin analyysimme perusteella, että a) päivähoidolla ei ole negatiivista vaikutusta koulutukseen b) todellinen kausaalinen vaikutus koulutukseen on myös Suomessa todennäköisesti positiivinen. Jälkimmäistä tulkintaa tukevat omien tuloksiemme lisäksi käytännössä kaikki Pohjoismaiset tutkimukset, joissa on tutkittu päivähoidon sosioekonomisia seurauksia, niin enemmän kuin vähemmän kausaalisia asetelmia käyttäen (tutkimuksessa mainittujen viitteiden lisäksi esim. katsaus: Ruhm & Waldfogel 2012). Politiikkasuosituksia ei varmastikaan kannattaisi antaa yksinomaan oman tutkimuksemme perusteella, mutta aiheesta jo olemassa oleva, melko monipuolinen tutkimusnäyttö huomioon ottaen on mielestämme perusteltua suositella päivähoidon käytön lisäämistä ja pohtia keinoja sen saavuttamiseksi.

Se, että positiivista efektiä näyttäisi Suomessa välittävän tulot ja työllisyys, ei muuta lopputulosta tai suosituksia. Jos tavoitteena on lapsiperheiden työssäkäynnin lisääminen, suositus viedä lapsi varhain päivähoitoon olisi sama, kuten myös siinä tapauksessa, että tavoitellaan perheiden tulojen lisäämistä.

Hämmennystä on herättänyt myös joissain medioissa vahvasti esiin nostettu kaksi vuotta optimaalisena ikänä päivähoitoon siirtymiseen. Analyysiemme perusteella kaksivuotiaat tosiaan kouluttautuivat pisimmälle. Erot alle neljävuotiaiden välillä olivat kuitenkin pieniä, eikä tulosten perusteella ole käytännön merkitystä, tapahtuuko päivähoitoon meno yksi-, kaksi- vai kolmivuotiaana. Muutenkin tuloksemme, kuten tutkimusten tulokset lähes aina, koskevat keskimääräisiä vaikutuksia ja yhteyksiä. Jokainen lapsi on yksilö, jota koskevissa päätöksissä kannattaa huomioida perheen ja lapsen oma tilanne.

Lisäksi pahennusta on herättänyt se, että osa lehdistä on kutsunut tutkimustamme mullistavaksi. Syytä voimme vain arvailla. Ehkä toisaalta siksi, että tähän asti Suomessa on julkisuudessa keskusteltu lähinnä siitä, kuinka vahingollista varhainen päivähoito on lapsille, ja toisaalta siksi, ettei pitkäaikaisia sosioekonomisia vaikutuksia ole aiemmin Suomessa juuri tutkittu.

Oma tutkimuksemme ja siinä siteerattu tutkimuskirjallisuus käsittelevät pääosin lapsuuden vaikutuksia sosioekonomiseen asemaan aikuisiällä (erityisesti koulutukseen ja tuloihin). Kannustamme keskustelijoita myös tutustumaan artikkelin sivulta 11 alkavaan Discussion and conclusion -osioo, jossa pohditaan tutkimuksen rajoitteita ja tulosten tulkintaa. Suurinta osaa esitetystä kritiikistä on jo käsitelty tässä osassa tutkimusta, mukaan lukien yllä käsitellyt mallien tulkinnat ja kausaalisiin tulkintoihin liittyvät rajoitteet.

Samaa aihetta käsittelevää tulevaa kirjallisuutta ja muita päivähoidon vaikutuksia käsittelevää kirjallisuutta kannattaa tietenkin nostaa keskusteluun erityisesti siltä osin kuin se koskee Suomea tai muita Pohjoismaita. Poliittisia päätöksiä ei mielestämme lähes koskaan kannata perustaa yksittäisiin tutkimuksiin, vaan kattavaan tutkimuskirjallisuuteen ja asiantuntijoiden kuulemiseen. Päivähoito aiheena herättää vahvoja tunteita, ja tämänkin vuoksi asian tarkastelu tutkimusten valossa on erittäin tärkeää. Jäämme innolla odottamaan uusia tutkimuksia aiheesta.

Viitteitä:

Erola, Jani, Sanni Jalonen, and Hannu Lehti. “Parental Education, Class and Income over Early Life Course and Children’s Achievement.” Research in Social Stratification and Mobility 44 (2016): 33–43.

Kosonen, Tuomas. “To Work or Not to Work? The Effect of Childcare Subsidies on the Labour Supply of Parents.” The B.E. Journal of Economic Analysis & Policy 14, no. 3 (2014): 817–848.

Ruhm, Christopher J., and Jane Waldfogel. “Long-Term Effects of Early Childhood Care and Education.” In Nordic Economic Policy Review: Economics of Education, 23–51. Nordic Council of Ministers, 2012.

Artikkelimme päivähoidosta

Artikkelimme yhdessä Aleksi Karhulan ja Elina Kilpi-Jakosen kanssa päivähoidon hyödyllisyydestä kouluttautumiseen on herättänyt laajaa huomiota. Se löytyy työpaperimuodossa täältä: http://wpsei.utu.fi/wp-content/uploads/2016/04/WPSEI9.pdf

Erityisesti kannattaa tutustua diskussio-osuuteen sivulta 11 eteenpäin.

Juttu julkaistaan keväällä 2017 kokoomateoksessa Blossfeld, Hans-Peter, Kulic, Nevena, Skopek, Jan & Triventi, Moris (eds):  ”Childcare, Early Education and Social Inequality – A Cross-national Perspective”. Cheltenham, UK and Northampton, MA, USA: Edward Elgar.

Kysely: miten JUFO-luokitus PITÄISI tehdä?

Ehdotin blogissani, että nykyisen asiantuntijapaneelin sijaan lehdet JUFO-luokituksen tasoille pitäisi valita äänestämällä. Keskustelussa on tullut esiin myös muita vaihtoehtoja. Miten mielestäsi lehtijaottelu olisi parasta tehdä? Kyselyä saa jakaa!

Vastaa kyselyyn täällä: http://goo.gl/forms/feQyjSvXhZ

Kyselyn tulos päivittyy alla olevaan kuvaan.

Valitaan lehdet JUFO-tasoille äänestämällä!

<EDIT 14.5.2016: Tein aiheesta kyselyn. Vastaa siihen täällä: http://goo.gl/forms/feQyjSvXhZ >

Koitin etsiä sopivaa journaalia artikkelikäsikirjoituksellemme. Päädyin kaivelemaan tiedelehtien JUFO-listaa, jota en ollut muutamaan vuoteen seurannut. Tämä lista on tärkeä, sillä sitä käytetään hyväksi OKM:n rahoitusmallissa: listan perusteella korkeatasoisemmaksi tieteenalalla arvioidussa lehdessä julkaisemisesta maksetaan enemmän rahaa. Tutkijoiden kuulee ainakin sosiologian alalla manaavan luokittelua useinkin. Olin silti järkyttynyt. Vaikka oma käsitykseni on, että tunnen sosiaalitieteiden julkaisukentän hyvin aikaisempien ja nykyisten tehtävieni (1, 2) perusteella, en ollut koskaan törmännyt useisiin korkeimman 3-tason lehdistä. Osan tälle tasolle päätyneistä lehtistä tiesin entuudestaan heikkotasoisiksi.

Kaivoin muutaman itselleni tuntemattoman kolmostason lehden vaikuttavuusluvun (impact factor, IF). Tämä vahvisti epäilyni. Kun lehden IF on 0,096 (Journal of Womens History) tai edes 0,2 (Representations), ei kukaan voi vakavissaan väittää kyseisen lehden olevan minkään sosiaalitieteiden alan kärkilehti vuonna 2016.

Pyysin tutkimusavustajaamme keräämään ensin kaikkien 3- ja 2-tason  sosiologian sekä sosiaali- ja yhteiskuntapolitiikan alan lehtien IF:t (aloina päällekkäiset ja yhteinen arviointipaneeli, joka kattaa JUFOssa paitsi sosiologian, myös väestötieteen, naistutkimuksen ja sukupuolitutkimuksen, nuorisotutkimuksen, sosiaalipsykologian, yhteiskunta- ja sosiaalipolitiikan sekä sosiaalityön). Ajatuksena oli, että koska erityisesti tasolle 3 otettavien lehtien määrä on tiukasti rajattu, pitäisi tasoerojen näiden välillä olla selvät. Mielekkään vertailun mahdollistamiseksi lisäsimme vertailutiedot lähialan valtio-opin vastaavan lehtilistan IF:t.

Data löytyy oheisen linkin alta (csv). Sosiologian/sosiaalipolitiikan IF:n ja lehden JUFO-tason korrelaatio on 0,23 luokkaa. IF selittää vain 5,5% kahden korkeimman JUFO-tason välisestä vaihtelusta. Toisin sanoen – lehtien vaikuttavuus ei juuri yhteydessä siihen, onko lehti päätynyt JUFO3 vai JUFO2-tasolle. Valtio-opin korrelaatio on sentään 0,33 (ja selitysaste 12,8%), mutta kuten alla olevasta kuviosta selviää, ero ei ole tilastollisesti merkitsevä. Analyysiin ei ole sisällytetty kotimaisia ja muita lehtiä, joille ei ole ollut mahdollista laskea vaikuttavuuslukua.

sosvalt

Kuvion tärkein “pihvi” löytyy sen vasemmasta alareunasta; jopa täysin ei-vaikuttavien lehtien on suhteellisen suuri mahdollisuus päätyä korkeimmalle JUFO-tasolle kummallakin alalla (verrattuna JUFO2-tasolle päätymiseen). Sosiologiassa todennäköisyys on jopa viidenneksen luokkaa. Kaiken järjen mukaan tämän ei pitäisi olla mahdollista lainkaan, eli todennäköisyyden ei pitäisi tuossa kohtaa jakaumaa poiketa nollasta tilastollisesti merkitsevällä tavalla. Sosiologiassa vasta yli 2 IF:n lehtien todennäköisyys päätyä korkeimmalle tasolle alkaa poiketa tilastollisesti merkitsevästi hypoteettisen nollan IF:n lehden todennäköisyydestä.

Miten tähän on päädytty? Kaikkien lehtien joukosta 2- ja 3-tasoille lehdet valitsee tiedeyhteisön itse valitsema asiantuntijapaneeli. Tunnen monet sosiaalitieteiden paneelin jäsenistä, eikä heidän kohdallaan asiantuntijuuden pitäisi olla ongelma.

Asiantuntijatoimikuntaan nojaava järjestelmä JUFO-luokittelun muodostamiseksi ei mitä ilmeisimmin toimi. Tarvitaan siis vaihtoehtoinen tapa. Mitä vaihtoehtoja on olemassa?

Ensimmäiseksi tulee mieleen käyttää vaikuttavuuslukuja suoraan. Tämä toimii mielestäni hyvin vaikkapa ISI Web of Sciencen tai Googlen sosiologian alan lehdiksi lukemien journaalien joukossa. Ongelma tässä on se, että IF ei ole vertailukelpoinen tieteenanalojen välillä.  Vaikka sosiaalitieteiden tutkimusalaryhmä on suhteellisen yhtenäinen, poikkitieteelliset erityisalalehdet, jotka sijoittuvat vaikkapa terveystieteiden ja sosiologian välimaastoon, sijoittuisivat automaattisesti JUFO3-tasolle, vaikkei niitä voi mitenkään pitää tutkimusalan kannalta keskeisinä (esim. “Tobacco Control”, IF 5,2).  Sosiaalitieteiden ja psykologian välimaastoon sijoittuvat sosiaalipsykologian lehdet päätyisivät samasta syystä ylipäätänsä todennäköisimmin kolmostasolle. Lisäksi kotimaiset lehdet, joille kukaan ei ole laskenut vertailukelpoista vaikuttavuuslukuja, jäisivät kokonaan pois listalta. Tämä olisi valitettavaa. Suomenkielistä tieteellistä julkaisemista pitää tukea ja JUFO on mainio keino siihen.

Moni ongelma ratkeaisi sillä, että alan tutkijat yksinkertaisesti äänestävät parhaaksi katsomansa lehdet. Tämä antaisi kaikille alan tutkijoille samanlaisen mahdollisuuden kotiinpäin vetämiseen. Ongelmana suorassa äänestyksessä on se, että esimerkiksi American Sociological Review, joka IF:n perusteella on pitkään ollut alan kärkilehti, saattaisi tippua kokonaan JUFO3-ryhmän lehtien joukosta: kukaan suomalainen ei ole koskaan julkaissut lehdessä (yritetty on!).

Kolmas tapa olisi jonkinlainen yhdistelmä kahden edellisen väliltä. Sen mukaan alan tutkijat äänestäisivät tieteenalan kannalta tärkeimmät lehdet (esim. 20 tärkeimpänä pitämäänsä) ja näiden sisällä jaottelu tehtäisiin yksinkertaisesti vaikuttavuuden perusteella. Tärkeimpien listalle päässeet kotimaiset lehdet voitaisiin suoraan ottaa nykyiseen tapaan JUFO2-tasolle.

 

Eurooppa yhtenäistyy – myös sosiaalisessa liikkuvuudessa

Kirjoitin Heta Pöyliön kanssa Talous & Yhteiskunta -lehteen ylisukupolvisesta sosiaalisesta liikkuvuudesta. Yksi jännittävimmistä havainnoista oli sosiaalisen liikkuvuuden konvergoituminen Euroopassa: maista on tullut entistä vahvemmin toistensa kaltaisia siinä, miten vahvasti perhetausta selittää omaa asemaa yhteiskunnissa.

Abstraktimme:

“Sosiaalinen liikkuvuus mittaa, missä määrin vanhemman ja lapsen sosiaaliset asemat poikkeavat toisistaan. Korkea sosiaalinen liikkuvuus kertoo yhteiskunnan avoimuudesta ja sen puute, sosiaalinen periytyvyys, on yksi tärkeimmistä eriarvoisuuden mittareista. Tässä artikkelissa tarkastellaan sosiaalisen aseman periytyvyyttä European Social Survey -aineistolla. Tulokset osoittavat, että perhetaustan vaikutus lapsen sosiaaliseen asemaan on heikentynyt ajan mittaan, etenkin Suomessa. Sukupuolten väliset erot liikkuvuudessa ovat pienentyneet, mutta vanhemmat vaikuttavat lasten asemaan etenkin koulutuksen kautta.”

Koko juttu

Nettikyselyjen raportointi

Toimittaja Björn Udd haastatteli minua kesällä nettikyselyistä HBL:iin. Björniä kiinnosti näkemykseni nettikyselyiden luotettavuudesta ja raportointistandardeista. Vastauksessani Björnille tuli esiin asioita, joita sosiaalitieteilijöiden olisi syytä pohtia yleisemminkin.

Paras puoli kaikille vastaajille avoimissa nettikyselyissä on, että niillä voidaan kerätä nopeasti ja halvalla paljon aineistoa. Huono puoli on se, että nettikyselyt ovat yleensä valikoituneita näytteitä verkonkäyttäjistä, eivätkä otoksia väestöstä tai sen osasta. Periaatteessa verkkoaineistot voidaan painottaa vastaamaan väestöä. Valikoituminen kaikille avoimiin verkkokyselyihin on tällä hetkellä kuitenkin niin suurta, että painottamien perinteisin tavoin on vaikeaa tai jopa käytännössä mahdotonta.

Esimerkiksi HS-luokkakoneaineisto painotettiin usean tekijän suhteen, mutta on edelleen esimerkiksi ammatilliselta rakenteeltaan vinoutunut suhteessa todelliseen väestöön. Syyt tähän ovat ilmeisiä — verkkokyselyitä täytellään ruokatunneilla, kahvitauoilla ja työn ohessa taikka sitten vapaa-ajalla etenkin päivisin. Monilla työpaikoilla vastaaminen ei ole yksinkertaisesti mahdollista eikä vapaa-aikaa päivisin ole (iltaisin puuhataan muuta). Eli väestöön tai sen osaan yleistämisen suhteen pitäisi tällaisten aineistojen kohdalla olla todella varovainen.

Sen sijaan näillä datoilla on helppoa ja kustannustehokasta testata uusia ideoita. Tämä oli ajatuksena myös luokkakoneessa — pystyttiin kokeilemaan, millaiset luokkaan usein liittyvä tekijät ovat niin usein yhteydessä toistensa kanssa, että niiden pohjalta voidaan erottaa jonkinlaisia identifioitavissa olevia latentteja luokkia. Voidaan siis olettaa että tutkittava ilmiöt ovat verkkoaineistossa samankaltaisessa yhteydessä toisiinsa kuin vastaavaa tietoa keräävissä edustavissa aineistoissa.

Aineiston valikoituminen kuitenkin tarkoittaa sitä, että uusia ideoita ja havaintoja ei pitäisi ollenkaan raportoida tuloksia yksinkertaisina jakaumina (“xx % suomalaisista kuuluu eliittiin” tai “xx% eläkeläisistä suunnittelee ulkomaanmatkaa”) ellei olla ihan varmoja siitä, että data vastaa todellista väestöä. Tyypillisten valikoitumiseen vaikuttavien tekijöiden ryhmien sisällä tämä on mielestäni hiukkasen turvallisempaa (esim. “Pääkaupunkiseudulla asuvista korkeakoulutetuista eläkeläisistä, joiden tulot ovat xxx-yyy euroa, zz % suunnittelee ensi vuonna ulkomaanmatkaa” ja näiden vertaaminen johonkin toiseen ryhmään).

Vastaavia ongelmia liittyy isojenkin tutkimusfirmojen quota-otoksiin. Vastaamatta tai tavoittamatta jääneistä ei niissä ole yleensä mitään tietoa — siksi että vetää näiden kyselyiden uskottavuudelta pohjan pois. Maininta 2 % virhemarginaalista ei korvaa kadon raportointia — varsinkin kun virheen määrä on oikeasti ryhmästä toiseen erilainen.

Yksi korrekti tapa raportoida nettikyselyitä voisi olla, että mainitaan lukijoille, että aineisto valikoitunut näyte nettilukijoista, ei väestöä tai sen tiettyä osaa edustava otos.

Summa summarum, nettiaineistojen etuja ovat:
– ovat mielenkiintoisia ja ennen kaikkea halpoja
– voivat antaa vinkkejä jostain uudesta
– voivat antaa tietoa ilmiöiden välisistä suhteista

Niiden heikkoutena on:
– eivät yleensä ole yleistettävissä niin että voitaisiin sanoa jotain tarkkaa yleisyydestä väestössä

Keskiluokka ei voi kadota

Tämän päivän Hesarissa kirjoitetaan keskiluokkaisten ammattien katoamisesta, ks. http://www.hs.fi/talous/Keskiluokan+ty%C3%B6paikat+katoavat+biteiksi/a1390767423539

Juttuun sisältyy yksi perustavanlaatuinen logiikkavirhe: keskiluokka, sellaisena kuin se jutussa ymmärretään, ei voi määritelmänsä mukaan kadota.

Jutussa lähdetään etenkin taloustieteissä usein seuratusta ajatuksesta, että keskiluokkaa ovat keskituloisissa ammateissa olevat. Keskiluokaksi määritellään tällöin yleensä tulojakauman keskiosaan kuuluvat vaihtelevin kriteerein; esimerkiksi keskimmäisiä tulodesiilejä tai +/- 60 % mediaanituloista ansaitsevat ammatit. Sitä, mitä tällä tarkkaan ottaen nyt tarkoitetaan, ei ainakaan nettiversiossa paljasteta.

Oletetaan ensin mainittuun tapaan, että keskiluokkaa ovat esim. 60 % niistä ammateista, jotka ovat lähimpänä työssäkäyvien keski- tai mediaanituloa. Ne ammatit, jotka aiemmin kuuluivat tuohon keskiryhmään, olisivat jutun perusteella siis katoamassa. Tästä kuitenkin seuraa, että kun keskiluokkana ymmärretään jollakin tapaa fiksattuna osana tulojakaumasta, keskiluokkaan joko  a) tulee uusia ammatteja tai b) sinne jäävien ammattien osuus työssä olevista kasvaa.  Keskiluokka ei tällöin voi kadota, vaan keskiluokkaan kuuluvat ammatit muuttuvat.

Jos keskiluokka määritellään ammattiryhmäkohtaisten tulojen suhteena mediaanituloihin (esim. edellä mainittu +/- 60%), keskiluokkaan kuuluvien osuus voi myös pienentyä. Käytännössä kyse on kuitenkin silloin tulonjaon muutoksesta, joka voi tapahtua monilla, eriarvoisuuden kannalta jopa päin vastaisilla tavoilla. Keskiluokan koko voi vaihtua niin pieni- kuin suurituloisten osuuden kasvusta johtuen tai myös molempien osuuden kasvaessa. Tällöinkään keskiluokka ei voi silti kadota, koska mediaanituloisiin kuuluu väkisinkin jokin tietty ryhmä.

Keskiluokan katoamisen sijaan havainto viittaa oikeastaan yksinkertaisesti tulojakauman venymiseen. Yhteiskunnallisen eriarvoisuuden kannalta olisi olennaista tietää, mistä tämä johtuu: siitä, että osa keskiluokasta suhteellisesti köyhtyy, osa rikastuu tai että tapahtuu niin köyhtymistä kuin rikastumista. Mutta tätä voi tarkastella paljon suoremmin tulonjakotilaston avulla tekemättä kierrosta ammattien kautta. Seuraavia tuloksia tulojakotilastosta odotellaan maaliskuussa.

Kuulut myös muihin luokkiin

HS:n luokkakoneesta saatu palaute on ollut huimaa ja pääosin positiivista. Kritiikkiä on tullut erityisesti siitä, että pienetkin muutokset vastauksiin saattavat muuttaa tuloksia — siitä huolimatta, että testin tekijöitä varoitetaan, että yksittäisen ihmisen kohdalla tulos on vain suuntaa antava. On paikallaan selittää hieman tarkemmin, mitä luokkakoneen antamat tulokset kertovat ja mitä eivät. Tuloksen muuttuminen ei kerro virheestä, vaan siitä, että luokkakone laskee todennäköisyyksiä kuten pitääkin.

Luokkakoneen pohjalla olevat tilastolliset mallit ja myös itse luokkakone laskee todennäköisyyksiä kuulua kaikkiin kuuteen luokkaan. Testin alkupuolen vastausten mukaan muuttuvat palkit näyttävät testiä täyttäessä, miten vastaaminen vaikuttaa todennäköisyyksiin. Nämä todennäköisyydet ovat peräisin alla esitetystä Taulukosta 1. Jos oletetaan, että henkilö on yliopisto-opettaja (kuuluu Eriksonin-Goldthorpen ammattiluokan mukaan ryhmää I), puoliso kirjanpitäjä (IIIa), äiti on sihteeri (IIIa), isä putkimies (ammattitaitoinen työväestö  V-VI), paras ystävä on lääkäri (I), kuuluu tulodesiiliin V, on korkeakoulutettu, katsoo kuuluvansa ylempään keskiluokkaan ja on töissä, voidaan näiden tietojen perusteella laskea hänelle todennäköisyys kuulua jokaiseen kuudesta luokasta.  Eli tässä tapauksessa jokaisesta sarakkeesta lasketaan yhteen vastauksen mukaiset estimaatit sekä sarakkeen vakiotermi, joka tässä tapauksessa antaa henkilölle seuraavat todennäköisyydet kuulua eri luokkiin:

Eliitti Asiantuntija Nousija/kipuaja Leipätyöläinen Duunari Vähäosainen
0,34 0,36 0,34 -0,02 0,05 -0,09

Tämä henkilö kuuluu suurimmalla todennäköisyydellä asiantuntijoihin, mutta lähes yhtä suurella todennäköisyydellä eliittiin ja nousijoihin. Luokkakone raportoi vain suurimman todennäköisyyden eli tässä tapauksessa asiantuntijaluokan, mutta tähän tulokseen liittyy — varoituksen mukaisesti — aimo annos epävarmuutta. Todennäköisyys kuulua johonkin luokkaan ei todellisuudessa voi myöskään olla negatiivinen (kuten tämän henkilön kohdalla luokissa “leipätyöläinen” ja “vähäosainen”). Kaikkiin estimaatteihin sisältyy kuitenkin virhettä, joten näiden luokkien osalta tulokset kertovat lähinnä, että henkilön todennäköisyys kuulua luokkiin “leipätyöläinen”, “duunari” ja “vähäosainen” on erittäin pieni, lähelle nollaa. Esimerkiksi oma luokkakoneen tulokseni oli hyvin samankaltainen.

Oletetaan sen sijaan, että saman henkilön isä onkin oikeasti ollut lääkäri. Silloin todennäköisyydet jakautuvat seuraavasti:

Eliitti Asiantuntija Nousija/kipuaja Leipätyöläinen Duunari Vähäosainen
0,43 0,58 0,02 -0,07 0,1 -0,09

Nyt henkilö kuuluu paljon selvemmällä marginaalilla asiantuntijoihin (lähes 60 % todennäköisyydellä) ja myös aiempaa suuremmalla todennäköisyydellä eliittiin, mutta enää hyvin pienellä todennäköisyydellä nousijoihin. Voidaan siis sanoa, että tässä esimerkissä tulos luokka-asemasta on paljon varmempi kuin edellisessä.

Tulosten muuttuminen paljastaa jotain hyvin olennaista nyky-yhteiskuntien yhteiskuntaluokista. Vaikka luokkarakenne kokonaisuutena yhteiskunnassa muuttuu hitaasti, ei luokkia itsessään voida pitää varsinaisesti suljettuina. Varsinkin työurien alussa oma asemamme ehtii muuttua moneen kertaan.

Entäpä sitten kulttuurinen luokka? Sen kohdalla todennäköisyyksien laskemiseen voi käyttää Taulukossa 2 alla esitettyjä tuloksia (eli Taulukon 1 estimaatteja ei sen arvioimiseksi oteta huomioon). Koska miesten ja naisten harrasteet ja mediankulutus poikkeavat  (toisin kuin yllä esitettyjen mallien kohdalla), kulttuurista luokkaa mallinnettiin erikseen miehille ja naisille. Vaikkapa ilmoitetut tulot eivät vaikuta siihen, millaisen tuloksen kulttuurisesta luokastasi luokkakone antaa. Esimerkiksi jalkapallo ei ole Suomessa erityisesti duunarilaji, vaan ainoastaan eliitille epätyypillinen, jääkiekko sen sijaan erityisen vähän asiantuntijanaisten laji eikä formuloiden seuraaminen erottele  luokkiin kuuluvia tilastollisesti merkitsevästi lainkaan.

Luokkakoneen tuloksen muuttuminen vähänkin vastauksia muutettaessa ei siis ole virhe, vaan merkki siitä, että taustalla oleva tilastolliset mallit tekevät sitä mitä niiden pitäisikin. Virheitäkin testistä luultavasti löytyy, esimerkiksi noin 16000 ammattinimikettä ei varmasti ole onnistuttu koodaamaan täydellisesti ISCO88-ryhmiin.

Summa summarum, kaikki meistä kuuluvat jollakin todennäköisyydellä jokaiseen luokista — osaan todennäköisemmin kuin toisiin.

Taulukko 1. Estimaatit kulttuurisen luokan määrittämiseksi. Lineaarinen todennäköisyysmalli, estimoitu jokaisen luokan kohdalla erikseen. (Tilastollinen todennäköisyys: *** erittäin merkitsevä ** merkitsevä * melkein merkitsevä)

Eliitti Asiantuntijat Nousijat Leipätyö Duunarit Vähäosaiset
b b b b b b
Oma ammatin mukainen yk-luokka (Erikson Goldthorpe+Johtajat) Johtajat 0.00 0.00 0.00 0.00 0.00 0.00
I Ylemmät professioammatit -0.17*** 0.16*** 0.02 -0.02 0.01 0.00
II Alemmat professioammatit -0.34*** 0.24*** 0.07** 0.01 0.03** -0.01
IIIa Toimistott. -0.25*** 0.02 -0.13*** 0.36*** 0.02 -0.02
IIIb Asiakaspalv. -0.24*** 0.02 -0.15*** 0.28*** 0.03 0.06
IV Yrittäjät -0.15*** 0.10* 0.06 -0.05 0.02* 0.02
V-VI Ammattitaitoinen työväestö -0.27*** -0.00 -0.27*** -0.03 0.58*** 0.00
VIIa Muu työväestö -0.27*** -0.10* -0.14*** -0.10** 0.58*** 0.02
VII Muu työväestö maataloudessa -0.25*** 0.15 -0.15 -0.24** 0.40** 0.09
Ivc Maanviljelijät -0.34*** 0.46*** -0.20 -0.19*** 0.26 0.00
Ei ammattia -0.26*** 0.20*** 0.03 -0.06 0.04* 0.05
Puolison ammatin mukainen EG-luokka Johtajat 0.00 0.00 0.00 0.00 0.00 0.00
I Ylemmät professioammatit 0.03 -0.10** 0.06 -0.00 0.02 -0.01
II Alemmat professioammatit 0.07** -0.06* -0.07* 0.04 0.02 0.00
IIIa Toimistott. 0.06 -0.09* -0.09** 0.13*** 0.01 -0.02
IIIb Asiakaspalv. 0.10** -0.12** -0.11** 0.05 0.09*** -0.01
IV Yrittäjät 0.08* -0.06 -0.02 0.03 -0.02 -0.02
V-VI Ammattitaitoinen työväestö -0.02 -0.06 -0.06 0.11* -0.02 0.05
VIIa Muu työväestö 0.04 -0.14* -0.12** 0.12** 0.05* 0.05**
VII Muu työväestö maataloudessa -0.07 0.18* -0.20** 0.04 0.02 0.03
Ivc Maanviljelijät -0.03 -0.01 -0.31** 0.38** 0.01 -0.04
Ei ammattia 0.03 -0.08** -0.04 0.06** 0.01 0.03**
Äidin ammatin mukainen EG-luokka Johtajat 0.00 0.00 0.00 0.00 0.00 0.00
I Ylemmät professioammatit -0.12** 0.01 0.10*** -0.02 0.01 0.02
II Alemmat professioammatit -0.10** 0.01 0.09** -0.02 0.00 0.03
IIIa Toimistott. -0.08* -0.15*** 0.15*** 0.01 0.04** 0.02
IIIb Asiakaspalv. -0.11*** -0.22*** 0.23*** 0.07** 0.01 0.01
IV Yrittäjät -0.16*** -0.28*** 0.39*** -0.08* 0.06* 0.08*
V-VI Ammattitaitoinen työväestö -0.15*** -0.26*** 0.40*** -0.07 0.03 0.05*
VIIa Muu työväestö -0.10** -0.25*** 0.28*** 0.04 -0.00 0.04
VII Muu työväestö maataloudessa -0.18** -0.29*** 0.27*** 0.11 0.08 0.00
Ivc Maanviljelijät -0.09 -0.15* 0.07 0.11 -0.00 0.06
Ei ammattia -0.06 -0.06 0.05 0.02 0.03 0.03
Isän ammatin mukainen EG-luokka Johtajat 0.00 0.00 0.00 0.00 0.00 0.00
I Ylemmät professioammatit 0.04 -0.02 -0.06** -0.04 0.05** 0.02
II Alemmat professioammatit 0.01 -0.08** 0.01 0.01 0.02 0.03**
IIIa Toimistott 0.02 -0.18* 0.07 0.04 0.02 0.02
IIIb Asiakaspalv. -0.01 -0.16** 0.12 -0.06 0.06* 0.04
IV Yrittäjät -0.02 -0.26*** 0.23*** 0.01 -0.02 0.05*
V-VI Ammattitaitoinen työväestö -0.05* -0.24*** 0.26*** 0.01 0.00 0.02
VIIa Muu työväestö -0.03 -0.29*** 0.24*** 0.01 0.03 0.05**
VII Muu työväestö maataloudessa -0.06 -0.21*** 0.24*** -0.10 0.13 -0.00
Ivc Maanviljelijät 0.02 -0.09 -0.04 0.18*** -0.04 -0.03
Ei ammattia -0.09* -0.11 0.19*** -0.01 0.09** -0.08
Parhaan ystävän ammatin mukainen EG-luokka Johtajat 0.00 0.00 0.00 0.00 0.00 0.00
I Ylemmät professioammatit -0.08** 0.05 0.05 -0.05** 0.02 0.00
II Alemmat professioammatit -0.18*** 0.13*** -0.02 0.07** -0.03** 0.04*
IIIa Toimistott. -0.15*** 0.02 -0.02 0.15*** -0.02 0.02
IIIb Asiakaspalv. -0.15*** 0.01 -0.01 0.13*** -0.05* 0.06*
IV Yrittäjät -0.06 -0.11** 0.10** 0.03 0.01 0.01
V-VI Ammattitaitoinen työväestö -0.19*** 0.02 0.04 0.03 0.05 0.05
VIIa Muu työväestö -0.12*** 0.08 -0.07 -0.14** 0.17** 0.08**
VII Muu työväestö maataloudessa -0.16*** 0.04 -0.10 0.02 0.16** 0.05
Ivc Maanviljelijät -0.19*** 0.22 -0.06 0.05 0.00 -0.03
Ei ammattia -0.20*** 0.24*** -0.12*** 0.11* -0.05** 0.02
Tulodesiili (datassa) Alin 0.00 0.00 0.00 0.00 0.00 0.00
II 0.00 0.00 0.10** 0.29*** 0.15*** -0.55***
III 0.01 0.03 0.09* 0.38*** 0.14*** -0.65***
IV -0.02 0.07 0.25*** 0.22*** 0.12*** -0.63***
V -0.07** 0.13* 0.28*** 0.14*** 0.16*** -0.64***
VI -0.02 0.15* 0.25*** 0.12** 0.13*** -0.63***
VII 0.11*** 0.06 0.24*** 0.06 0.16*** -0.62***
VIII 0.29*** -0.09 0.19*** 0.08* 0.15*** -0.62***
IX 0.29*** -0.16** 0.24*** 0.12** 0.13*** -0.61***
Ylin 0.45*** -0.20*** 0.09 0.12** 0.13*** -0.58***
Koulutus Korkeintaan perus/kansak. 0.00 0.00 0.00 0.00 0.00 0.00
Keskiaste 0.05* -0.18*** 0.08** 0.08** -0.06** 0.02
Korkeakoulu 0.13*** -0.14*** -0.00 0.06* -0.07*** 0.02
Subjektiivinen luokka Yläluokka tai eliitti 0.29*** -0.06 -0.09 0.01 0.10 -0.24***
Ylempi keskiluokka 0.19*** 0.06 -0.05 -0.11 0.12 -0.21***
Alempi keskiluokka -0.02 -0.01 0.13* -0.03 0.13 -0.20***
Työväenluokka -0.01 -0.11 -0.04 0.16* 0.20* -0.21***
Alaluokka 0.00 0.00 0.00 0.00 0.00 0.00
Ei mikään luokka 0.02 0.09 0.00 -0.08 0.12 -0.15**
Muu -0.00 0.11 -0.13* -0.05 0.13 -0.06
Työttömyys Ei 0.00 0.00 0.00 0.00 0.00 0.00
Kyllä 0.08** -0.17* 0.02 -0.11* -0.06 0.24***
Vakiotermi 0.41*** 0.58*** -0.28*** -0.19* -0.24** 0.72***

Taulukko 2. Estimaatit kulttuurisen luokan määrittämiseksi. Lineaarinen todennäköisyysmalli, estimoitu jokaisen luokan kohdalla erikseen. (Tilastollinen todennäköisyys: *** erittäin merkitsevä ** merkitsevä * melkein merkitsevä)

Miehet Naiset
Eliitti Asiantuntijat Nousijat Leipätyö – uunarit Vähäosaiset Eliitti Asiantuntijat Nousijat Leipätyö – uunarit Vähäosaiset
b b b b b b b b b b b b
– matkailu 0,03 -0,03 0.07* -0,02 0,02 -0.07*** 0.06** 0,01 0,01 -0,02 -0,01 -0,05
– Jalkapallo -0.10* 0,05 -0,02 0,04 0,04 -0,01 -0,01 -0,04 0,08 -0,09 -0,01 0,06
– Salibandy -0,09 0.11* 0,06 -0,05 -0,05 0,01 0,05 0,03 0,08 -0,1 0 -0,06
– hiihto 0.10** -0.06* 0,03 -0.07* 0,03 -0.03** 0,03 0.20*** 0,01 -0.12** 0 -0.12***
– Metsästys 0.13* -0,08 -0,06 0,03 0,01 -0,03 0 -0,04 0,03 -0,07 -0,04 0,12
– golf 0.19*** -0,04 -0,04 -0,01 -0.09*** -0,01 0,03 0,05 0,04 -0,14 -0,02 0,04
– kävely, lenkkeily -0,06 -0,03 0.09* 0,03 -0,03 -0,01 0,01 0,05 -0,01 -0,05 0,01 -0,02
– teatteri 0,05 -0,01 -0,05 0,03 -0,02 0 0,01 -0,04 0.07* 0.08* -0,01 -0.11***
– sauvakävely 0.21*** -0,07 -0,06 -0,06 0 -0.03* -0,01 -0.11** 0,04 0,05 0,02 0,01
– lukeminen, korkea 0,04 -0,01 -0,02 0 -0,02 0,02 0 0 0,02 -0.09* 0 0.08*
– elokuvat -0,04 -0,04 0,06 0,04 -0,03 0,01 -0,03 0,02 0.06* -0.08* 0,01 0,02
– tanssi -0,03 0,01 -0,07 0,03 0,03 0,03 -0.05* 0,07 -0.07* -0,02 0,02 0,04
– pyöräily -0,04 -0,03 0,02 0,02 0,04 0 -0,03 -0,03 -0,03 0.08* 0,02 -0,01
– Jääkiekko 0,05 0 -0,01 -0,01 -0,04 0,01 0,03 -0.11* 0,01 0,07 -0,01 0
– Veneily tai purjehdus 0,07 -0.07* 0,05 -0,03 -0,05 0,02 0 -0,05 0,05 -0,03 -0.03* 0,06
– uinti 0,01 0,04 -0.11*** 0 0,08 -0,02 0 0 -0,02 -0,07 0 0.09**
– jooga -0,05 0.16* -0,06 -0.09** 0,05 -0,01 -0,02 0 0.09* 0 0 -0.06*
– puutarha 0,08 -0,06 -0,03 0,08 -0,04 -0,02 0,01 0 0,04 0 -0,01 -0,04
– sisustus 0.16*** 0,02 -0.09* -0.07** 0 -0,01 0.06** -0,04 0 0,03 -0.03* -0,03
– ruoanlaitto 0,01 -0,03 -0,01 0,01 0,02 -0,01 0,03 0,01 -0,01 0 0 -0,03
– formula 1 -0,02 -0,01 -0,03 -0,01 0,06 0,01 -0,05 -0,04 0,03 0,11 -0,01 -0,03
– lukeminen, tieto 0,02 0,01 -0,02 0,02 -0,03 0 0,03 0,03 -0,05 -0,03 0,02 -0,01
– sarjakuvat -0,02 0,06 -0.09* -0,02 0,06 0,01 -0,03 0,09 0,03 -0,06 0,01 -0,05
– aerobicym -0,05 -0,03 0,02 0,04 0,03 -0,02 0,04 0,06 0 -0,02 -0.02* -0.06*
– popmusiikki -0,03 0 0,03 0 0 0 -0,01 -0,04 0,01 0,06 0,02 -0,04
– klassinen musiikki -0,01 0,02 0 0,02 -0,02 0 0,05 -0,03 -0,04 0 0 0,03
– kuvataide -0,04 0,04 0,01 -0,04 0,01 0,02 -0,02 0,06 -0,03 -0,05 0 0,05
– tietokoneet -0,03 0,02 0,03 -0,01 0 -0,02 -0,04 -0,07 0,05 -0,02 -0,02 0.10*
– käsityöt -0,03 0,06 -0.08* -0,02 0,08 0 -0,01 0 -0.06* 0.08* -0,01 0
– luonto -0,04 0.09* -0,04 0,04 -0.06* 0,02 -0.05** -0,01 0,03 -0,02 -0,01 0,06
– juokseminen 0,01 0,03 0,05 0,01 -0.10*** 0 0,01 0,04 0 0,02 -0,01 -0.05*
– kuntosali 0,04 0,01 0 -0,03 0 -0.03** -0,02 -0,01 0,04 0 -0,02 0,01
– lukeminen, dekkarit -0,01 0,04 0,03 -0.06* 0,02 -0,01 0,03 -0,01 0.06* -0,01 -0,02 -0,05
– musiikin soittaminen 0,02 0,03 -0,03 0 -0,02 0 -0,02 0.28*** -0.09** -0,06 -0,01 -0.09**
– nikkarointi -0,07 0,07 0,02 -0,01 0,01 -0,02 -0.06** -0,04 0,08 -0,01 0.04* -0,01
– tilattava sanomalehti 0.11*** 0,05 -0,03 -0,03 -0,03 -0.07* 0.04** 0.08* 0,02 -0,03 -0.04** -0.06*
– ulkomaisten tiedotusvälineiden seur. 0.09** 0,01 0,04 -0,04 -0.08* -0,02 0,02 0,02 0,02 -0,05 0,01 -0,03
– twitter 0,01 0,01 -0,03 0 0,02 0 0,03 -0,05 0 -0,03 -0.02* 0,06
– youtube -0.08* -0,01 0 0 0,04 0,04 -0,01 0,01 -0.06* 0,04 0 0,02
– radio 0,03 0,05 -0,02 -0,03 0 -0,03 0 -0,04 0,03 -0,04 0,02 0,02
– facebook -0,03 0.08* 0,03 0,02 -0.09** -0,02 0 0,03 0.10*** -0,07 -0,02 -0,04
– ylen verkkosivut -0,04 0,05 0,01 0 -0,06 0,05 0 0,05 -0.07* 0,04 -0,03 0,01
– Sanomalehtien verkkosivut 0.10** 0,01 -0.09* -0,05 0,01 0,02 -0,02 0,04 -0,02 0,02 0,02 -0,04
– Suomi24 -0,09 -0,02 0,04 -0,01 0,05 0,04 -0,01 -0,06 -0,07 0,16 -0,03 0
– Seiska.fi -0,1 -0,04 0,12 -0,05 0,13 -0,06 0,07 -0,07 0,01 -0,08 -0.05** 0,12
– LinkedIn 0.28*** -0.11*** 0,01 -0.06** -0.10*** -0,02 0.26*** 0,04 -0.09** -0.13** -0.01* -0.07*
– iltapaivalehdet -0,03 -0,05 0,03 -0,01 0,05 0,01 -0,03 -0,01 -0,01 0,05 0.04* -0,04
– lisamaksullinen tv 0.08* -0,05 0,01 -0,05 0,05 -0.04** 0,01 0,07 -0,02 0,06 -0,02 -0.10***
– maksuton tv -0,02 -0,02 0,04 0,03 -0,04 0 -0.06* 0,04 0,02 -0,02 0.03* 0
– netti-tv -0.08* 0,01 0,04 -0,02 0,06 -0,01 -0,02 0,02 -0,01 0,01 0,01 -0,01
Vakiotermi 0.13* 0.12** 0.16*** 0.20*** 0.26*** 0.13** 0.09* 0,05 0,06 0.43*** 0,04 0.33***

Näin yhteiskuntaluokat luotiin

HS:n viimekesäisen yhteiskuntaluokkakyselyn tulokset on julkaistu luokkakoneena. Koneella voit testata, mihin yhteiskuntaluokkaan kuulut.

Alkuperäisenä ajatuksena oli sisällyttää kyselyyn hieman kaikenlaisia asioita, joita ihmiset yleensä yhdistävät yhteiskuntaluokkiin, omista ja läheisten ammateista tuloihin, varallisuuteen, koulutukseen ja niin edelleen. Taustalla oli halu tehdä jotain samankaltaista kuin Mike Savage ja Fiona Devine BBC:lle. Itse kyselyn suunnitteluun lähdettiin kuitenkin Esa Mäkisen ja Saska Saarikosken kanssa täysin puhtaalta pöydältä, lattean empiristisesti ad hoc -periaatetta seuraten pikemminkin kuin akateemisesti (tai ehkäpä niin sanottua sateenvarjo/tiskipöytä-lähestymistapaa käyttäen, ks. Luokaton Suomi).

Lopulliseen luokitteluun käytettiin ainoastaan tietoa omasta, mahdollisen puolison, vanhempien ja parhaan ystävän nykyisestä tai viimeisestä ammatista, henkilökohtaisia tuloja, koulutusta, työttömyyttä ja itse ilmoitettua, subjektiivista luokka-asemaa. Ihmiset ilmoittivat itselleen, puolisoilleen, vanhemmilleen ja ystävilleen noin 16000 (!!) erilaista ammattinimikettä, jotka tosin kattavat myös kymmenillä eri tavoilla väärin kirjoitetut samat tittelit (kuten oapettaja, optaja jne). Nimikkeet koodattiin käsityönä ISCO88-ammattiryhmiin ja edelleen Eriksonin-Goldthorpen ammattipohjaisiin yhteiskuntaluokkiin, kuitenkin niin, että ylemmästä professioluokasta erotettiin johtajat omaksi ryhmäkseen (kiitokset tutkimusapulaisille, urakka oli valtava). Tulot jaettiin desiileihin datassa (ne eivät siis olleet oikeita väestön tulodesiileitä), koulutus karkeistettiin kolmeen ryhmään (perus/kansakoulu tai vähemmän, korkeakoulutetut, muut). Lisäksi otettiin huomioon työttömyys. Eläkeläiset ja opiskelijat rajattiin aineistosta pois. Jäljelle jääneistä otettiin 5000 tapauksen otos, jotta analyysit onnistuvat tolkullisissa aikarajoissa ja tilastollisista testeistä olisi jotain erottelevaa iloa. Itse luokittelu tehtiin Stata-ohjelmistolla latent class -analyysia käyttäen, saaden aikaisiksi Hesarissa kuvatut luokat . Sen jälkeen laskettiin ennustetut todennäköisyydet kuulua kuhunkin kuudesta luokasta sekä samoja muuttujia käyttäen että ihmisten harrastusten ja median seuraamisen mukaan.

Tulokset ovat sekä yllättäviä että hauskoja, mutta ovatko ne luotettavia?  Tähän kysymykseen on vaikeampi vastata. Itse luokkia pidän sisällöllisesti luotettavina, joskin kyselyyn vähän vastanneet jakautuvat väestössä luultavasti useampaan ryhmään. Data on kerätty nettikyselynä Helsingin Sanomien verkkosivulla. Se tarkoittaa, että ne joilla ei ole päivisin aikaa tai kiinnostusta surffailla Hesarin verkkosivuilla eivät ole kyselyyn vastanneet. Aliedustettuja  ryhmiä ovat perinteisissä duunariammateissa olevat ja etenkin pienituloiset miehet, vaikka aineisto onkin painotettu iän, koulutuksen ja alueen (pk-seutu vs. muu Suomi) suhteen. Valikoitumisen vuoksi nyt muodostettujen luokkien osuuksia todellisessa väestössä on vaikea määritellä tarkasti. Eläkeläisten ja opiskelijoiden osalta tulokset ovat suuntaa antavia, ensimmäisten kohdalla luultavasti enemmän kohdalleen osuvia viimeisen ammatin perusteella vastattaessa. Lisäksi molempien ryhmien luokka-asemien määrittelemistä helpottavat muut käytetyt tiedot läheisten ammateista, tuloista ja koulutuksesta.

Vastaava harjoitus — tosin ilman tietoa ystävien ammateista — on kuitenkin mahdollista toteuttaa Tilastokeskuksen rekisteriaineistoja hyödyntäen, jolloin tulokset vastaisivat myös todellista Suomen väestöä. Kukahan ehtii ensin?