Kysely: miten JUFO-luokitus PITÄISI tehdä?

Ehdotin blogissani, että nykyisen asiantuntijapaneelin sijaan lehdet JUFO-luokituksen tasoille pitäisi valita äänestämällä. Keskustelussa on tullut esiin myös muita vaihtoehtoja. Miten mielestäsi lehtijaottelu olisi parasta tehdä? Kyselyä saa jakaa!

Vastaa kyselyyn täällä: http://goo.gl/forms/feQyjSvXhZ

Kyselyn tulos päivittyy alla olevaan kuvaan.

Nettikyselyjen raportointi

Toimittaja Björn Udd haastatteli minua kesällä nettikyselyistä HBL:iin. Björniä kiinnosti näkemykseni nettikyselyiden luotettavuudesta ja raportointistandardeista. Vastauksessani Björnille tuli esiin asioita, joita sosiaalitieteilijöiden olisi syytä pohtia yleisemminkin.

Paras puoli kaikille vastaajille avoimissa nettikyselyissä on, että niillä voidaan kerätä nopeasti ja halvalla paljon aineistoa. Huono puoli on se, että nettikyselyt ovat yleensä valikoituneita näytteitä verkonkäyttäjistä, eivätkä otoksia väestöstä tai sen osasta. Periaatteessa verkkoaineistot voidaan painottaa vastaamaan väestöä. Valikoituminen kaikille avoimiin verkkokyselyihin on tällä hetkellä kuitenkin niin suurta, että painottamien perinteisin tavoin on vaikeaa tai jopa käytännössä mahdotonta.

Esimerkiksi HS-luokkakoneaineisto painotettiin usean tekijän suhteen, mutta on edelleen esimerkiksi ammatilliselta rakenteeltaan vinoutunut suhteessa todelliseen väestöön. Syyt tähän ovat ilmeisiä — verkkokyselyitä täytellään ruokatunneilla, kahvitauoilla ja työn ohessa taikka sitten vapaa-ajalla etenkin päivisin. Monilla työpaikoilla vastaaminen ei ole yksinkertaisesti mahdollista eikä vapaa-aikaa päivisin ole (iltaisin puuhataan muuta). Eli väestöön tai sen osaan yleistämisen suhteen pitäisi tällaisten aineistojen kohdalla olla todella varovainen.

Sen sijaan näillä datoilla on helppoa ja kustannustehokasta testata uusia ideoita. Tämä oli ajatuksena myös luokkakoneessa — pystyttiin kokeilemaan, millaiset luokkaan usein liittyvä tekijät ovat niin usein yhteydessä toistensa kanssa, että niiden pohjalta voidaan erottaa jonkinlaisia identifioitavissa olevia latentteja luokkia. Voidaan siis olettaa että tutkittava ilmiöt ovat verkkoaineistossa samankaltaisessa yhteydessä toisiinsa kuin vastaavaa tietoa keräävissä edustavissa aineistoissa.

Aineiston valikoituminen kuitenkin tarkoittaa sitä, että uusia ideoita ja havaintoja ei pitäisi ollenkaan raportoida tuloksia yksinkertaisina jakaumina (“xx % suomalaisista kuuluu eliittiin” tai “xx% eläkeläisistä suunnittelee ulkomaanmatkaa”) ellei olla ihan varmoja siitä, että data vastaa todellista väestöä. Tyypillisten valikoitumiseen vaikuttavien tekijöiden ryhmien sisällä tämä on mielestäni hiukkasen turvallisempaa (esim. “Pääkaupunkiseudulla asuvista korkeakoulutetuista eläkeläisistä, joiden tulot ovat xxx-yyy euroa, zz % suunnittelee ensi vuonna ulkomaanmatkaa” ja näiden vertaaminen johonkin toiseen ryhmään).

Vastaavia ongelmia liittyy isojenkin tutkimusfirmojen quota-otoksiin. Vastaamatta tai tavoittamatta jääneistä ei niissä ole yleensä mitään tietoa — siksi että vetää näiden kyselyiden uskottavuudelta pohjan pois. Maininta 2 % virhemarginaalista ei korvaa kadon raportointia — varsinkin kun virheen määrä on oikeasti ryhmästä toiseen erilainen.

Yksi korrekti tapa raportoida nettikyselyitä voisi olla, että mainitaan lukijoille, että aineisto valikoitunut näyte nettilukijoista, ei väestöä tai sen tiettyä osaa edustava otos.

Summa summarum, nettiaineistojen etuja ovat:
– ovat mielenkiintoisia ja ennen kaikkea halpoja
– voivat antaa vinkkejä jostain uudesta
– voivat antaa tietoa ilmiöiden välisistä suhteista

Niiden heikkoutena on:
– eivät yleensä ole yleistettävissä niin että voitaisiin sanoa jotain tarkkaa yleisyydestä väestössä

Keskiluokka ei voi kadota

Tämän päivän Hesarissa kirjoitetaan keskiluokkaisten ammattien katoamisesta, ks. http://www.hs.fi/talous/Keskiluokan+ty%C3%B6paikat+katoavat+biteiksi/a1390767423539

Juttuun sisältyy yksi perustavanlaatuinen logiikkavirhe: keskiluokka, sellaisena kuin se jutussa ymmärretään, ei voi määritelmänsä mukaan kadota.

Jutussa lähdetään etenkin taloustieteissä usein seuratusta ajatuksesta, että keskiluokkaa ovat keskituloisissa ammateissa olevat. Keskiluokaksi määritellään tällöin yleensä tulojakauman keskiosaan kuuluvat vaihtelevin kriteerein; esimerkiksi keskimmäisiä tulodesiilejä tai +/- 60 % mediaanituloista ansaitsevat ammatit. Sitä, mitä tällä tarkkaan ottaen nyt tarkoitetaan, ei ainakaan nettiversiossa paljasteta.

Oletetaan ensin mainittuun tapaan, että keskiluokkaa ovat esim. 60 % niistä ammateista, jotka ovat lähimpänä työssäkäyvien keski- tai mediaanituloa. Ne ammatit, jotka aiemmin kuuluivat tuohon keskiryhmään, olisivat jutun perusteella siis katoamassa. Tästä kuitenkin seuraa, että kun keskiluokkana ymmärretään jollakin tapaa fiksattuna osana tulojakaumasta, keskiluokkaan joko  a) tulee uusia ammatteja tai b) sinne jäävien ammattien osuus työssä olevista kasvaa.  Keskiluokka ei tällöin voi kadota, vaan keskiluokkaan kuuluvat ammatit muuttuvat.

Jos keskiluokka määritellään ammattiryhmäkohtaisten tulojen suhteena mediaanituloihin (esim. edellä mainittu +/- 60%), keskiluokkaan kuuluvien osuus voi myös pienentyä. Käytännössä kyse on kuitenkin silloin tulonjaon muutoksesta, joka voi tapahtua monilla, eriarvoisuuden kannalta jopa päin vastaisilla tavoilla. Keskiluokan koko voi vaihtua niin pieni- kuin suurituloisten osuuden kasvusta johtuen tai myös molempien osuuden kasvaessa. Tällöinkään keskiluokka ei voi silti kadota, koska mediaanituloisiin kuuluu väkisinkin jokin tietty ryhmä.

Keskiluokan katoamisen sijaan havainto viittaa oikeastaan yksinkertaisesti tulojakauman venymiseen. Yhteiskunnallisen eriarvoisuuden kannalta olisi olennaista tietää, mistä tämä johtuu: siitä, että osa keskiluokasta suhteellisesti köyhtyy, osa rikastuu tai että tapahtuu niin köyhtymistä kuin rikastumista. Mutta tätä voi tarkastella paljon suoremmin tulonjakotilaston avulla tekemättä kierrosta ammattien kautta. Seuraavia tuloksia tulojakotilastosta odotellaan maaliskuussa.