sunnuntai 6. marraskuuta 2011

Useamman listan teoria - Ikäjakaumat kunnittain

Julkisuuteen on tullut tietoja joiden perusteella voi olettaa että kyseinen tietovuotoaineisto on koostettu useammasta eri lähteestä. Myös blogini kommenteissa mainittiin tämä vaihtoehto ja ehdotettiin että asiaa voisi olla mahdollista tutkia tarkastelemalla paikkakuntatietoja ja ikäjakaumaa yhdessä. Ideana olisi siis tutkia onko listalla esimerkiksi tietystä kunnasta pääasiassa vanhoja henkilöitä.

Asian tutkimisessa on muutama mutka matkassa, ensinnäkin tietovuotolistan osoitetiedot ovat puutteellisia. Toisekseen esimerkiksi jaottelu kuntiin postinumeron perusteella ei vastaa täysin todellisia maantieteellisiä etäisyyksiä (esimerkkinä vaikka pääkaupunkiseutu). Samoin yksityiskohtainen tarkastelu vaatisi ottamaan huomioon myös kunnan ikärakenteen (jos kunnassa asuu pääasiassa vanhuksia, ei liene mikään yllätys jos listalta löytyy tuon kunnan kohdalla pääasiassa vanhuksia).

Nämä heikkoudet huomioon ottaen, alla on muutamia visualisointeja aineiston kunta-/ikärakenteesta. Olen ottanut tarkasteluun parhaiten aineistossa edustetut kunnat (top20). Tämä siitä syystä että aineistoa on niin paljon että visualisoinneista on vaikeaa ottaa selvää tälläkin kuntamäärällä, ja toisaalta suurimmat kunnat lienevät päämielenkiinnon kohteena ja niistä on riittävä otos että tarkastelu on mielekästä.

Ensimmäinen kuvaaja läväyttää päällekkäin top20 kuntien jakaumat. Yleisilme on sekava, mutta tarkastelusta käy ilmi että osalla kunnista on hyvin korkea huippu n. 20 vuoden kohdalla. Osalla kunnista taas jakauma on huomattavasti tasaisempi (nousee jyrkästi, pysyy tasaisena, laskee jyrkästi).
Kuntakohtaisten histogrammien tarkastelu paljastaa että nämä tasaisemmin jakautuneet kunnat näyttäisivät kuuluvan pääkaupunkiseutuun (Espoo, Helsinki, Vantaa), kun taas muualta päin suomea on havaittavissa korkea piikki erityisissä nuorissa henkilöissä (esim. Tampere, Turku, Pori, Jyväskylä, Kuopio jne.)

Kunnittaisena laatikkovisualisaationa jossa kunnat on järjestetty keski-iän mukaan, sama ilmiö on osittain havaittavissa. Pääkaupunkiseudun keski-ikä on selkeästi korkeampi kuin esim. Tampereella, Jyväskylässä, Turussa, Oulussa ja Kuopiossa. Mutta on myös tärkeää katsoa ikien jakaumaa ja huomata että Helsingistä jossa keski-ikä on korkea, löytyy myös aineistoin nuorimmat henkilöt.  Samoin Tampereelta jossa keski-ikä on matalin, löytyy aineiston vanhimmat henkilöt. Aineisto ei siis ole rajattu niin että jostain kunnasta olisi ainoastaan tietyn ikäisiä henkilöitä.
Tämän vertailun perusteella on hankalaa sanoa miten hyvin kuntakohtainen ikävertailu kertoo juuri aineistosta, eikä esim. Suomen väestörakenteesta. Aineistossa on kuitenkin tiettyjä viitteitä joiden perusteella voisi ajatella että aineisto käsittää pääkaupunkiseudulta kaikenikäisiä ihmisiä, mutta muualla Suomessa painottuu nuoriin.

Ei kommentteja:

Lähetä kommentti