maanantai 7. marraskuuta 2011

1.1. syntyneiden yliedustus aineistossa

Blogin kommenteissa ja muualla netissä on spekuloitu että henkilötunnuksissa olisi erityisen paljon 1.1. syntyneitä, ja että nämä olisivat pääosin maahanmuuttajia ja/tai väärennettyä henkilötunnuksia. Tutkiakseni näitä väitteitä, päätin tarkastella syntymäaikojen jakaumia.

Muistutuksena, tarkistin jo aikaisemmin että kaikki henkilötunnukset olivat muodoltaan oikeallisia (tarkistusmerkki täsmäsi, päivämäärät olivat oikeassa muodossa päivämääriä jne.).

Tarkasteltaessa päivämääriä (päivä + kuukausi) on selkeää että 1.1. on syntymäpäivänä yliedustettu (89 kpl). Muilta osin päivämäärien jakauma on aikalailla sitä mitä odotinkin (n. 30-60 kpl per päivä, keskimäärin 44 kpl/päivä), harvinaisin syntymäpäivä on 29.2. (12 kpl).
Kuukausikohtainen tarkastelu vahvistaa epäilyä että kyseessä olisi suhteellisen normaali otanta suomalaisten syntymäajoista. Jos esimerkiksi Juhannuksen ajankohta on päässyt unohtumaan, on se helpohkoa laskeskella maaliskuun syntyvyyspiikistä.
Päiväkohtainen tarkastelu on myös suurin piirtein sitä mitä olisi syytä odottaa. 1. päivä on selkeästi yliedustettu, ja muuten jakauma on suht’ tasaista, 29.-31. päivä ovat odotetusti harvinaisempia syntymäpäiviä.
Miltä nuo 1.1. syntyneiden sukunimet sitten näyttävät? Suuri osa näistä sukunimistä on helpohko liittää maahanmuuttoon/maahanmuuttajiin. Esimerkkeinä:

Abad
Abdirahman
Abrahimi
Ahmad
Ahmed Hussein
Al-Salman
Al-zirgawi
Ali
Amini
Aydin
Aziz
Hakkarainen
Halme
Hassan
Hassan Mohamed
Hussein
Ibrahim
Ismail
Mahamed
Yusuf Hassan

Listalta löytyy kuitenkin myös ihan perinteisiä suomalaisia nimiä Virtasesta lähtien. Ulkomaalaisten määrä 1.1. syntyneiden joukossa selittyykin sillä, että maahanmuuttajat joiden tarkka syntymäpäivä ei ole tiedossa, merkitään yleensä syntyneiksi 1.1. Mm. YLE on uutisoinut aiheesta seuraavasti: Maistraatti joutuu keksimään syntymäpäiviä

Jutussa mainitaan myös että ko. hetujen loppumisen vuoksi syntymäpäiviä oltaisiin myös alettu merkkaamaan tammikuun toiselle päivälle, mutta ainakaan tässä tietovuotoaineistossa kyseinen päivämäärä ei mitenkään erityisesti pomppaa silmille.

Vaikka tuo 1.1. onkin yliedustettu syntymäpäivä, on syytä muistaa että kyseisenä päivänä syntyneitä aineistossa on 89 kpl (n. 0.6%) , kun keskimääräisenä päivämäärä syntyneitä on 44 kpl (ja suosittuina päivämäärinä luku on n. 60 luokkaa). Näin ollen noita maahanmuuttajille myönnettyjä päivämääriä näistä lienee todennäköisesti muutamakymmentä. 

Kyseisessä aineistossa ei siis mielestäni ole mitenkään erityisen paljon henkilöitä joille olisi tarkan syntymäpäivän puuttumisen vuoksi myönnetty 0101-alkuinen hetu. Vastannee aika hyvin satunnaisotantaa suomalaisista henkilötunnuksista.

Ei kommentteja:

Lähetä kommentti