Edellisen blogitukseni kommenteissa esitettiin arvio että ulkomaalaisperäiset nimet olisivat henkilötietovuotolistalla yliedustettuina.
Mietin miten tuota ulkomaalaisperäisten nimien määrää voisi tutkia ja se on hankalaa. Lähinnä tulee mieleen kaksi eri tapaa:
1) Käydä jokainen nimi läpi ja merkata käsin ylös onko kyseessä ulkomaalaisperäinen vai suomalainen nimi (tai jos jostain löytyisi kattava lista ns. suomalaisista nimistä, tämän voisi automatisoida). Sen jälkeen noita lukumääriä voisi verrata Suomessa asuvien kantasuomalaisten ja ulkomaalaista alkuperää olevien suomalaisten lukumääriin. Käytännössä tämä lähestymistapa on työläs ja en ole varma onko kyseisenlaisia tilastoja edes saatavilla.
Mietin miten tuota ulkomaalaisperäisten nimien määrää voisi tutkia ja se on hankalaa. Lähinnä tulee mieleen kaksi eri tapaa:
1) Käydä jokainen nimi läpi ja merkata käsin ylös onko kyseessä ulkomaalaisperäinen vai suomalainen nimi (tai jos jostain löytyisi kattava lista ns. suomalaisista nimistä, tämän voisi automatisoida). Sen jälkeen noita lukumääriä voisi verrata Suomessa asuvien kantasuomalaisten ja ulkomaalaista alkuperää olevien suomalaisten lukumääriin. Käytännössä tämä lähestymistapa on työläs ja en ole varma onko kyseisenlaisia tilastoja edes saatavilla.
tai sitten
2) Otetaan lista sukunimien esiintyvyydestä Suomessa, ja verrataan aineistoa siihen. Tuloksena saadaan lista yli- ja aliedustetuista nimistä (jos sellaisia on). Tämän jälkeen katsotaan sitten käsipelillä ovatko kyseiset nimet esimerkiksi ulkomaalaisperäisiä tai löytyykö niille muuta selitystä (esimerkiksi onko joku suku yliedustettuna). Valitettavasti väestörekisterikeskus ei näytä tarjoavan listaa muuta kuin top10 yleisimmistä suomalaisista sukunimistä, joten tätäkään ei pysty toteuttamaan.
Toisaalta jos joku tietää mistä näitä taustatietoja saisi, voisin tehdä kyseisenlaiset analyysit.
Pikainen silmämääräinen tarkastelu kuitenkin antaa osviittaa että kyseinen nimijoukko on hyvin suomalainen. Se vastaa aika tarkasti yleisempien suomalaisten sukunimien top10 listaa (jos otetaan huomioon että tutkittavassa aineistossa on 2/3 yliedustus miehiä).
2) Otetaan lista sukunimien esiintyvyydestä Suomessa, ja verrataan aineistoa siihen. Tuloksena saadaan lista yli- ja aliedustetuista nimistä (jos sellaisia on). Tämän jälkeen katsotaan sitten käsipelillä ovatko kyseiset nimet esimerkiksi ulkomaalaisperäisiä tai löytyykö niille muuta selitystä (esimerkiksi onko joku suku yliedustettuna). Valitettavasti väestörekisterikeskus ei näytä tarjoavan listaa muuta kuin top10 yleisimmistä suomalaisista sukunimistä, joten tätäkään ei pysty toteuttamaan.
Toisaalta jos joku tietää mistä näitä taustatietoja saisi, voisin tehdä kyseisenlaiset analyysit.
Pikainen silmämääräinen tarkastelu kuitenkin antaa osviittaa että kyseinen nimijoukko on hyvin suomalainen. Se vastaa aika tarkasti yleisempien suomalaisten sukunimien top10 listaa (jos otetaan huomioon että tutkittavassa aineistossa on 2/3 yliedustus miehiä).
Väestörekisterikeskuksen mukaiset yleisimmät sukunimet Top10
1. Korhonen
2. Virtanen
3. Nieminen
4. Mäkinen
5. Mäkelä
6. Hämäläinen
7. Laine
8. Koskinen
9. Heikkinen
10. Järvinen
2. Virtanen
3. Nieminen
4. Mäkinen
5. Mäkelä
6. Hämäläinen
7. Laine
8. Koskinen
9. Heikkinen
10. Järvinen
Henkilötietovuotolistan yleisimmät sukunimet Top20.
Sukunimi | Lukumäärä |
Virtanen | 90 |
Korhonen | 72 |
Järvinen | 57 |
Mäkinen | 57 |
Nieminen | 57 |
Hämäläinen | 49 |
Salminen | 49 |
Laine | 48 |
Salonen | 48 |
Heikkilä | 47 |
Koskinen | 47 |
Lehtonen | 46 |
Kinnunen | 45 |
Heikkinen | 44 |
Mäkelä | 44 |
Jokinen | 41 |
Mattila | 41 |
Saarinen | 41 |
Savolainen | 40 |
Turunen | 39 |
Yhteenvetona: Silmämääräisen tarkastelun pohjalta listan sukunimet vastaavat yleisimpien suomalaisten sukunimien jakaumaa ja omien vilkuilujeni pohjalta en ole havainnut ulkomaalaisperäisten nimien yliedustusta. Tarkempi tilastollinen tarkastelu vaatisi kuitenkin tausta-aineistoja joita en ole pystynyt löytämään.
En ole listaan tutustunut, mutta erään nettikommentin perusteella ison osan ulkomaalaisia listasta löytää generoidun sotun avulla, joka on näillä henkilöillä ensimmäinen tammikuuta tai ensimmäinen kesäkuuta. Kyseessä henkilöt, joilla ei ole ollut syystä tai toisesta papereita Suomeen tullessaan tai tarkkaa syntymäpäivää ei tiedetä.
VastaaPoista