lauantai 12. marraskuuta 2011

Suomalaisten sähköpostiosoitteiden jättivuoto

Linkki täällä blogissa vilkuilemaani hetudump.txt henkilötietovuototiedostoon ilmestyi alun perin ylilauta.fi sivustolle. Viimeisen viikon aikana kyseisellä sivustolla on väläytelty myös muita tietovuotoja, joista viimeisin on tänään esille tullut suomalaisten sähköpostiosoitteiden lista.

Esimerkiksi Ilta-Sanomat uutisoi tapausta seuraavasti: Jättivuoto: 500000 sähköpostiosoitetta leviää netissä

Tiedosto on nimetty nimellä emaildump.txt, ja sisältää pelkkiä sähköpostiosoitteita. Viestin lähettäjä kuitenkin kirjoittaa: “Jos sähköpostiosoitteesi löytyy tästä listasta suosittelen vaihtamaan salasanoja. Palaan salasanoihin myöhemmin. Ohessa kuitenkin 100 yleisintä salasanaa” ja listaa joukon yleisiltä suomalaisilta salasanoilta näyttäviä merkkijonoja.

Kyseessä voi hyvinkin olla pelkkä lista netistä kerättyjä sähköpostiosoitteita ja listan kerääjällä ei välttämättä ole mitään muuta lisätietoa. Kyseessä on kuitenkin erittäin laaja listaus suomalaisia sähköpostiosoitteita, joten jospa taas viikonlopun ratoksi tehtäisiin pikku Vilkasu.

Kyseinen tiedosto sisältää 495 206 riviä. Jokaisella rivillä on sähköpostiosoite, mutta pikainen tarkastelu paljastaa että sähköpostiosoitteet eivät ole uniikkeja. Uniikkeja sähköpostiosoitteita listalla on 494 858 kappaletta, eli lukumäärissä on 348 sähköpostin ero. Listalla on 3 kpl sähköpostiosoitteita jotka esiintyvät listalla 3 kertaa,  ja loput näistä useaan kertaan listalla olevista sähköpostiosoitteista esiintyvät listalla kaksi kertaa. Se että listalta löytyy joitakin sähköpostiosoitteita useita kertoja, on mielenkiintoinen tieto joka kertoo esimerkiksi siitä että kyseessä ei liene yhden ja saman palvelun sisäänkirjautumiseen käytetyt sähköpostitunnukset.

Silmämääräisellä vilkaisulla kyseessä on todellakin pääosin suomalaisista sähköpostiosoitteista koostuvat listaus, vaikka listalla on myös muunmaalaisia domain-osoitteita. Kaiken kaikkiaan sähköpostiosoitteita on 41 133 uniikista domainista. Seuraava kuvaaja sisältää yleisimmät domainit ja näistä domaineista olevien sähköpostiosoitteiden lukumäärät.
Hotmail on siis selkeästi suurin domain 106 920 sähköpostiosoitteella. Kaiken kaikkiaan lista näyttää sisältävän sähköpostiosoitteita suurin piirtein sellaisella domain-jakaumalla mitä voisikin kuvitella satunnaisotannalla suomalaisista sähköpostiosoitteista.

Yksi harvojen tuntema mutta mielenkiintoinen ominaisuus sähköpostiosoitteissa on että + merkin jälkeen tulevat merkit jätetään osoitteessa huomioimatta (esimerkiksi heikki+tahan-voi-kirjoittaa-mita-vain-eika-sita-huomioida@email.com). Tämän johdosta jotkut ihmiset käyttävät + merkin jälkeen olevia tunnuksia pitämään kirjaa siitä mihin he ovat syöttäneet kyseisen sähköpostiosoitteen. Listalla on 82 sähköpostiosoitetta jotka sisältävät + merkin. Iso osa näistä on vaikeasti tulkittavia, esimerkiksi satunnaisilta näyttäviä numero- tai kirjainsarjoja, mutta osa saattanee osoittaa palvelua mihin kyseinen sähköpostiosoite on luovutettu. Tällaisia ovat esimerkiksi: ”kalorilaskuri.fi”, ”runot”, ”ravintolaskuri”, ” bluesfanclub” ja ”rahalaskuri”.

Yhteenvetona: Listalla on 494 858 suomalaisilta sähköpostiosoitteilta näyttävää sähköpostiosoitetta. Osoitteet ovat useista eri domaineista, eikä niiden jakauman perusteella ole selkeästi nähtävissä viitteitä että sähköpostiosoitteet olisi kerätty painottaen joitakin tiettyjä domaineja. Plus-merkin jälkeen tulevat tiedot voivat antaa pieniä lisävinkkejä palveluista mihin osa listalla olevista sähköpostiosoitteista on alun perin syötetty.

4 kommenttia:

  1. Se oli Anonymous Finland

    VastaaPoista
  2. Plus-merkin jälkeisen datan "hukkaaminen" ei ole sähköpostiosoitteiden ominaisuus, mutta joidenkin yleisesti käytettyjen postipalvelinten ominaisuus.

    VastaaPoista
  3. Kuvassa näkyvää artic.net -sähköpostipalvelua ei ole ollut varmaan olemassa kymmeneen vuoteen. Lisäksi listalta löytyi oma osoitteeni jota en ole käytännössä käyttänyt moneen vuoteen.

    VastaaPoista
  4. Listalla on vanha työosoitteeni. Pieraistu kenties netistä jollain hakurobolla. Kyseistä sähköpostiosoitetta ei ole ollut olemassa sitten vuoden 2005.

    Ei voisi vähempää kiinnostaa mitä ne finninaamaset pojat leikkii koneillaan. Eivät vissii osaa muuta kuin hiukan sql injektionia sinne tänne ja LOIC:illa ddossia.

    VastaaPoista