lauantai 12. marraskuuta 2011

Ovatko aikaisemman henkilötietovuodon sähköpostit osa uutta vuotoa?

Minulle esitettiin yksi mahdollisesti mielenkiintoinen kysymys liittyen näihin kahteen tietovuotoon. Eli, ovatko kaikki hetudump.txt:ssä olevat sähköpostit liitetty osaksi emaildump.txt:ssä olevia sähköpostiosoitteita?

Kaiken kaikkiaan hetudump.txt sisältää 16 102 henkitunnusta ja näihin liitettyä tietoa. Kuitenkin näistä ainoastaan 10 589:n on liitetty sähköpostiosoite. Näistä 10 589 sähköpostiosoitteesta lähestulkoon kaikki löytyvät uudesta emaildump.txt tiedostosta. Eroa on ainoastaan 172 osoitteen verran. Pikaisella vilkaisulla näiden 172 sähköpostiosoitteen kesken ei löydy mitään yhteistä ilmiselvää nimittäjää minkä takia juuri ne olisi jätetty listasta pois.

On mielenkiintoista miten huomattava osa hetudump.txt:n sähköpostiosoitteista löytyy tältä uudelta listalta, mutta että sisällöissä on kuitenkin pienen pieni ero.

Alla vielä Venn-kuvaaja joka sähköpostien osalta hahmottaa tietovuotojen kokojen suhdetta toisiinsa. Kuvaajan numerot kertovat kuinka monta yhteistä sähköpostiosoitetta listoilla on (10 417), sekä kuinka monta toiselta listalta löytymätöntä (484 441 vs. 172).
Blogini kommenteissa muuten mainittiin että listalla on paljon todella vanhoja sähköpostiosoitteita "Kuvassa näkyvää artic.net -sähköpostipalvelua ei ole ollut varmaan olemassa kymmeneen vuoteen. Lisäksi listalta löytyi oma osoitteeni jota en ole käytännössä käyttänyt moneen vuoteen.". Listalla on kuitenkin jälleen kerran Itä-Suomen yliopiston sähköpostiosoitteita (tällä kertaa ei siis kuitenkaan mitenkään selkeästi yliedustettuna), joita on annettu vasta vuodesta 2010 lähtien. Nämä tiedot auttavat osaltaan ajoittamaan sähköpostitietojen ikää, mikä näyttäisi olevan hyvin laaja.

Monet tahot ovat myös havainneet että listalla on paljon esimerkiksi "toimisto", "kirjaamo" jne. tyyppisiä sähköpostiosoitteita, ja tämä vahvistaisi oletusta että kyseessä on ainoastaan netistä kerätty sähköpostilista, eikä mitään salasanoja tai muita tietoja olisi olemassa.

Päivitys: Noiden 172 sähköpostin tarkastelu käsipelillä antaa osviittaa siitä että iso osa niistä on virheellisiä tai väärinkirjoitettuja. Esimerksi niin että pisteiden sijasta on vahingossa käytetty pilkkua, mukaan on livahtanut välilyöntejä tai domainin nimestä on unohtunut pääte pois (kyseiset hetudump.txt:n sähköpostit sisältävät muutenkin paljon syöttövirheitä). Uuden emaildump.txt tiedoston sähköpostit taas näyttävät pääosin oikeellisilta sähköposteilta, eikä niistä esimerkiksi löydy osoitteita joissa olisi käytetty pilkkua tai välilyöntiä. Tämä osaltaan vahvistaa teoriaa jonka mukaan kyseiset uudet sähköpostiosoitteet on jossain vaiheessa validoitu oikeamuotoisiksi sähköposteiksi (esimerkiksi siinä vaiheessa kun ne on syötetty johonkin järjestelmään tai kun ne on automaattisesti kerätty netistä).

1 kommentti:

  1. How to get to the casinos in Las Vegas by bus, taxi, biking, walking
    Las Vegas Hotel Casino and Sports Book · Make a 오즈 포탈 minimum of $10 동인지 사이트 minimum in hotel room · 토토 웹 Enter your desired date 외국 라이브 of birth · Select 포커 the date of birth · Select your date

    VastaaPoista