Väestötietojärjestelmän suomalaisten nimiaineistot

Väestötietojärjestelmästä on poimittu erilliset etunimiä ja sukunimiä koskevat nimiluettelot ja nimien kappalemääräiset esiintymät väestötietojärjestelmässä. Tietosuojasyistä etunimiä, joita on alle 10 kappaletta ja sukunimiä, joita on alle 20 kappaletta, ei esitetä luetteloissa.

Etunimiaineisto on jaettu miesten ja naisten nimiksi sen mukaisesti, miten nimet esiintyvät väestötietojärjestelmässä eri sukupuolta olevilla henkilöillä. Etunimistä on muodostettu erilliset miesten ja naisten nimiä koskevat luettelot, joista ensimmäinen kuvaa kaikkien etunimien esiintymiä, toinen nimen esiintymistä ensimmäisenä etunimenä ja kolmas nimen esiintymistä muuna kuin ensimmäisenä etunimenä.

Sukunimiaineistossa on lueteltu sukunimet esiintymien lukumäärän mukaisessa suuruusjärjestyksessä.

Nimiaineistot on muodostettu suomalaisten voimassaolevien nimien pohjalta, joten niissä on huomioitu väestötietojärjestelmään rekisteröityjen elossa olevien Suomessa tai ulkomailla asuvien Suomen kansalaisten nimistö. Ulkomaiden kansalaisten, kuolleiden henkilöiden nimiä tai henkilöiden entisiä nimiä ei ole huomioitu. Välinimet on laskettu aineistossa etunimiksi, samoin erisnimen sisältävät patronyymit ja matronyymit kuten Matinpoika tai Maijantytär. Sen sijaan patronyymejä, jotka ainoastaan viittaavat toiseen erisnimeen olematta itse erisnimiä kuten ibn, bin, ben ei ole aineistossa lueteltu.

Nimen kirjoitusasusta riippuen mm. nimen vokaalipaino voi olla eri kohdassa. Nämä painotukset ovat näkyvillä aineistossa, jolloin esim. Viren ja Virén esiintyvät aineistossa omina niminään. Myös avioliiton kautta syntyneet yhdistelmänimet, esim. Korhonen-Virtanen, esiintyvät aineistossa tässä yhdistelmämuodossa, mikäli niitä on yli 20 kappaletta.

Nimiaineistot on poimittu syyskuussa 2016.

Nimiaineisto on CSV-tiedostomuodossa. Lisäksi jokaisesta luettelosta on laadittu PDF-muotoinen lyhennelmä, jossa on tuhat yleisintä nimeä.

Aineistolinkit (14)

Liittyvät komponentit (0) Lisää liittyvä komponentti

Tiedätkö sovelluksia, jotka käyttävät tätä tietoaineistoa? Lisää ne kirjautumalla sisään.

Lisätietoja

Laatija
pekkpa
Ylläpitäjä
Pauli Pekkanen
Omistaja
Väestörekisterikeskus
Lisenssi
Creative Commons Nimeä 4.0
Verkko-osoite
None
Sisältötyyppi
Avoin data
Metadata modified
2016-10-17T08:09:22.792454
Isopen
True
Yksityinen
False
Laatijan sähköpostiosoite
pauli.pekkanen@vrk.fi
Revision id
eac5a3db-5c29-458f-9c88-20960fdd740a
Qa
[{'openness_score_reason': Markup(u'This file had not been downloaded at the time of scoring it. URL extension "csv" relates to format "CSV" and receives score: 3.')}, {'updated': Markup(u'2017-03-30T02:44:00.022171')}, {'openness_score': Markup(u'3')}]
Metadata created
2014-10-14T12:00:01.939669
Archiver
[{'status': Markup(u'System error during archival')}, {'is_broken': Markup(u'None')}, {'reason': Markup(u'No value for ckanext-archiver.cache_url_root in config')}, {'status_id': Markup(u'23')}]
Ylläpitäjän sähköpostiosoite
pauli.pekkanen@vrk.fi
Creator user id
631f08fe-41e3-4c1f-99d4-4ee20ce5ba7b
Id
57282ad6-3ab1-48fb-983a-8aba5ff8d29a
Tracking summary
[{'total': Markup(u'3065')}, {'recent': Markup(u'563')}]

Kommentit

Nimiaineiston Power BI -visualisointi

Kiitos tästä aineistosta!

Laadin siitä visualisoinnin ilmaisella Power BI Desktop -välineellä:

https://hexcelligent.fi/2016/11/23/miten-suosittu-etu-tai-sukunimesi-on/

Olisi hienoa, jos aineistosta julkistettaisiin myös versio, missä olisi annettujen etunimien lukumäärät syntymävuosien perusteella.



Kirjaudu sisään kommentoidaksesi
Avoin data
avoin data
Anna palautetta
Aineistolinkin laatu
Metatietojen laatu

Väestötietojärjestelmän suomalaisten nimiaineistot

Seuraajat
0
Viimeiset 30 päivää, päivitetään päivittäin
Sivunäyttöjä kaikkiaan: 66485
Latauksia kaikkiaan: 19161
Viimeksi muokattu: 17.10.2016
Luotu: 14.10.2014

Näytä muutoshistoria >