Selvitä rajoitteet ja riskit

Rajoitteiden ja riskien määrittely auttaa sinua selvittämään, mitkä organisaatiosi tietovarannoista on ylipäätään mahdollista avata. Erityisesti datan avaamista ohjaavat laki viranomaisen toiminnan julkisuudesta (621/1999) eli julkisuuslaki ja henkilötietojen tietosuojaa käsittelevä tietosuojalaki (1050/2018). Julkisuuslaki velvoittaa tietyissä tapauksissa datan avaamiseen, kun taas tietosuojalaki suojaa henkilötietoja. Tietosuojalain nojalla henkilötiedot pitää pääsääntöisesti poistaa tai häivyttää avattavista tietoaineistoista. On myös tärkeää huomata, että julkinen tieto (esimerkiksi paperiset lomakkeet) ei ole sama asia kuin avoin data.

Avoin hallinto Suomessa

Avoimen hallinnon ryhmä on määritellyt avointa hallintoa Suomessa seuraavasti:

Suomella on kolme erityistä vahvuutta hallinnon avoimuudessa:

  • Avoimuus on suomalaisen julkisen hallinnon perusarvo
  • Hallinnon avoimuus on vahvasti suomalaisessa lainsäädännössä 
  • Suomessa on jatkuvan kehittämisen periaate

Lainsäädännön osalta avoimuuden ja osallistumisen rakenteita ovat tukeneet etenkin uudistettu perustuslaki (731/1999), julkisuuslaki, hallintolaki (434/2003) ja kuntalaki (410/2015).

Perustuslain toisessa pykälässä painotetaan kansalaisten osallistumista: ”kansanvaltaan sisältyy yksilön oikeus osallistua ja vaikuttaa yhteiskunnan ja elinympäristönsä kehittämiseen”.

Julkisuuslaki avaa kansalaisille ja medialle tiedonsaantioikeuden viranomaisten asiakirjoihin. Ne on pääsääntöisesti määritelty julkisiksi, mikäli erityiset perusteet eivät puolla niiden määrittelyä salassa pidettäväksi. Lisäksi laissa on määritelty viranomaisille velvollisuus tiedottaa aktiivisesti mm. toiminnastaan ja palveluistaan.

Hallintolaki korostaa kansalaisten oikeuksia saada tietoa viranomaisilta ja lausua mielipiteensä asioista, joilla voi olla huomattavia vaikutuksia. Hallintolain tarkoituksen määrittelyssä korostettiin avoimuutta ja hyvää tiedonhallintatapaa viranomaisten toiminnassa, mutta myös kansalaisten mahdollisuuksia vaikuttaa julkisen vallan käyttöön sekä valvoa oikeuksiaan, etujaan ja julkisten varojen käyttöä.

Kuntalaki velvoittaa kuntia pitämään huolta siitä, että kuntalaisilla on edellytykset osallistua ja vaikuttaa kunnan toimintaan.

Lisäksi erityislainsäädännössä eri osa-alueilla on velvoitteita avoimuuteen ja osallisuuteen, esimerkiksi nuorisolaissa (1285/2016).

Lue lisää avoimesta hallinnosta Suomessa Valtiovarainministeriön Politiikkakatsauksesta (PDF).

Lainsäädännön rajoitteet ja velvoitteet

Kartoita datan avaamiseen liittyvät lainsäädännön rajoitteet ja velvoitteet organisaatiosi juristin tai muun lakia tuntevan henkilön kanssa. Tämä opas auttaa sinut alkuun kuvaamalla datan avaamiseen erityisesti vaikuttavat lait ja säädökset, mutta huomioi myös esimerkiksi omaa alaasi koskeva lainsäädäntö. Julkaisua saattavat rajoittaa yllättävätkin lait ja tilanteet, jotka eivät asiaan vähemmän perehtyneelle välttämättä tule mieleen. Avoimuutta rajoittavia syitä ovat esimerkiksi henkilötietojen suojaaminen, liikesalaisuuksien paljastumisen ehkäisy, aineistoon kohdistuvat kolmannen osapuolen tekijänoikeudet ja kansallinen turvallisuus.

Ennen kuin data julkaistaan, on varmistettava, etteivät tekijänoikeudet rajoita aineiston luovuttamista ja että aineisto ei sisällä salassa pidettävää tietoa. Tämän vuoksi onkin tärkeää suunnitella datan avaaminen huolellisesti, jotta ikäviltä yllätyksiltä ja jopa mahdollisilta sanktioilta vältytään datan avaamisen jälkeen.

Julkisuuslaki

Julkisuuslaki lähtee siitä periaatteesta, että kaikki julkisen hallinnon tuottama tieto on julkista, ellei lainsäädännössä ole erikseen mainittu perustetta sen salaamiseen. Julkisuuslaki siis velvoittaa usein datan avaamiseen. Tämä tulee myös huomioida datan avaamisessa, sillä luonnollisestikin lain määräämiä avauksia kannattaa priorisoida.

Julkishallinnon tuottama tieto on lähtökohtaisesti julkista, joten sen pitää olla kaikkien kansalaisten saatavilla, ellei sen salassapidolle ole laissa määriteltyä pätevää syytä. Julkisuuslaissa tai muussa laissa säädetään, millainen tieto on salassa pidettävää. Salassa pidettävää tietoa ovat esimerkiksi kansallisen turvallisuuden vaarantavat tiedot ja liikesalaisuudet. Myös sellaiset uhanalaisia kasvi- tai eläinlajeja koskevat tiedot, jotka vaarantavat kyseisen lajin, ovat salassa pidettäviä.

Selvitä, onko organisaatiosi dataa mahdollista muokata siten, että sen salassapidon edellytykset poistuvat laadun kuitenkaan kärsimättä.

Esimerkki: Syvyyspistetiedot

Merenmittauksen tuloksena saatavat tarkat syvyyspistetiedot voivat olla maan turvallisuuden kannalta arkaluontoista materiaalia ja sellaisenaan salassa pidettäviä. Kun aineistoa harvennetaan riittävästi, saadaan tuloksena syvyyspistejoukko, jota voidaan hyödyntää siviilikäytössä vesillä liikuttaessa.

Esimerkki: Koronavirukseen sairastuneet

Yksittäiset tiedot COVID-19-tartunnan saaneista potilaista ovat henkilötietolain mukaan henkilötietojen tietosuojaa nauttivaa tietoa, eli niitä ei voi julkaista sellaisenaan. Erilaiset koosteet näistä tiedoista, joista yksittäistä ihmistä ei voi tunnistaa, voivat kuitenkin olla avointa dataa ja julkista tietoa.

Esimerkki: Äänestystiedot

Yksittäisen ihmisen äänestämistä suojaa vaalisalaisuus, mutta tilastoja siitä, miten suomalaiset tai vaikkapa helsinkiläiset äänestävät voi julkaista avoimena datana. Näin oikeusministeriö vaalien yhteydessä tekeekin.

Direktiivi (EU) 2019/1024 avoimesta datasta ja julkisen sektorin hallussa olevien tietojen uudelleenkäytöstä

Uudelleenlaaditun PSI-direktiivin toimeenpano saattaa tulevaisuudessa vaikuttaa datan avaamiseen. Direktiivi hyväksyttiin kesäkuussa 2019, ja se tulee toimeenpanna kansallisessa lainsäädännössä vuoden 2021 kesään mennessä. Sen mukaan julkisen datan pitää olla EU:n kansalaisten ja yritysten saatavilla ja hyödynnettävissä eli avoimesti lisensoitua. Direktiivi koskee julkisen sektorin lisäksi osittain julkisesti omistettuja yrityksiä sekä liikennealan toimijoita. Myös julkisesti rahoitettu tutkimustieto luetaan direktiivissä julkiseksi dataksi, joten sekin pitää direktiivin mukaan avata.

Direktiivissä säädetään minimivaatimukset avoimelle datalle, ja se edistää reaaliaikaisen datan ja rajapintojen käyttöä sekä korkean lisäarvon datan, kuten sää- ja yritystietojen, avaamista EU:n laajuisesti. Direktiivi pienentää myös datan hankinnan palvelumaksuja.  Direktiivi ei vaikuta henkilötietojen suojaan, josta säädetään EU:n tietosuoja-asetuksessa, sillä se on direktiiviin nähden ensisijainen.

Lue tiivistelmä uudesta direktiivistä.
Lue koko direktiivi (PDF-tiedosto).

Tietosuojalaki

Henkilötietojen käsittelyn perusperiaatteet on sovittu yhteisesti Euroopan unionin alueella. Suomessa henkilötietojen käsittelystä säädetään tietosuojalaissa, joka täydentää EU:n yleistä tietosuoja-asetusta (GDPR). Henkilötiedoilla tarkoitetaan kaikkia sellaisia tietoja, jotka liittyvät tunnistettuun tai tunnistettavissa olevaan henkilöön. Henkilötietoja ovat sellaiset tiedot, joiden perusteella henkilö voidaan tunnistaa joko suoraan tai välillisesti, esimerkiksi yhdistämällä yksittäinen tieto johonkin toiseen tietoon, joka mahdollistaa tunnistamisen. Henkilötietoja ovat esimerkiksi nimi, puhelinnumero ja henkilötunnus. Henkilötiedoiksi voidaan lukea myös sellaiset tiedot, jotka eivät yksinään riitä henkilön tunnistamiseen, mutta voivat sopivasti yhdistettynä mahdollistaa sen, kuten sukupuoli tai ikä.

Vaikka datasi sisältää henkilötiedoiksi luettavia tietoja, se ei välttämättä tarkoita, että sitä ei voi avata. Osa henkilötiedoista voi olla julkista tietoa, kuten vaaliehdokkaiden nimet tai osa kansanedustajien taustatiedoista, ja ne voi siten julkaista avoimena datana. Lisäksi monet henkilötietoja sisältävät tietoaineistot voidaan julkaista, kunhan data anonymisoidaan.

Datan anonymisoinnilla tarkoitetaan tietojen muuttamista siten, että yksittäinen henkilö ei ole enää tunnistettavissa datasta. Datan huolellisella läpikäymisellä ja anonymisoinnilla pidät huolen siitä, että dataa voidaan hyödyntää parhaalla mahdollisella tavalla vaarantamatta kenenkään henkilötietoja.

Henkilötietojen palauttaminen

 On hyvä huomata, että niin kauan kuin tietojen perusteella voidaan tunnistaa henkilö suoraan tai välillisesti taikka tiedot voidaan palauttaa takaisin tunnistettavaan muotoon, tiedot ovat henkilötietoja. Varmista, että tietoja ei ole mahdollista muuttaa takaisin sellaiseen muotoon, että yksittäinen henkilö voidaan tunnistaa datasta.

Lisää siitä, miten anonymisointi toteutetaan Aineistohallinnan käsikirjassa.

Esimerkki: Väestötietojärjestelmän nimiaineistot

Digi- ja väestötietovirasto julkaisee vuosittain nimiaineistoja. Tietosuojasyistä harvinaiset etu- ja sukunimet ovat jätetty aineistoista pois. Esimerkiksi etunimiä, joita esiintyy alle kymmenen kappaletta ei esitetä etunimiaineistossa.

Tekijänoikeuslaki

Tekijänoikeudet voivat rajoittaa datan avaamista. Tekijänoikeuslaki takaa tekijälle oikeuden päättää teoksestaan ja varmistaa, että kukaan ei saa käyttää teosta ilman tekijän lupaa. Mikäli teoskynnys ylittyy aineiston kohdalla, sitä suojaa tekijänoikeus.

Huomioi, että datan avaaminen antaa muille lisenssin nojalla käyttöoikeudet avattavaan aineistoon. Lue lisää lisensseistä oppaastamme.

Kiinnitä erityistä huomiota muista lähteistä hankitun datan tekijänoikeuksiin. On mahdollista, että sitä koskee erilaiset tekijänoikeudet kuin oman organisaatiosi tuottamaa dataa. Varmista, että organisaatiollasi on kaikki datan julkaisemiseen tarvittavat oikeudet. Datan käyttöoikeuksien pitää kattaa oman käytön lisäksi datan käyttö julkaisuissa. Jos näin ei ole, selvitä, voitko saada tarvittavat oikeudet.

Myös organisaatiosi käyttämät järjestelmät saattavat rajoittaa datan julkaisemista.

Esimerkki: Järjestelmän aiheuttamat rajoitteet

Organisaatiosi tuottaa sisäiseen käyttöönsä raportteja, joissa näytetään karttapohjalla erilaisia tietoja. Organisaatiosi käytössä olevan karttaohjelmiston käyttöehdoissa sallitaan vapaa käyttö organisaation sisällä, mutta lupaa ulkoisten julkaisujen tekemiseen ei suoraan anneta. Tällöin on mahdollista, että organisaatiosi ei saa jakaa tuottamiaan karttamuotoisia tietoaineistoja vapaasti avoimena datana, vaikka kaikki kartan päälle piirretty tieto olisikin organisaatiosi itse tuottamaa.

Riskit

Datan avaamiseen liittyy riskejä, jotka on hyvä huomioida ja kartoittaa ennen datan avaamista. Erityistä huomiota kannattaa kiinnittää tietoturvallisuuteen liittyviin riskeihin.
Huomioi myös mahdolliset organisaatiosi imagoon vaikuttavat riskitekijät.

Tahattoman laaja tietojen julkaisu

Tarkista data huolellisesti erityisesti silloin, jos avaat dataa tiedostona. Esimerkiksi taulukoihin saattaa jäädä ylimääräisiä sarakkeita, jotka voivat sisältää salassa pidettäviä tietoja. Myös piilotetut sarakkeet on helppo palauttaa, joten poista kaikki ei-haluttu data ennen julkaisua.

Esimerkki: Henkilötietojen tahaton julkaisu

Norjan verohallitus paljasti vahingossa kansalaistensa henkilötunnuksia vuonna 2008, kun toimittajille tarkoitetuista verotiedoista unohdettiin poistaa henkilötunnuksia sisältävä sarake.

Jos käytät datan julkaisuun tiedostomuotoja, jotka sallivat erilaisten upotettujen elementtien käytön, huomioi, että upotuksen mukana voi helposti tulla liian paljon tietoa. Jos esimerkiksi Word-tiedostoon upotetaan Excel-taulukosta kopioituja kuvia, mukana saattaa tulla koko lähdetaulukko. Tällöin dokumentissa voi näkyä vain graafi, mutta graafin taustalla oleva taulukko voi sisältää kaikkien taulukossa mainittujen henkilöiden henkilötiedot.

Tietoturva

Jos avaat dataa rajapintana, sen käyttöä voi olla tarpeen rajoittaa jossain määrin. Tämän voi toteuttaa esimerkiksi antamalla tarkemmat ohjeet niistä käytänteistä, joilla tietoa voi rajapinnan kautta hakea. Ota tietoturva vakavasti ja rajoita ainakin sitä, kuinka paljon yksittäinen käyttäjä voi kuormittaa rajapintaa, jotta rajapinnalle ei voi tehdä palvelunestohyökkäystä.

Ennalta-arvaamaton tietojen yhdistely

Varmista, että yksittäisiä harmittomia tietoja ei ole mahdollista yhdistellä niin, että niistä muodostuu yhdessä ongelmallisia. Ota tarvittaessa yhteyttä muihin dataa avaaviin organisaatioihin ja kartoita yhdistelyyn liittyvät riskit yhdessä heidän kanssaan.

Esimerkki: Tietojen haitallinen yhdistely

Netflix julkaisi vuonna 2007 tietoaineiston, joka sisälsi 500 000 käyttäjän laatimat elokuva-arviot ilman käyttäjien identiteettitietoja. Teksasin yliopiston tutkijat näyttivät, että he pystyivät IMDb-elokuvatietokantaa taustatietona käyttäen identifioimaan joitain käyttäjiä kyseisestä anonymisoidusta aineistosta.

Organisaation resursseihin liittyvät riskit

Datan avaamistyö sekä avatun datan ylläpitäminen vaatii organisaatiolta resursseja. Riskinä on, että organisaation resurssit eivät riitä esimerkiksi hyödyntäjien riittävään tukemiseen sekä avatun datan päivittämiseen. Tällöin datan laatu kärsii, ja hyödyntäjien kiinnostus organisaatiotasi ja sen dataa kohtaan laskee. Huolehdi, että organisaatiollasi on riittävät resurssit datan avaamisprosessiin.

Asiaan liittyvää lainsäädäntöä ja ohjeistusta muualla

Tietoturva- ja tietosuojaohjeistuksia