I. Kartoita ja selvitä

1.1. Tavoitteet
Kartoita ja selvitä -vaiheen jälkeen tiedät, mitkä organisaatiosi tietovarannot voit avata. Lisäksi vaiheen jälkeen tiedetään mitä tietovarantoja on olemassa ja miten ne on teknisesti toteutettu. Tätä tietoa tarvitaan, kun rakennetaan kokonaiskuvaa data infrstruktuurista tai esimerkiksi tietoarkkiarkkituurista.
1.2 Vastuut, rajoitteet ja velvoitteet
Aloita prosessi selvittämällä tiedon avaamiseen liittyvät reunaehdot ja määrittele vastuut, jotka tiedon avaamisesta mahdollisesti aiheutuvat organisaatiollesi. Kartoita myös tiedon avaamiseen liittyvät rajoitteet (lain asettamat rajoitteet, tekijänoikeudet ja käyttöoikeusrajoitukset)
Lainsäädäntö rajoittaa tiedon avaamista eniten. Eniten avaamista tyypillisesti ohjaa henkilötietoihin liittyvä lainsäädäntö, joka ohjaa, miten henkilötietoja sisältävää tietoa on käsiteltävä (mm. EU:n tietosuoja-asetus).
a) Vastuut
Selvitä, ketkä osallistuvat tiedon avaamisprosessiin ja mitkä ovat heidän vastuunsa. Tässä oppaassa on kaikkien päävaiheiden osalta erillinen lopputulos ja vastuuhenkilöt -kohta, jossa on esitelty alustava näkemys siitä, millaisia rooleja tiedon avaamisen eri vaiheisiin tarvitaan. Käy nämä läpi ja arvioi kunkin roolin tarpeellisuutta omassa tiedon avaamisessa. Huomaa, että yksittäisellä henkilöllä voi olla useita rooleja.
b) Lainsäädännölliset rajoitteet
Lainsäädännölliset velvoitteet rajoittavat tiedon avaamista eniten. Esimerkiksi henkilötietolaki määrää, miten henkilötietoja sisältävää tietoa on käsiteltävä.
Jotkut tiedot ovat salassa pidettäviä. Mieti kuitenkin, saatko muokattua näitä tietoja siten, että niiden salassapidon edellytykset poistuvat tiedon laadun kuitenkaan kärsimättä. Esimerkiksi merenmittauksen tuloksena saatavat tarkat syvyyyspistetiedot voivat olla maan turvallisuuden kannalta arkaluontoista materiaalia ja sellaisenaan salassa pidettäviä. Kun aineistoa harvennetaan riittävästi, saadaan tuloksena syvyyyspistejoukko, joka ei ole enää puolustuspoliittisesti arkaluontoista materiaalia, ja tietoa voidaan hyödyntää siviilikäytössä vesillä liikuttaessa.
c) Tekijänoikeusrajoitteet ja käyttöoikeusrajoitteet
Varmistu, että organisaatiollasi on kaikki tiedon julkaisemiseen tarvittavat oikeudet. Jos näin ei ole, selvitä, voitko saada tarvittavat oikeudet.
Selvitä tekijänoikeudet, jos organisaatiosi käyttää oman tietonsa pohjana muista lähteistä saamaansa tietoa. Varmistu tällöin, että hankitut tiedon käyttöoikeudet kattavat organisaatiosi oman käytön lisäksi myös tiedon käytön julkaisuissa.
Myös organisaatiosi käyttämät järjestelmät saattavat rajoittaa tiedon julkaisemista. Esimerkkitilanteessa organisaatiosi tuottaa sisäiseen käyttöönsä raportteja, joissa näytetään karttapohjalla erilaisia tietoja. Organisaatiosi käytössä olevan karttamoottorin lisenssiehdoissa sallitaan vapaa sisäinen käyttö, mutta lisenssiehdot eivät suorasanaisesti anna lupaa ulkoisten julkaisujen tekemiseen. Tällöin on mahdollista, että organisaatiosi ei saa jakaa tuottamiaan karttamuotoisia jalosteita vapaasti avoimena tietona, vaikka kaikki kartan päälle piirretty tieto olisikin organisaatiosi itse tuottamaa.
Asiaan liittyvää tärkeää lainsäädäntöä ja ohjeistusta:
- Laki viranomaisten toiminnan julkisuudesta 21.5.1999/621 (Finlex.fi)
- PSI-direktiivi 2013/37/EU (toimeenpano Suomessa laki viranomaisten toiminnan julkisuudesta -lain kautta).
- Laki julkisen hallinnon tietohallinnon ohjauksesta 10.6.2011/634 (Finlex.fi)
- Arkistolaki 23.9.1994/831 (Finlex.fi)
- Henkilötietolaki 22.4.1999/523 (Finlex.fi). Vuonna 2016 tuli voimaan EU:n tietosuoja-asetus, josta seuraa henkilötietolain uudelleenarviointi.
- Laki viranomaistoiminnan julkisuudesta 21.5.1999/621 (Finlex.fi)
- Asetus viranomaisen toiminnan julkisuudesta ja hyvästä tiedonhallintatavasta 12.11.1990/1030 (Finlex.fi)
- Laki kansainvälisistä tietoturvavelvoitteista 24.6.2004/588 (Finlex.fi)
- Laki julkisista hankinnoista 30.3.2007/348 (Finlex.fi)
- Valtioneuvoston asetus julkisista hankinnoista 24.5.2007/614 (Finlex.fi)
- Laki puolustusvoimista 11.5.2007/551 (Finlex.fi)
- Turvallisuusselvityslaki 19.9.2014/726 (Finlex.fi)
- Tekijänoikeuslaki 8.7.1961/404 (Finlex.fi)
- EU-säädökset (EU)
Tietoturva- ja tietosuojaohjeistus:
- Vahti-ohjeet - tietoturvallisuus (valtiovarainministeriö)
- Tietosuojavaltuutetun sivut (selosteet ym.) (Tietosuojavaltuutettu)
- Tietokortit tiedon avaamisesta (valtiovarainministeriö)
- Kokonaisarkkitehtuurityön työkalut (JHS 179) (JUHTA). JHS-179 sisältää myös joukon valmiita pohjalomakkeita, joista voi olla apua kartoitusta ja selvitystä tehtäessä.
1.3 Tietovarantojen ja -järjestelmien kartoitus
Jaa tietovarantojen ja järjestelmien kartoitus kahteen vaiheeseen. Selvitä ensimmäisessä vaiheessa, mitä aiemmissa hankkeissa on kartoitettu. Toisessa vaiheessa kartoita tietovarannot ja -järjestelmät kenttätasolta niiltä osin, mitä et ensimmäisen vaiheen aikana saanut selville.
Etsi vastaukset ainakin seuraaviin kysymyksiin:
- Mitä koneluettavia tietoja on olemassa?
- Kuka niistä vastaa tai keneltä saat lisätietoja?
- Mikä on tiedon kattavuus ja keskimääräinen laatutaso?
Olemassa oleva tieto tietovarannoista ja tietojärjestelmistä
Kattavimman tiedon tietovarannoista saat organisaation kokonaisarkkitehtuurikuvauksista (tietoarkkitehtuuri). Ota ne kartoituksen pohjaksi.
Vaikka kokonaisarkkitehtuurikuvausta ei olisi tehty, on organisaatioilla yleensä tietojärjestelmistään olemassa ainakin lista tai kartta, jota tarvitaan operatiivisen toiminnan pohjaksi. Käytä tätä listaa kartoituksen pohjana, vaikka järjestelmien sisältämä tieto ei siitä välttämättä selviäkään tarkasti.
Huomioi, että koneluettava tieto on todennäköisesti tietotyötä tekevän organisaation arvokkaimpia resursseja. Siksi sen hallinnan tehostaminen luo useita erilaisia tapoja tehostaa toimintaa. Usein tietojen avaamisesta suurimmat hyödyt ovat syntyneet datan avaajan omien prosessien tehostumisena, kun organisaation tiedonhallinta ja sen avulla koko toiminta on tehostunut.
Käytännön esimerkki: Helsingin kaupunki Helsingin kaupunki on selvittänyt omien tietojärjestelmien kokonaistilannetta. Kaupungilla on 700-900 erilaista (laskentatavasta riippuen) tietojärjestelmää toiminnan tukena ja toimintaa mahdollistamassa. Avoimen listan näistä löydät täältä: https://www.avoindata.fi/data/fi/dataset/helsingin-kaupungin-tietojarjestelmaluettelo Kaupungissa yli 40 000 työntekijää tekee joka päivä näiden tietojärjestelmien avulla töitä. On helppo ymmärtää, että tehostamalla tiedonhallintaa vaikutetaan merkittävästi siihen, miten organisaatio toimii ja millaisia mahdollisuuksia se luo laajemmin kaupunkilaisille ja yrityksille mm. älykäs-kaupunki -teeman alla. |
Tietojärjestelmien ja tietovarantojen kartoitus
Kartoituksen ensimmäinen haaste on ymmärtää, millaisia tietoja on ylipäätään olemassa. Et välttämättä muista tai näe tiedon olemassaoloa, kun teet kartoitusta.
Käytä tässä apuna esimerkiksi alla olevaa kuvaa (klikkaamalla se suurenee koko näyttöön), jossa on esitetty yksi jäsennys julkishallinnon tietovarannoista. Hyödynnä jäsennystä tutkimalla, onko organisaatiollasi vastaavia tietoja hallussaan.
Kuvassa keskellä on henkilöitä, rakennuksia, yrityksiä, paikkoja ym. koskevat perustiedot (perustietovarannot).
Toisella kehällä on hallinnollisia tietovarantoja, joita ovat esimerkiksi lainsäädäntöä, palveluja, organisaatoita ja julkista taloutta koskevat tiedot.
Kolmannella kehällä on syvälle substanssiin meneviä tietovarantoja useilta eri toimialoilta, esimerkiksi liikenteen, ympäristön, terveyden, koulutuksen ja kulttuurin aloilta.
Uloimmalla kehällä ovat strategiset tietovarannot, jotka koskevat päätöksiä, tilannekuvaa, toimintaympäristön tilaa ja toimenpiteiden vaikuttavuutta.
Käy tämän tarkastelun jälkeen järjestelmällisesti läpi organisaatiosi eri osien kanssa tiedot, joita niillä mahdollisesti on hallussaan.
1.4 Tiedon kuvaaminen ilmaisella työkalulla
Kun koneluettava tieto on usein organisaation arvokkain resurssi, niin sen kuvaaminen ja parempi hallinta vaikuttaa merkkittävästi koko organisaation toimintaan. Valtiolla on asetettu tavoitteita digitalisoinnin yhdeksän periaatetta, kuten:
- poistamme turhan asioinnin
- tuotamme asiakkaalle hyötyä nopeasti
- pyydämme uutta tietoa vain kerran
- hyödynnämme jo olemassa olevia julkisia ja yksityisiä sähköisiä palveluita
- avaamme tiedon ja rajapinnat yrityksille ja kansalaisille.
Samaan aikaan laindännössä on usein otettu kantaa siihen, mitä tietoja julkinen hallinto kerää osana toimintaansa.
Jotta tiedon kokonaisuus voitaisiin saada haltuun, on tuotettu yhteentoimivuus-työkalut, jossa voi kuvata käsitteitä, sanastoja ja tietomalleja.
Tietovarannon voi kuvata tietomalliksi ja siitä voi luoda sovellusprofiilin, joka kuvaa avoimen datan tietotuotetta (eli julkaisua).
Lisätietoja: https://yhteentoimiva.suomi.fi/fi/
Organisaation tiedon kuvaaminen mahdollisimman tarkasti auttaa kaikenlaiseen tiedonhallinnan tehostumiseen. Sen avulla on helpompi sekä edistää avointa dataa että esimerkiksi MyDataa ja suunnitella rajapintoja.
1.5 Tietovarantojen luokittelu avattavuuden suhteen
Kun olet saanut selville, mitä tietovarantoja organisaatiollasi on, luokittele tietovarannot sen perusteella, mitkä niistä voit avata. Älä tee tässä vaiheessa vielä lopullista avauspäätöstä. Saatat huomata myöhemmissä vaiheissa, että tiedon julkaiseminen on liian kallista tai mutkikasta tai että tiedon julkaiseminen ei tuota lisäarvoa.
Tietovarannot voidaan luokitella avattavuuden suhteen kolmeen eri pääluokkaan:
a) Tietovarannot, jotka voi avata sellaisinaan
Osa tiedoista voidaan avata ilman minkäänlaisia esteitä. Tällöin organisaatiollasi on tiedon tekijänoikeus tai muutoin riittävät oikeudet tietoon, eikä tieto sisällä mitään salassapidettävää.
b) Tietovarannot, joita tarvitsee muokata ennen avaamista
Osa tiedoista ei ole kokonaisuudessaan julkaisukelpoisia. Poista tiedoista julkaisukelvottomat osat. Huolehdi, että osien poistamisen jälkeen jäljelle jää datan hyödyntäjälle arvoa luova osa-kokonaisuus, joka kannattaa julkaista.
Useissa tilanteissa esimerkiksi henkilötiedot täytyy poistaa tietovarannoista ennen tietojen avaamista. Tapauksesta riippuen voit poistaa tiedot useammalla eri tavalla. Aineistosta, jossa on sekaisin esimerkiksi elinkeinonharjoittajien ja yritysten tietoja, on suotavaa poistaa elinkeinonharjoittajien tiedot. Voit poistaa elinkeinonharjoittajaa koskevan tiedon kokonaan tai vaihtoehtoisesti jättää tiedon paikalleen, mutta poistaa tiedon, ketä elinkeinonharjoittajaa tieto koski. Voit myös poistaa kaikki elinkeinonharjoittajia koskevat tiedot, ja ilmoittaa kuitenkin niitä koskevan summatiedon, esimerkiksi näin: "Aineistosta on poistettu elinkeinonharjoittajia koskevat laskut. Näitä oli yhteensä 213 kappaletta kokonaisarvoltaan 1,7 miljoonaa euroa."
c) Tietovarannot, joita ei voi avata
Tietovarannot, joita ei voi tai kannata avata missään muodossa. Tällaista tietoa on esimerkiksi kansalliseen turvallisuuteen liittyvä tieto tai henkilötietoja sisältävä tietoaineisto, josta ei henkilötietojen poistamisen jälkeen jää jäljelle mitään julkaisemisen arvoista.
1.6 Datan jaotteluja
Suomen suurimmat kaupungit ovat tehneet suositukset avoimien ohjelmointirajapintojen käytöstä. Avointen ohjelmointirajapintojen avulla kaupungit voivat antaa tuottamiaan tietoja kenen tahansa käyttöön. Suosituksissa otetaan kantaa muun muassa rajapinnan laatuun, palvelulupaukseen, lisensseihin, yhdenmukaistamiseen ja teknisiin asioihin.
Share-PSI:n parhaissa käytännöissä on kuvailtu kriteerejä, jotka helpottavat arvokkaan tiedon tunnistamista. Kriteerit pohjautuvat kolmeen eri osa-alueeseen:
- Tiedon uudelleenkäytettävyys
- Tiedon arvo omistajan näkökulmasta
- Tiedon arvo sen käyttäjälle
Tukeudu uudelleenkäytettävyyttä arvioidessasi Tim Berners-Leen 5 tähden malliin (alla oleva taulukko). Laadukkaasti avatun avoimen datan tulisi saavuttaa vähintään kolme tähteä tässä arviointimallissa (data on saatavilla avoimessa formaatissa).
Laatu | Kuvaus |
★★★★★ | Data sisältää sisällöllisen linkityksen toisiin datoihin |
★★★★ | Data sisältää yksilöllisiä tunnisteita, joihin voi viitata (URL) |
★★★ | Data on saatavilla avoimessa formaatissa (CSV, JSON, XML) |
★★ | Data on rakenteellisessa muodossa (esimerkiksi Excel-taulukko) |
★ | Data on saatavilla missä tahansa muodossa avoimella lisenssillä (esimerkiksi skannattu kuva tai PDF) |
Arvioi tiedon omistajan näkökulmasta, täyttääkö avaaminen jonkin seuraavista ehdoista:
- tiedon jakaminen lisää läpinäkyvyyttä tai julkaisemiseen on laillinen velvoite
- tieto liittyy omistajan julkiseen tehtävään
- tiedon jakaminen vähentää kuluja.
Jos ainakin yksi ehdoista täyttyy, voidaan tieto nähdä arvokkaana.
Tiedon todellinen arvo muodostuu pitkälti sen kysynnän ja uudelleenkäytettävyyden perusteella. Jos arvioit, että julkaistavalla tiedolla on suuri potentiaalinen kohdeyleisö ja tietoa voidaan hyödyntää erilaisia palveluita rakennettaessa, on tieto arvokasta.
Arvokkaita tietovarantoja ovat esimerkiksi julkisen liikenteen tiedot, julkisen sektorin menot (ostolaskut) tai paikkatieto. Esimerkiksi ostolaskuista on olemassa avoimen datan visualisointi osoitteessa http://www.tutkihankintoja.fi/.
Muut kriteerit
Avointa tietoa voidaan luokitella eri kriteereillä. Näillä kriteereillä on vaikutusta prosessin myöhempiin vaiheisiin. Perehdy seuraaviin luokitteluihin, kun kartoitat avattavia tietovarantoja:
a. Staattinen ja dynaaminen tieto
Staattinen tieto on luonteeltaan pysyvää ja se ei muutu usein tai paljon. Sen voi ladata kertaalleen, minkä jälkeen lataaja käyttää ladattua kopiota. Tietoa päivitetään tiedon lähteeltä staattisuuden asteesta riippuen. Esimerkiksi vuosittain päivitettävät tilinpäätöstiedot ovat varsin staattista tietoa. Samoin esimerkiksi Suomen postinumerot.
Dynaaminen tieto muuttuu usein. Tiedon käyttäjä haluaa tyypillisesti hakea aina tuoreimman version tiedosta. Dynaamista tietoa ovat esimerkiksi bussien ja junien reaaliaikaiset sijainnit.
Staattisen tiedon osalta järjestelmälle asetettavat tekniset laatuvaateet ovat dynaamista tietoa pienemmät. Jos tilinpäätös-tietoja jakava palvelin on toisinaan muutaman tunnin ajan pois käytöstä, aiheutuu tästä usein vain vähäinen haitta tiedon hyödyntäjälle. Jos sen sijaan bussien reaaliaikaiset sijainnit lakkaavat päivittymästä, joukko muitakin palveluita muuttuu toimintakyvyttömiksi ja pahimmillaan koko kaupunki ruuhkautuu.
Myös riskitasoissa on eroja. Arkaluontoisen staattisen tiedon, kuten esimerkiksi organisaatioiden työntekijöiden sairauspoissaolojen ja tarkkojen diagnoosien, jakamista vahingossa ei voi perua. Kerran ladattu tieto pysyy tiedon lataajilla. Sen sijaan vahingossa luovutettu epätoivottava dynaaminen tieto on usein korjattavissa tietoa luovuttavan rajapinnan sulkemisella.
b. Julkaisuvalmis tieto vs. raakatieto
Organisaatiosi julkaisuvalmis tieto on loogisiksi kokonaisuuksiksi koostettua tietoa yhdessä tai useammassa rekisterissä. Organisaatiosi käyttää tätä tietoa jo johonkin tarkoitukseen. Käy myös julkaisuvalmiin tiedon prosessi läpi: varmista tiedon laatu ja suodata pois arkaluontoinen materiaali.
Raakatieto on tietoa, jota organisaatiollasi on, mutta jota ei ole vielä koottu yhteen paikkaan. Raakatiedon osalta joudut tekemään määrittelytyötä julkaisuvalmista tietoa enemmän. Jätä raakatieto avausjärjestyksessä julkaisuvalmista tietoa myöhäisempään ajankohtaan, jos huomaat, että raakatieto ei erityisesti näytä kiinnostavan käyttäjäkuntaa.
c. Itse tuotettu tieto ja koostettu tieto
Osa organisaatiosi käsittelemistä tiedoista on syntynyt sen sisällä, osa taas koostuu erilaisista ulkoisista lähteistä saaduista tiedoista, joita koostetaan, yhdistellään ja jatkojalostetaan. On tärkeää, että tunnistat jälkimmäisen kategorian, sillä sinun on varmistettava, että saat jakaa muualta saatua tietoa osana organisaatiosi tiedon avaamista. Myös resurssien käytön kannalta on järkevää, että organisaatiosi ei julkaise samaa tai lähes samaa tietoa kuin jokin toinen organisaatio.
Esimerkkinä toisiinsa kytkeytyneistä tiedoista voidaan mainita Liikenneviraston onnettomuustilastot (liikennevirasto.fi):
"Liikenneviraston onnettomuustilastot perustuvat poliisin kirjaamiin onnettomuustietoihin, joita täydennetään Liikenteen turvallisuusviraston sekä Tilastokeskuksen tiedoilla. Tietojen sisällöstä ja laadusta vastaa Tilastokeskus, josta onnettomuustiedot saadaan kerran kuukaudessa.
Aineisto sisältää yksityiskohtaista tietoa onnettomuudesta, onnettomuuden osapuolista ja henkilöistä. Liikennevirastossa onnettomuustietoihin liitetään tierekisteristä tapahtumapaikan tie- ja liikenneoloja kuvaavat tiedot."
Käytä apunasi oheista kuvaa, kun mietit, miten tietoaineiston koko ja päivitystiheys vaikuttavat avaamisen teknisiin valintoihin. Pienelle, harvoin päivitettävälle tietoaineistolle riittävät eräajot, kun taas suuret ja usein päivitettävät tietoaineistot kannattaa avata rajapinnan kautta.
1.7 Tietovarantokatsauksen julkaisu
Kun olet koonnut katsauksen organisaatiosi tietovarannoista, jossa kuvaat tietosisällön ominaisuuksia ja luokittelet tiedon avoimuuden, julkaise katsaus. Katsauksen julkaiseminen laajentaa kohdeyleisön tietämystä organisaatiosi hallussa olevista tietovarannoista ja edesauttaa kysynnän tunnistamista. Jos katsauksesi ei päädy yleisön saataville, yleisöltä jää puuttumaan kokonaiskuva olemassa olevista tietovarannoista. Jos yleisö ei voi määritellä tarpeitaan, et tiedon omistajana pysty priorisoimaan avattavia tietoja kysyntään perustuen.
Voit julkaista tietovarantokatsauksen esimerkiksi avoindata.fi-palvelun kautta sijoittaen katsauksen yhteentoimivuuden aineistoihin.
1.8 Lopputulos ja vastuuhenkilöt
Kartoitus- ja selvitysvaiheen lopputuloksena saadaan
Kartoita ja selvitä |
Arvioi ja valitse |
Valmistele ja avaa |
Seuraa ja kehitä |
Tietojärjestelmäluettelot |
Käyttäjätarpeiden ja kysynnän kartoitus |
Avattu tietoaineisto |
Avoimen tiedon vuosikatsaus |
Tietovarantoluettelot |
Suunnitelma tietovarantojen avaamisesta |
Avatun tietoaineiston ylläpitosuunnitelma |
|
Selvitys siitä, minkä tietovarantojen käytölle on lainsäädännöllisiä tai muita rajoituksia |
Suunnitelma tietovarantojen avaamisen kustannuksista kehysvalmistelua varten |
Palautemenetelmät |
|
Määritelmä avaamisen tavoitteista |
Kartoitus- ja selvitysvaiheen vastuuhenkilöt ovat
Kartoita ja selvitä |
Arvioi ja valitse |
Valmistele ja avaa |
Seuraa ja kehitä |
|
Johto |
X |
|||
Lakimies |
X |
X |
X |
|
Kokonaisarkkitehtuurista vastaava |
X |
|||
Sidosryhmät |
X |
|||
Taloushallintoasiantuntija |
X |
|||
Tiedon avaamisesta vastaava |
X |
|||
Tiedon käyttäjät |
X |
|||
Tiedon omistaja |
X |
X |
X |
|
Tietohallintoasiantuntija |
X |
X |
X |
|
Tietojärjestelmätoimittaja |
X |
|||
Tietoturva-asiantuntija |
X |
|||
Ulkopuolinen konsultti |
X |
|||
Viestintäasiantuntija |
X |
X |