III. Valmistele ja avaa

Valmistele_ja_avaa

3.1. Tavoitteet

Valmistele ja avaa -vaiheen jälkeen organisaatiosi on avannut suunnittelemansa tiedot avoimen datan hyödyntäjille saataville.

 

3.2. Työkalut

JHS 189 - avoimen tietoaineiston käyttölupa (JUHTA)

Oppaat, koulutusmateriaalit

Datakoulu 27.3.2014 Ilkka Pirttimaa: Avoin data sovelluskehittäjän näkökulmasta

Jakelukanavat

Käytä tiedon jakelukanavana avoindata.fi-palvelua. Avoindata.fi-palveluun lisätyt tietoaineistot näkyvät automaattisesti myös Euroopan avoimen datan portaalissa, sillä EU-portaali harvestoi ja kääntää Avoindata.fi-palvelun tietoaineistojen metatietoja automaattisesti.

Varmista, että käytät jakelukanavia, joista potentiaaliset tiedon käyttäjät löytävät tiedon helposti.

Eri tyyppisille tiedoille on erilaisia julkaisukanavia. Esimerkiksi yksi Avoimen tieteen ja tutkimuksen (ATT) suosittelemista jakelukanavista on sveitsiläinen Zenodo.

Vie tieto saataville myös erilaisiin kansainvälisiin kanaviin, jotta mahdollisimman laaja yleisö löytää avaamasi tiedon. Kun julkaiset tietoaineistoja kansainvälisissä jakelukanavissa, tuota avaamastasi tiedosta englanninkielistä materiaalia.

Julkaise materiaalia englanniksi ainakin:

  • verkkosivustoilla, joilla tieto, sen käyttöön liittyvät lisenssit ja sen metatiedot esitellään
  • rajapintakutsuissa esiintyvissä avainsanoissa ja parametreissä
  • palaute- ja tukikanavissa.

3.3. Lisenssit ja käyttöoikeudet

Vaiheeseen liittyvät W3C-käytännöt

Lisenssin merkitseminen

Datakoulu 6.3.2014 Tarmo Toikkanen: Tekijänoikeudet ja Creative Commons

Varmista, että organisaatiollasi on riittävät oikeudet tiedon avaamiseen.

Julkishallinnon avoimien tietoaineistojen käyttöluvaksi suositellaan Creative Commons Nimeä 4.0 (CC BY 4.0) tai Creative Commons CC0 1.0 (CC0 1.0) -käyttölupaa. Jos datan yksilöiminen tai tuottajan tietojen ilmoittaminen ei ole tarpeellista, voit käyttää CC0-käyttölupaa. Käyttöluvasta on myös annettu JHS-189 suositus (Avoimen tietoaineiston käyttölupa). Käyttölupa helpottaa julkishallinnon avointen tietoaineistojen uudelleenkäyttöä ja yhtenäistää siihen liittyviä käytäntöjä.

Suositellun avoimen datan käyttöluvan eli lisenssin malli (CC BY 4.):

Creative Commons -lisenssi
Tämä teos on lisensoitu Creative Commons Nimeä 4.0 Kansainvälinen -lisenssillä.

Suositellun avoimen datan käyttöluvan eli lisenssin malli (CC0 1.0):

CCO lisenssi
Lain mukaan, julkaisija on lisenssoinnut tämän CC0 -lisenssillä ja on luopunut kaikista tekijänoikeuksista tähän työhön.

 

3.4. Tekniset valinnat

Vaiheeseen liittyvät Share-PSI-käytännöt

Paikkatiedon standardit

Vaiheeseen liittyvät W3C-käytännöt

Tietovarantojen identifioiminen

Formaattien käyttö

Tietovarantojen tarjoaminen

Ostolaskut kannattaa avata koneluettavassa ja valmistajariippumattomassa CSV-tiedostomuodossa. Tämän lisäksi ne voi avata esimerkiksi Excel-muodossa. Esimerkki: Ostolaskujen avaamisohje kunnille

Laki edellyttää viranomaisia ylläpitämään kuvauksia käyttämistään tietojärjestelmistä. Usein tiedot on koottu tietojärjestelmäluetteloksi. Ohje auttaa organisaation tietojärjestelmäluettelon julkaisemisessa avoimena datana sekä julkaistavien luetteloiden tietosisältöjen harmonisoinnissa. Konkreettinen esimerkki on Helsingin kaupungin tietojärjestelmäluetteloEsimerkki: Tietojärjestelmäluettelon avaamisohje kunnille

Aloita teknisen valinnan tekeminen miettimällä, minkä tasoisena teknisestä näkökulmasta katsottuna avaat tiedon.

Alla olevassa kuvassa on esitetty viisiportainen luokittelumalli.

Ei-koneluettava data

Alin taso (5) käsittää ei-strukturoitua dataa jossain muodossa, esimerkiksi vapaaseen muotoon kirjoitettuja kokousmuistioita pdf-dokumentteina. Tällaisen datan käsittely muilla tavoilla kuin ihmissilmän lukemana on yleensä haasteellista ja epämielekästä.

Tasot 3 ja 4 käsittävät strukturoitua dataa joko avoimessa tai ei-avoimessa formaatissa. Strukturoitua dataa voidaan tyypillisesti käyttää ei-strukturoitua dataa helpommin erilaisessa koneellisessa jatkojalostuksessa. Tämä on usein ainakin joiltain osin ihmisen tekemää toimintaa, mutta mikäli samassa formaatissa saadaan usein toistuvia päivityksiä, voidaan automatiikkaakin rakentaa. Esimerkkinä tämän tason tiedosta ovat kuntien ostolaskut.

Koneluettava data

Koneluettava data on nimensä mukaisesti tarkoitettu koneen käsiteltäväksi eli käytännössä erilaisissa sovelluksissa hyödynnettäväksi. Erityisesti dynaamisten rajapintojen kautta jaettava data on tyypillisesti koneluettavaa dataa. Esimerkkinä voidaan mainita liikenteessä olevien bussien reaaliaikaiset sijaintitiedot.

Ihminen pystyy harvoin tulkitsemaan mielekkäästi koneluettavaa dataa itsessään. Jos haluat, että data on ihmisen tulkittavissa, tuota datasta erikseen dokumenttimuotoinen esitys tai sovellus, joka hakee kinnostavimmat kohdat ihmiselle sopivaan muotoon.

 

 

3.5. Ylläpito ja palaute

Vaiheeseen liittyvät Share-PSI-käytännöt

Hyödynnä palautekanavia parantaaksesi tiedon laatua

Valitse haluamasi palautekanavat ja resursoi tarvittavat henkilöt palautteen käsittelyyn.

Erilaiset palautekanavat ja niiden kautta annettava käyttäjätuki ovat tärkeitä avoimen tiedon käytön edistäjiä ja olemassa olevan käytön jatkuvuuden takaajia. Tämä koskee erityisesti tapauksia, joissa tarjoat dynaamista tietoa rajapinnan kautta

Käyttöesimerkit

Tarjoa selkeät ja kiteytetyt ohjelmistoratkaisut lähdekoodeineen ohjelmistokehittäjien saataville, sillä ne toimivat hyvänä katalyyttina kehitystyön alkuvaiheessa. Anna sovelluskehittäjille mahdollisuus kokeilla rajapinnan toimintaa omilla työasemillaan.

Kehittäjä saattaa kohdata ongelmia käyttäessään rajapintaa ensimmäisiä kertoja. Kehittäjä ei välttämättä tiedä tässä vaiheessa, onko virhe hänen toiminnassaan vai taustajärjestelmässä. Tarjoa sovelluskehittäjille toimiva esimerkki rajapinnan toiminnasta. Sovelluskehittäjä varmistuu toimivan esimerkin avulla, että haluttava rajapinta toimii juuri kyseisellä hetkellä. Toimiva esimerkki auttaa kehittäjää eteenpäin silloinkin, kun dokumentaatio on puutteellista tai vaillinaista.

Usein kysytyt kysymykset

Kokoa usein toistuvia kysymyksiä erilliseen Usein kysytyt kysymykset -osioon. Näin tiedon käyttäjät löytävät vastaukset yleisimpiin kysymyksiinsä helposti, ja myös oma työtaakkasi helpottuu palautteen käsittelyn suhteen.

Sähköpostituki

Perusta sähköpostitukikanava. Se on yksinkertainen palaute- ja tukikanava, eikä sen perustaminen vaadi erillistä tietojärjestelmäkehitystyötä tai muuta teknistä varautumista. Pidä kuitenkin huoli, että vastaat palautteeseen riittävän nopeasti ja laadukkaasti.

Hyvä esimerkki sähköpostiosoitteesta on: avoindata@[virasto].fi & avoindata@[ministerio].fi

Online-tuki ja puhelintuki

Harkitse interaktiivista tukikanavaa, esimerkiksi puhelimitse tai pikaviestimen avulla annettavaa tukea, jos tiedät jo etukäteen tai huomaat myöhemmin tuen tarpeen olevan suurta.

Disqus

Avoindata.fi-palvelussa jokaisella tietoaineistosivulla on Disqus-viestintäsovellus. Sen uusista viesteistä lähtee sähköpostilla automaattinen ilmoitus tietoaineiston julkaisijalle siihen sähköpostiosoitteeseen, joka on aineiston lisääjän ilmoittama.

DisQus

Disqussin ideana on lisätä datan avaajien ja hyödyntäjien välistä vuoropuhelua.

3.6. Tiedon viimeistely ja laatu

Vaiheeseen liittyvät Share-PSI-käytännöt

Tarjoa metatietoa

Tarjoa laatuarvio avoimesta tiedosta

Vaiheeseen liittyvät W3C-käytännöt

Alkuperän määrittäminen

Versioiden määrittäminen

Laadun määrittäminen

Sanastojen käyttö

Datakoulu 5.2.2014 Petri Kola: Miltä näyttää hyvä avoin data?

Katso datakoulun video tiedon viimeistelystä ja laadusta.

Metatietojen tarjoaminen

Julkaistessasi tietoja internetissä tiedon alkuperäinen konteksti katoaa helposti, jolloin metatietojen tarjoamisen tärkeys korostuu. Metatiedot eli kuvailutiedot antavat tiedon käyttäjille, niin ihmisille kuin koneille hyödyllistä lisäinformaatiota tietovarannosta. Metatietojen avulla kuvailet mm. tietovarannon tarkoitusperää, sen rakennetta tai esimerkiksi tiedon käyttöön kohdistuvia oikeuksia ja lisenssejä. Kattavasti luoduilla metatiedoilla edistät tietovarantojesi löydettävyyttä sekä uudelleenkäyttöä.

 

W3C:n parhaat käytännöt ohjeistavat tiedon julkaisijaa tarjoamaan ainakin seuraavanlaista metatietoa:

1. Metatietoa, joka soveltuu niin ihmis- kuin koneluettavaksi

Voit tarjota ihmisluettavaa metatietoa joko osana HTML-sivua tai erillisenä tekstitiedostona. Koneluettavia metatietoformaatteja ovat esimerkiksi Turtle ja JSON. Voit sisällyttää koneluettavaa metatietoa HTML-sivuun hyödyntäen esimerkiksi HTML-RDFA- tai JSON-LD-formaatteja.

Koneluettavaa metatietoa määritellessäsi on erittäin suositeltavaa, että käytät hyväksesi standardeja termejä sekä suosittuja sanastoja. Käytä apunasi esimerkiksi Dublin Core Metadata -termistöä (DCMI) ja Data Catalog Vocabulary -sanastoa.

2. Kuvailevaa metatietoa

Kuvaileva metatieto on tarkoitettu tiedon sekä sen julkaisuversion ominaisuuksien kuvailuun. Kuvailevaa metatietoa tarjotessasi määrittelet mm. tietovarannon otsikon, tietovarantoon liittyvät avainsanat ja teeman, johon tietovaranto lukeutuu. Tarjoa myös julkaisuversiosta esimerkiksi sen julkaisuajankohta ja mediamuoto. Tutustu tarkemmin kuvailevaan metatietoon Avoindata.fin metatietomallin avulla.

3. Lokaaleja parametreja sisältävää metatietoa

Lokaaleja parametreja (päivämäärä, aika, numeroformaatti, kieli) sisältävä metadata edistää erityisesti tiedon muokattavuutta. Kun määrittelet esimerkiksi tietovarannon kielen metatiedoissa, helpottaa tämä tiedon mahdollisia kansainvälisiä käyttäjiä arvioimaan kuinka valmiita he ovat työskentelemään tiedon parissa. Sama tieto mahdollistaa osaltaan myös automaattiset käännöspalvelut.

4. Rakenteellista metatietoa

Julkaisuversioon sisällyttämäsi rakenteellinen metatieto auttaa tietovarannon tutkimisessa ja tietovarantoon kohdistuvia kyselyitä tehtäessä.

Rakenteellinen metatieto on saatavilla riippuen julkaisuversion formaatista, ja voit tarjota sen erillisenä dokumenttina tai sisällytettynä julkaisuversioon.

 

Tiedon alkuperä ja arvio laadusta

Metatietojen tarjoamisen lisäksi avaamasi tiedon laatua ja uskottavuutta kasvattaa se, jos julkaiset käyttäjille oman arviosi tiedon sen hetkisestä laadusta ja kerrot sen alkuperästä. Anna myös käyttäjille mahdollisuus tiedon laadun arviointiin ja huomioi nämä arviot laatua parannettaessa.

Esimerkiksi W3C Data Quality Vocabulary tarjoaa mallin, jota seuraamalla voit julkaista laatua kuvailevaa informaatiota koneluettavassa ja yhteentoimivassa muodossa. Tarjoa mallia myös käyttäjille heidän arvioitaan helpottaaksesi.

 

3.7. Lopputulos ja vastuuhenkilöt

Valmistelu- ja avausvaiheen lopputuloksena saadaan

Kartoita ja selvitä Arvioi ja valitse Valmistele ja avaa Seuraa ja kehitä
Tietojärjestelmäluettelot Käyttäjätarpeiden ja kysynnän kartoitus Avattu tietoaineisto Avoimen tiedon vuosikatsaus
Tietovarantoluettelot Suunnitelma tietovarantojen avaamisesta Avatun tietoaineiston ylläpitosuunnitelma  
Selvitys siitä, minkä tietovarantojen käytölle on lainsäädännöllisiä tai muita rajoituksia Suunnitelma tietovarantojen avaamisen kustannuksista kehysvalmistelua varten Palautemenetelmät  
  Määritelmä avaamisen tavoitteista    

 

Seuraamis- ja kehittämisvaiheen vastuuhenkilöt ovat

  Kartoita ja selvitä Arvioi ja valitse Valmistele ja avaa Seuraa ja kehitä
Johto   X    
Juristi X X X  
Kokonaisarkkitehtuurista vastaava X      
Sidosryhmät       X
Taloushallintoasiantuntija   X    
Tiedon avaamisesta vastaava   X    
Tiedon käyttäjät       X
Tiedon omistaja X   X X
Tietohallintoasiantuntija X X X  
Tietojärjestelmätoimittaja     X  
Tietoturva-asiantuntija X      
Ulkopuolinen konsultti     X  
Viestintäasiantuntija   X X