Datan lisääminen

Lisää dataa tietoaineistona tuottajalle

Lisää data tietoaineistona silloin, kun data on tiedostossa. Esimerkiksi .csv- tai excel-tiedosto. 

Voit lisätä tietoaineistoja, kun olet rekisteröitynyt palveluun ja kirjautunut sisään. Tarvitset myös Ylläpitäjä- tai Muokkaaja-roolin oikeudet siihen organisaatioon, johon haluat tietoaineiston lisätä. Lue lisää jäsenyydestä Organisaation jäsenet -osiosta.

Jos organisaatiotasi ei ole vielä lisätty palveluun, lue, miten lisäät uuden tuottajan

1. Lisää ja kuvaile tietoaineisto

Lisää tietoaineistoja Tietoaineistot-sivulta Lisää tietoaineisto -painikkeesta.

Tarkista ensin, onko joku muu organisaatio julkaissut samankaltaista dataa kuin olet itse julkaisemassa. Jos on, ota mallia heidän julkaisustaan ja käytä esimerkiksi samanlaisia avainsanoja ja kategorioita.

Jos olet esimerkiksi lisäämässä ostolaskuja, tutustu ensin muiden organisaatioiden lisäämiin ostolaskuihin.

Näin lisäät tietoaineiston

Aloita lisääminen täydentämällä tietoaineiston kuvailutiedot eli metatiedot ja lisää sen jälkeen itse data. Pakolliset kentät ovat merkitty lomakkeeseen tähdellä *.

Kuvaile tietoaineisto kattavasti, sillä se parantaa sen löydettävyyttä ja helpottaa datan hyödyntämistä.

  1. Anna tietoaineistollesi nimi, jonka kertoo datan sisällöstä. Esimerkiksi Hämeenlinnan kaupungin ostolaskut 2020. ​​​​​

    • Lisää metatiedot myös ruotsiksi ja englanniksi, jotta muutkin kuin suomenkieliset datan hyödyntäjät voivat käyttää dataa. Datat kopioituvat myös Euroopan yhteiseen data.europa.eu-palveluun, josta kansainväliset datan hyödyntäjät löytävät datan.

    • Palvelu luo tietoaineiston URL-osoitteen automaattisesti sen nimen perusteella. Jos osoite on sama kuin jollain muulla aineistolla, saat virheilmoituksen ja sinun täytyy muokata osoitetta. 

  2. Kirjoita kuvaukseen:

    • Millaista dataa tietoaineisto sisältää?

    • Miten data on kerätty?
    • Mihin dataa voi käyttää?
    • Millainen on datan laatu ja mahdolliset puutteet?
    • Voit lisätä yksityiskohtaisen kuvauksen tai tarinan datasta myös PDF-tiedostona seuraavassa vaiheessa Lisää dataa.
  3. ​​Lisää datan sisältöä kuvaava avainsana ja sille sopivat kategoriat

    • Avainsanat-kenttä ehdottaa jo aiemmin käytettyjä avainsanoja. Suosittelemme käyttämään paljon käytössä olevia avainsanoja. 

  4. Valitse tietoaineiston näkyvyydeksi julkinen, sillä kaikki palvelussa oleva data on julkista avointa dataa, eikä palveluun saa lisätä yksityiseksi tarkoitettuja aineistoja. Jos haluat pitää tietoaineiston väliaikaisesti luonnostilassa esimerkiksi testausta tai tietojen täydennystä varten, valitse tilaksi yksityinen.
    • Yksityiset tietoaineistot näkyvät kaikille sen julkaisseen organisaation jäsenille.
  5. Valitse tietoaineistolle sen käyttöehdot määrittelevä lisenssi ja kerro, kuinka datan hyödyntäjien tulisi viitata dataasi. Avoimella datalla täytyy aina olla avoin lisenssi. Valitse joko CC BY 4.0 tai CC0 1.0 -lisenssi:
    • Creative Commons Nimeä 4.0 (CC BY 4.0) -lisenssiä käytettäessä datan hyödyntäjän pitää nimetä datan alkuperä, tarjota linkki lisenssiin ja kertoa, jos dataan on tehty muutoksia. 
    • Creative Commons CC0 1.0 -lisenssi ei määrittele tietoaineiston uudelleenkäytölle minkäänlaisia rajoitteita. Tätä lisenssiä käytetään usein metatietoihin.
    • Jos käytät CC-BY-4.0-lisenssiä määrittele Lisätietoa lisenssistä kenttään, miten haluat, että organisaatiosi nimetään, kun joku hyödyntää julkaisemaasi dataa.
  6. Valitse, mitkä kunnat julkaisemasi data kattaa ja kuinka usein dataa päivitetään.
    • ​​​​​​
    • Suosittelemme käyttämään data.europa.eu-palvelun päivitystiheysvälejä:
      • Kaksivuotinen
      • Vuotuinen
      • Puolivuotinen
      • Vuosineljänsittäin
      • Kuukausittainen
      • Kahdesti kuussa
      • Joka toinen viikko
      • Viikottainen
      • Päivittäin
      • Kahdesti päivässä
      • Joka toinen tunti
      • Joka tunti
      • Jatkuva
      • Epäsäännöllinen
      • Ei koskaan
  7. Jos lisäämäsi tietoaineisto on voimassa tietystä päivästä alkaen tai se vanhenee tiettyyn päivämäärään mennessä, lisää datalle voimassaolon alku- ja loppupäivämäärä. Tällaista dataa voisi olla esimerkiksi vanha maakuntajako.
    •  
    • Halutessasi voit lisätä esimerkiksi linkin organisaatiosi verkkosivuille. 
  8. Valitse tietoaineiston tyypiksi Open data eli avoin data.
  9. Aseta tietoaineiston tilaksi aktiivinen. Poistettu-tila, poistaa aineiston. Poistetut aineistot näkyvät tietoaineiston julkaisseen organisaation jäsenille mutta ei muille käyttäjille. Aineiston poistamisen voi perua valitsemalla aineiston tilaksi taas Aktiivinen.
  10. Lisää tietoaineistoa ylläpitävän organisaation tiedot. Käytä organisaation yleistä sähköpostia esimerkiksi kirjaamo@organisaatio.fi tai avoindata@organisaatio.fi.
    • Lisää tietoaineiston ylläpitäjäksi joko organisaatio tai esimerkiksi organisaation yksikkö tai osasto, joka on vastuussa julkaistusta datasta.
  11. Siirry lisäämään dataa valitsemalla Seuraava.
    • Lomakkeella näkyvistä tyhjistä muokattavista kentistä ei tarvitse välittää. Niitä voi käyttää, jos haluat lisätä tietoaineistolle tietoa, jolle ei ole lomakkeella omaa kenttää. Niihin kirjoitettu tieto ei näy tietoaineiston sivulla.

2. Lisää data-aineistoja

Seuraavaksi tietoaineistolle täytyy lisätä vähintään yksi data-aineisto. Jos haluat lisätä dataa olemassa olevaan tietoaineistoon, katso Datan ylläpitäminen.

Data-aineisto on tietoaineiston osa, joka sisältää itse datan. Tietoaineistolla voi olla useita data-aineistoja, joista osa voi sisältää saman datan eri muodoissa ja osa erityyppistä dataa. Esimerkiksi tietoaineisto “suosituimmat nimet” voisi sisältää neljä data-aineistoa: suosituimmat etunimet sekä sukunimet erillisinä Excel-taulukkoina ja CSV-tiedostoina.

Näin lisäät tietoaineistolle dataa

  1. Anna data-aineistolle nimi, joka kuvaa sen sisältämää dataa. Jos tiedoston data kattaa tietyn ajankohdan, voit kirjoittaa sen nimeen. Esimerkiksi Suosituimmat nimet 2020 tai Ostolaskut 1.6.2020-31.12.2020. Jos et nimeä data-aineistoa, sen nimeksi tulee aineiston tiedostonimi tai URL-osoite.
  2. Lisää tiedosto tai linkki dataan, jos se on esimerkiksi saatavilla organisaatiosi verkkosivuilla.
    •  
    • Suosittelemme lisäämään datan avoimessa, ei-kaupallisessa tiedostomuodossa, esimerkiksi csv-tiedostona. Jos et täydennä Tiedostokoko ja Muoto -kenttiä, ne täydennetään automaattisesti, kun tallennat tietoaineiston.
  3. Kirjoita halutessasi tekninen kuvaus data-aineistolle, jossa voit kertoa esimerkiksi tiedoston sisältämistä kentistä tai lisätä linkin datan tietomalliin. 
    • ​​
  4. Määrittele data-aineistolle tila, jos lisäät useita data-aineistoja eri vuosilta. 
    • Valmisteilla: data-aineisto ei ole vielä valmis julkaistava versio vaan se on vasta luonnos. Valmisteilla olevat aineistot ovat julkaistu käyttäjäyhteisön kommentoitavaksi, mutta ei vielä hyödynnettäväksi. 
    • Voimassa: data-aineisto on ajan tasalla ja hyödynnettävissä. 
    • Arkistoitu: data-aineiston sisältö ei ole enää ajankohtaista, mutta sitä voi käyttää esimerkiksi vertailuun uudemman version kanssa.
  5. Jos lisäät paikkatietodataa, kerro mitä koordinaatistoa datassasi käytetään ja kerro metreissä, kuinka tarkasti datasi on eroteltu.
  6. Jos lisäät aineiston, jossa on dataa esimerkiksi eri viikoilta tai kuukausilta, kerro, kuinka tarkasti data on eroteltu. Esimerkiksi viikko, kuukausi tai päivä.
  7. ​​Jos aineisto sisältää dataa tietyltä ajanjaksolta, valitse päivämäärät.
  8. Valitse lopuksi Tallenna tietoaineisto. Tämä tallentaa tietoaineiston ja tekee laatu- ja turvatarkastuksen lisätylle datalle. Tarkastuksessa saattaa kestää jonkin aikaa. Jos haluat lisätä samalla kerralla tietoaineistolle useamman data-aineiston, valitse Tallenna ja lisää toinen.
    • ​​​​​​ 
    • Laatu- ja turvatarkastuksella varmistamme, että palveluun ei lisätä esimerkiksi viruksia tai muuten haitallisia data-aineistoja. Data-aineistolle lasketaan tarkastuksen aikana SHA256-tarkistussumma, joka varmistaa aineiston eheyden ja alkuperäisyyden. Tarkistussumman avulla käyttäjä voi varmistua siitä, että ladattu aineisto vastaa alkuperäistä eikä ole muuttunut välissä, eli että latauksen mukana ei tule mitään ylimääräistä. Näet tarkistussumman data-aineiston teknisistä lisätiedoista. Voit tarkistaa lataamasi aineiston SHA-summan useilla erilaisilla ilmaisilla tai kaupallisilla sovelluksilla.

On suositeltavaa ladata sama data useassa eri tiedostomuodossa. Tämä lisää datan saavutettavuutta ja uudelleenkäyttöä. Esimerkiksi Helsingin julkisen liikenteen käyttäjämäärät ovat tarjolla CSV-taulukkona ja rajapintana.

Lisää dataa yksityishenkilönä

Voit lisätä avoindata.fi:hin dataa yksityishenkilönä, jos olet koonnut tai tuottanut lisättävän aineiston itse. Kaikki yksityishenkilöiden julkaisema data löytyy palvelustamme Yksityishenkilöt-organisaation alta. Organisaation ylläpidosta vastaavat avoindata.fi:n ylläpitäjät. 

Hae jäsenyyttä Yksityishenkilöt-organisaatioon

Hae ensin jäsenyyttä sisäänkirjautuneena Yksityishenkilöt-organisaation sivulta.

 

Valitse rooliksi Muokkaaja - Editor, sillä Yksityishenkilöt-organisaatioon ei voi saada ylläpitäjän oikeuksia.

Ylläpito käsittelee hakemuksesi muutaman arkipäivän kuluessa.

Älä siis luo omaa organisaatiota kun lisäät palveluun dataa yksityishenkilönä. Kaikki Yksityishenkilöt-organisaatioon kuuluvat näkevät toistensa yksityiset tietoaineistot, mutta jokainen käyttäjä voi muokata vain omia tietoaineistojaan.

 

Älä lisää organisaatioiden tuottamaa dataa Yksityishenkilöt-organisaatioon vaan luo tarvittaessa palveluun uusi tuottaja ja lisää data omalle organisaatiollesi.

Kun olet Yksityishenkilöt-organisaation jäsen, voit lisätä dataa palveluun.

Lue ohjeet datan lisäämiseen edellisestä osiosta

Datan lisääminen harvestoimalla

Harvestoinnilla tarkoitetaan datan automaattista keräämistä eri sivustoilta yhteen paikkaan, kuten avoindata.fi:hin. Harvestointi ja siihen liittyvät käytännöt sovitaan aina yhteistyössä datan avaajan kanssa.

Harvestoitavien lähteiden tietoaineistot löytyvät siis ajantasaisina paitsi lähteiden omista palveluista, myös avoindata.fi:stä. Harvestointi helpottaa datan löytämistä, sillä käyttäjä voi etsiä dataa keskitetysti yhdestä paikasta monen eri sivuston sijaan.

Kaikki avoindata.fi-palveluun lisätyt tietoaineistot harvestoidaan Euroopan dataportaaliin.

Lue lisää harvestoinnista.