Sanasto

Tämä käsitelista kuvaa keskeisimpiä termejä ja niiden käyttötarkoitusta tämän dokumentin yhteydessä, ja listan käsitteet eivät ole välttämättä yleispäteviä määritelmiä.

Aggregointi
Karkeistuksella/aggregoinnilla tarkoitetaan tiedon uudelleenryhmittelyä yhden tai useamman tekijän perusteella karkeammalle tasolle. Tiedot voidaan karkeistaa yleiselle tasolle (aggregoida) tai muuttaa tilastolliseen muotoon siten, etteivät yksittäistä henkilöä koskevat tiedot ole enää tunnistettavassa muodossa.

Anonymisointi
Tietojen käsitteleminen niin, että henkilöiden tunnistaminen suoraan tai välillisesti ei enää ole mahdollista. Tunnistetiedot voidaan esimerkiksi poistaa tai yleistää sellaiselle tasolle, ettei yksittäinen henkilö ole enää tunnistettavissa. Tunnistetietoja ovat esimerkiksi nimet, osoitteet, puhelinnumerot tai henkilötunnukset. 

Lähde: Anonymisoinnista tietosuojavaltuutetun toimiston sivuilla.

Avoin data
Avoin data on digitaalisessa muodossa olevaa koneluettavaa tietoa, joka on kaikkien vapaasti käytettävissä mihin tahansa tarkoitukseen, kunhan sen alkuperäinen lähde mainitaan. Avoin data voi olla esimerkiksi väestönlaskentatietoja, karttatietoja tai vaikkapa reaaliaikaista dataa bussien sijainneista.

Avoin lähdekoodi
Avoin lähdekoodi (open source) tarkoittaa tietokoneohjelmien avoimia tuottamis- ja kehitysmenetelmiä, jotka tarjoavat käyttäjälle mahdollisuuden tutustua ohjelman lähdekoodiin ja muokata sitä omien tarpeidensa mukaisesti. Avoimen lähdekoodin periaatteisiin kuuluu myös vapaus käyttää ohjelmaa mihin tahansa tarkoitukseen ja kopioida ja levittää sekä alkuperäistä että muokattua versiota.

Lähde: Avoimesta lähdekoodista Wikipediassa.

Avoin rajapinta
Ohjelmointirajapinta, jonka kaikki ominaisuudet ovat julkisia ja jota voi käyttää ilman rajoittavia ehtoja. Avoimen rajapinnan käyttö on maksutonta, eikä käyttäjän tarvitse kysyä lupaa rajapinnan haltijalta tai kertoa etukäteen, mihin tarkoitukseen hän aikoo rajapintaa käyttää. Avoimen rajapinnan rajapintakuvauksen ja dokumentaation tulee olla avoimesti kaikkien saatavilla. Lisäksi rajapinnan tulee olla testattavissa.

Lähde: avoinrajapinta.fi 

CKAN 
The Comprehensive Knowledge Archive Network (CKAN) on Open Knowledge Foundation kansalaisjärjestön vuonna 2007 julkaisema ja jatkokehitetty avoimen lähdekoodin tiedonhallintajärjestelmä, joka on suunniteltu erityisesti avoimen datan julkaisemiseen ja hakemiseen. Ks. datakatalogi.

Lähde: CKAN-ohjelmiston sivut (englanniksi).

Creative Commons
Creative Commons on ei-kaupallinen organisaatio, joka edistää luovuuden ja tiedon jakamista ja käyttöä. CC-lisenssit ovat standardoitu ja kansainvälisesti tunnettu tapa myöntää oikeuksia mm. datan hyödyntämiseen, jatkojalostamiseen ja jakamiseen.

Lähde: Creative Commonsin verkkosivut

Data
Datalla tarkoitetaan digitaalisesti tallennettua, merkeistä ja symboleista koostuvaa koneellisesti luettavissa olevaa potentiaalista informaatiota, joka voi muodostaa esimerkiksi dokumentteja, tietokantoja ja audiotallenteita. Se voidaan ymmärtää raaka-aineena, jota jalostamalla syntyy merkityksellistä informaatiota.

Lähde: P2PU:n avoin kulttuuridata -kurssi.

Datakatalogi
Datakatalogi on strukturoitu metadatarekisteri, johon on yhdistetty metadataa useampien julkisten organisaatioiden hallussa olevista aineistoista. Datakatalogit voivat olla: 
1) kansallisia (esimerkiksi avoindata.fi ja data.gov.uk), 
2) seudullisia (Washington D.C. tai Helsinki Region Infoshare),  
3) kaupunkien ylläpitämiä (San Francisco ja Tampere), 
4) yksityisten tahojen ylläpitämiä (Sunlight Foundation - National datacatalog). 

Lähde: Julkinen data - johdatus tietovarantojen avaamiseen

Harvestointi
Harvestoinnilla tarkoitetaan datan automaattista keräämistä eri sivustoilta yhteen paikkaan, kuten avoindata.fi:hin. Avoindata.fi harvestoi esimerkiksi Paikkatietohakemistoa, joilloin Paikkatietohakemiston aineistot löytyvät automaattisesti myös avoindata.fi:stä. Harvestointi helpottaa datan löytämistä, sillä voit etsiä dataa keskitetysti yhdestä paikasta monen eri sivuston sijaan. 

Informaatio
Informaatiolla tarkoitetaan esimerkiksi tekstiä tai bittijonoa, joka on laadittu kuvaamaan tiettyä asiantilaa. Mitä tarkemmin informaatio kuvaa asiantilaa, sitä suurempi on sen informaatiosisältö. Informaatio jalostuu datasta.

Lähde: Tieteen termipankki informaatio.

Koneluettavuus
Tietosisältö on rakenteistettu siten, että tietokone pystyy käsittelemään sisältöä.

Lähde: Tieteen termipankki koneluettavuus.

Käyttöehdot 
Ehdot, jotka koskevat immateriaalioikeuden, oikeuden tietosuojaan tai muun oikeuden suojaaman kohteen hyödyntämistä

Lähde: Finto käyttöehdot.

Lisenssi
Lisenssi on sopimus, jossa kuvataan sisällön käyttöehdot. Lisenssistä käytetään myös sanaa käyttölupa. Lisenssin tavoite on selkeyttää ja helpottaa tietojen uudelleenkäyttöä.  

Metatieto
Tieto, joka kuvaa aineiston kontekstia, sisältöä tai rakennetta sekä ohjaa ja dokumentoi sen käsittelyä ja hallintaa.

Lähde: Finto metatieto.

Ohjelmointirajapinta
Ohjelmointirajapinta (englanniksi Application Programming Interface, API) on dokumentoitu tekninen rajapinta, joiden avulla ohjelmistot, sovellukset tai järjestelmät voivat vaihtaa keskenään tietoa tai toimintoja.

Lähde: Application Programming Interfaces in Governments: Why, what and how (englanniksi) 

Omadata
Omadata (englanniksi MyData) on henkilötietojen hallinnan ja käsittelyn periaate, jonka mukaan ihmisillä on oltava mahdollisuus hallita, hyödyntää ja luovuttaa eteenpäin heistä kerättäviä henkilötietoja (esim. terveystiedot, energiatiedot tai ostotiedot). Omadata ei ole avointa dataa.

Lähde: My data - johdatus ihmiskeskeiseen henkilötiedon hyödyntämiseen.

Pseudonymisointi
Pseudonymisointi tarkoittaa henkilötietojen käsittelemistä siten, että henkilötietoja ei voi yhdistää tiettyyn henkilöön ilman lisätietoja.

Raakadata
Raakadata on koneellisesti luettavissa oleva dataa, johon ei yleensä kohdistu immateriaalioikeuksia. 

Tiedolla johtaminen
Tietojohtamisen osa-alue, joka tähtää tietoperustaiseen päätöksentekoon ja sen mahdollistamiseen.

Lähde: Finto tiedolla johtaminen.

Tiedon johtaminen
Tietojohtamisen osa-alue, jossa tiedonhallinnalla, tietovirtoja ohjaamalla ja tiedon laatua tarkkailemalla ylläpidetään ja kehitetään tiedon hyödyntämisen edellytyksiä.

Lähde: Finto tiedon johtaminen.

Tiedonhallinta
Tietoprosessien järjestäminen siten, että tietojen saatavuus, löydettävyys ja hyödynnettävyys eri tarkoituksiin pyritään varmistamaan tiedon elinkaaren ajan.

Lähde: Finto tiedonhallinta.

Tiedostomuoto 
Tiedostomuoto, johon dataa tallennetaan. Määrittää tietokoneelle tallennetun tiedoston tallennusmuodon eli rakenteen. Esimerkkejä: CSV, XML.

Lähde: Tiedostomuodoista Wikipediassa

Tieto
Tieto on todenmukaista ja perusteltavaa informaatiota, jolle vastaanottaja on antanut merkityksen. Tieto jalostuu informaatiosta.

Lähde: Termipankki tieto.

Tietoaineisto
Tietoaineisto on yksilöitävissä oleva kokoelma tietoa.

Lähde: Termipankki tietoaineisto.

Tietojohtaminen
Johtaminen siten, että edistetään organisaation kykyä luoda arvoa tiedolla ja osaamisella.

Lähde: Finto tietojohtaminen.

Tietojärjestelmä    
Tietojärjestelmällä tietojenkäsittelylaitteista, ohjelmistoista ja muusta tietojenkäsittelystä koostuvaa kokonaisjärjestelyä.

Lähde: Laki julkisen hallinnon tiedonhallinnasta.

Tietotilinpäätös
Tietojohtamisen tukena hyödynnettävä raportti, joka kuvaa organisaation tietojenkäsittelyn ja tiedonhallinnan tilaa.

Lähde: Finto tietotilinpäätös.

Tietovaranto
Tiettyä tarkoitusta varten muodostettu, loogisesti tai fyysisesti yhteenkuuluvien tietojen muodostama tietoaineisto tai tietoaineistojen kokoelma.

Lähde: Finto tietovaranto

WFS-rajapinta 
WFS (Web Feature Service) on standardoitu ohjelmistoriippumaton tekniikka ja rajapinta, jonka kautta paikkatietoaineistoja voidaan jakaa käyttäjille vektorimuodossa yleensä ajantasaisina.

Lähde: Ohje WFS-rajapinnan käyttöön (pdf).

WMS-rajapinta 
WMS (Web Map Service) on standardoitu ohjelmistoriippumaton rajapinta, jonka kautta paikkatietoaineistoja voidaan jakaa käyttäjille kuvina (rasterimuoto, myös vektorimuotoinen svg-tiedosto on mahdollinen). WMS-palvelun kautta käytettyinä kartat ovat yleensä ajantasaisia. Niitä voidaan hyödyntää esimerkiksi taustakarttoina paikkatieto-ohjelmissa.

Lähde: Helsingin WMS-katselupalvelun kuvaus (pdf).

Yhteentoimivuus
Toimintaan liittyvien toimijoiden, prosessien ja tietojärjestelmien kyky toimia ja viestiä keskenään sellaisella tavalla tai siinä laajuudessa, että ne voivat rutiininomaisesti käyttää ja ymmärtää toistensa tietoja.

Lähde: Finto yhteentoimivuus.