4. Planering och genomförande

Denna fas kan till exempel genomföras så här

Personen som främjar informationsdelning i organisationen och dataförvaltaren

  • bedömer möjligheterna att dela data bl.a. i fråga om åtkomsträttigheter.
  • bedömer fördelarna och riskerna med och kostnaderna för att dela data 
  • bedömer behovet av att anonymisera och aggregera data
  • bedömer kvaliteten på de data som ska delas 
  • väljer en licens för att dela data
  • beslutar om att öppna data

En dataskyddsexpert 

  • konsulteras för att identifiera informationssäkerhets- och dataskyddsrisker.
  • konsulteras om behovet av att anonymisera och aggregera.

Organisationens IT-experter och den som ansvarar för data som delas

  • bedömer det tekniska genomförandet av datadelningen, till exempel om data delas som fil eller som gränssnitt.

Definition av information som ska öppnas

I det här skedet beskrivs sådant som det är bra för organisationen att bedöma och definiera när organisationen börjar planera att öppna information i praktiken. 

Det finns inga officiella rekommendationer för att definiera det informationsmaterial som ska öppnas.
I de organisationer som redan öppnat information har man i allmänhet i början identifierat vem som administrerar och ansvarar för den information som enligt planerna ska öppnas, för det bakomliggande datasystemet samt för eventuella användningsfall. I det här skedet kan man till exempel utnyttja en organisations informationshanteringsmodell, där organisationens datalager beskrivs. För att öppna information kan man även stödja sig på den ansvariga personens hjälp, huruvida organisationen har anvisat resurser för detta ändamål. 

De organisationer som öppnat information har gått igenom frågor som gäller ägande av informationsmaterial, upphovsrätt, utlämnande av information, dataskydd och informationssäkerhet. Om dessa omständigheter inte har hindrat att informationen delas har man tillsammans med informationsförvaltaren utrett hur informationsmaterialet i praktiken kan utformas och delas tekniskt sett. Samtidigt har man fastställt täckningen och precisionsnivån för det informationsmaterial som ska öppnas, med vilken informationsmaterialet kan öppnas så att informationens nyttopotential eller användbarhet inte blir lidande. 

I samband med definitionen av informationsmaterialet har man också bedömt

  • eventuella fördelar, risker och kostnader med att öppna informationen,
  • kvaliteten på det informationsmaterial som ska öppnas, metadata och publiceringsplats,
  • informationsmaterialets livscykel och
  • om tillräcklig datakommunikationskapacitet och användarstöd har planerats.

Dessa frågor beskrivs närmare i följande skeden. 

De organisationer som öppnat information har i regel strävat efter att utreda om det finns nationella eller internationella standarder för att öppna information (till exempel för informationsmodellering och format) eller om någon annan aktör redan har öppnat motsvarande data, varvid datamodellen kan användas även för det material man själv öppnar. 

Finlands sex största städer har skapat en lista över vissa internationella standarder (google sheets, på engelska) enligt vilka information också har delats i Finland. I materialens metadata till exempel i avoindata.fi används datamodellprofilen DCAT-AP. När man använder internationella standarder lönar det sig att beakta skillnaderna i lagstiftningen i olika länder, särskilt vad gäller dataskydd. 

Samtidigt är det också bra att fundera över om det i samband med att informationsmaterialet öppnas också är möjligt att öppna processen för produktion av informationsmaterial (beräkningsregler, algoritmer e.d.).

Mer information om ämnet finns i tjänsten data.europa.eu:

Tips av Helsinki Region Infoshare

Det viktigt att utse en tydlig instans (ansvarig) för öppnande av information, som utomstående kan kontakta i ärenden som gäller öppna data. Dessutom lönar det sig att ordna till exempel utvecklarmöten där man kan samla in respons redan innan informationen öppnas.

Meteorologiska institutets tips

Informationsförvaltaren bör beakta hur metadata och verbal beskrivning produceras ur materialet samt hur man svarar på ett eventuellt behov av användarstöd efter publiceringen.

Lantmäteriverkets tips

För att ägarskapet ska vara klart ska informationsförvaltaren gå igenom uppgifterna i detalj i fråga om upphovsrätt. Om data tidigare har licensierats som avgiftsbelagda ska övergångsperioden och kundkommunikationen planeras omsorgsfullt. Dessutom ska telekommunikationskapaciteten säkerställas.

Fördelar, risker och kostnader

I det här skedet beskrivs hur organisationen kan bedöma de fördelar, risker och kostnader som öppnandet av det planerade informationsmaterialet eventuellt medför. Du kan ladda ner ett verktyg för bedömning av fördelar, risker och kostnader från delen Metod för bedömning av nyttopotentialen, riskerna och kostnaderna för att öppna information.

Informationshanteringsnämnden har utfärdat en rekommendationssamling om tillämpningen av vissa bestämmelser om informationssäkerhet (finansministeriets publikationer 2021:65), enligt vilken hanteringen av informationsrisker är en fortlöpande verksamhet och det är bra om informationshanteringsenheten beskriver målen, principerna, ansvaren och de centrala förfarandena i anslutning till den. Ledningen ansvarar för organiseringen och resursfördelningen i anslutning till hanteringen av informationsrisker. Dessutom upprätthåller informationshanteringsenheten det informationsmaterial som bildas av resultaten av riskbedömningarna och riskhanteringsplanerna, samt bedömer regelbundet om det är helt eller delvis sekretessbelagt eller säkerhetsklassificerat.

Informationsförvaltningsnämnden har också utfärdat en rekommendation om bedömning av informationssäkerheten i den offentliga förvaltningen (Julkri), som innehåller anvisningar om användningen av den (finansministeriets publikationer 2022:43). Bedömningskriterierna stöder behoven av att utveckla och utvärdera informationssäkerheten inom hela den offentliga förvaltningen. Den kan användas som hjälp vid bedömningen av informationshanteringslagen, förordningen om säkerhetsklassificering samt delvis också vid bedömningen av huruvida kraven på informationssäkerhet i dataskyddsförordningen uppfylls.

Digitaalinen turvallisuus

Vid planeringen och genomförandet av öppnandet av information är det viktigt att säkerställa den digitala säkerheten. Digital säkerhet omfattar frågor som gäller riskhantering, kontinuitetshantering och beredskap samt cybersäkerhet, informationssäkerhet och dataskydd. Medborgare, företag och samfund måste även i en digital miljö kunna lita på etiskt hållbara, öppna och transparenta tjänster inom den offentliga förvaltningen.

I statsrådets principbeslut om digital säkerhet inom den offentliga förvaltningen (Finansministeriets publikationer 2020: 23) fastställs utvecklingsprinciperna och de centrala tjänsterna för främjande av säkerheten i den digitala verksamhetsmiljön. Finansministeriet har tillsatt en strategisk ledningsgrupp för digital säkerhet inom den offentliga förvaltningen för att främja digitaliseringen och balansen inom den digitala säkerheten.

Bekanta dig närmare med åtgärder och material som gäller utvecklingen av den digitala säkerheten.

Metod för bedömning av nyttopotential, risker och kostnader i anslutning till öppnande av information

I verksamhetsmodellen för informationsdelning har man utvecklat en bedömningsmetod som hjälper organisationer inom den offentliga förvaltningen att bedöma nyttopotentialen för öppnande och delning av eget informationsmaterial samt riskerna och kostnaderna i anslutning till delning. Bedömningsmetoden kallas också HRK-metoden (nytta, risker och kostnader).

HRK-Ladda ner bedömningsverktyget HRK (på finska, Excel-fil) 

HRK-verktyget är en Excel-blankett som ger ett sammandrag av bedömningsresultaten utifrån de svar du angett. Utifrån svaren fastställs nyttopotentialen, riskprofilen och kostnaderna för öppnandet. Det är bra att beakta att det sammandrag som fås på basis av svaren endast är en riktgivande sammanställning av olika observationer – det är inte en rekommendation. Varje organisation fattar självständigt beslut i anslutning till öppnande av information med beaktande av lagstiftningen (bl.a. rätten att få och lämna ut information), de officiella rekommendationerna och organisationens egna riktlinjer. Sammanfattningen kan till exempel användas som bakgrundsmaterial för att motivera eventuella fördelar med att öppna information för beslutsfattande instanser.

HRK-metoden grundar sig på bedömningsmetoder som används av finländska och utländska organisationer inom den offentliga förvaltningen. Den första versionen av metoden har utvecklats av bland annat National Institute of Standards and Technology, Washingtons universitet, Harvards universitet och flera andra expertorganisationer.

Med hjälp av bedömningsmetoden kan man:

  • prioritera ordningen för öppnande av informationsmaterial när resurserna är begränsade
  • identifierar informationsmaterial vars öppnande är förknippat med olika risker
  • få en uppfattning av kostnaderna för att öppna informationsmaterial
  • identifiera informationsmaterial som har störst nyttopotential för externa intressentgrupper (informationsanvändare) 
  • kartlägga eventuella inkomster från informationsdelningen
  • göra öppnandet av informationsmaterial och beslutsfattandet i anslutning till delandet systematiskt

bedömningsmetoden är riktad till de personer inom organisationer som ansvarar för att öppna information. Dessa kan vara till exempel de som ansvarar för informationsmaterial, informationsförvaltningschefer eller de som koordinerar öppnandet av information. Dessutom lönar det sig att inkludera experter från varje delområde i bedömningens olika skeden, allt från tekniska experter till dataskyddsansvariga.

Säkerställande av dataskyddet

I detta skede beskrivs bedömningen av behovet av aggregering och anonymisering av det informationsmaterial som ska öppnas, samt organisationsspecifika rutiner för att säkerställa dataskyddet för det informationsmaterial som ska öppnas. Här beskrivs även genomförandet av den aggregering, anonymisering eller pseudonymisering som eventuellt behövs. 

Det finns inga officiella rekommendationer för bedömning av behovet av aggregering och anonymisering av information.

I de organisationer som redan öppnat information har man i regel mycket noggrant bedömt om det informationsmaterial som man planerat att dela är offentligt och om det eventuellt innehåller personuppgifter eller annan information som är kritisk för samhällets funktion. Om informationsmaterialet som enligt planerna ska öppnas innehåller information som på något sätt är relaterad till människor eller samhällssäkerheten är det skäl att med organisationens dataskyddsombud diskutera öppnandet av informationsmaterialet och eventuell aggregering, anonymisering eller pseudonymisering. Även i övrigt lönar det sig att konsultera organisationens dataskyddsombud, andra sakkunniga i dataskyddsfrågor eller nätverk för att bedöma behovet av aggregering och anonymisering av informationsmaterial. 

Enligt offentlighetsprincipen (offentlighetslagen 621/1999) är myndigheternas handlingar offentliga om inte något annat särskilt föreskrivs i offentlighetslagen eller någon annan lag. Det är dock viktigt att beakta att en offentlig handling kan innehålla personuppgifter och att utlämnande av personuppgifter alltid kräver en lagenlig grund, även om det är fråga om en offentlig handling. Myndigheten ska bedöma om personuppgifterna i handlingen kan lämnas ut. Offentlig information innebär alltså inte nödvändigtvis att informationen kan offentliggöras, eftersom en offentlig handling kan innehålla personuppgifter som inte kan offentliggöras även om det inte är fråga om sekretess. Sekretess förutsätter en sekretessgrund enligt offentlighetslagen och sekretessbestämmelser finns också i speciallagstiftningen. 

Personuppgifterna kan tas bort från informationsmaterialet genom anonymisering. Det bör dock observeras att så länge som en person kan identifieras direkt på basis av uppgifterna, eller uppgifterna kan återställas till en identifierbar form är de fortfarande personuppgifter och omfattas av dataskyddsförordningen.

Anonymisering  innebär behandling av personuppgifter så att en person inte längre kan identifieras utifrån dem. Uppgifterna kan till exempel sammanföras till en allmän nivå (aggregeras) eller ändras till statistisk form så att uppgifterna om en enskild person inte längre kan identifieras. Identifieringen ska förhindras på ett oåterkalleligt sätt och så att den personuppgiftsansvarige eller någon annan utomstående aktör inte längre, med de uppgifter de förfogar över, kan ändra uppgifterna tillbaka till en identifierbar form.

Pseudonymisering innebär att personuppgifter behandlas så att de inte längre kan kopplas till en viss person utan tilläggsuppgifter. Sådana tilläggsuppgifter ska förvaras noggrant åtskilda från personuppgifterna.

Dataombudsmannens byrå är en nationell tillsynsmyndighet som övervakar att dataskyddslagstiftningen följs. Dataombudsmannen och de biträdande dataombudsmännen är självständiga och oberoende i sina uppgifter. Vid dataombudsmannens byrå finns en expertnämnd (mandatperioden är 1.10.2020–30.9.2023) som har till uppgift att på begäran av personuppgifter. Mer information på webbsidorna för dataombudsmannens byrå.

Enligt EU:s allmänna dataskyddsförordning ska vissa personuppgiftsansvariga och personuppgiftsbiträden utse ett dataskyddsombud. Skyldigheten gäller alla myndigheter och organ inom den offentliga förvaltningen. Dataskyddsombudet ger råd gällande dataskydd till den personuppgiftsansvarige och de anställda som behandlar personuppgifter. Han eller hon följer upp hur förordningen följs samt hur informationen och utbildningen om dataskydd genomförs i den egna organisationen. Dataskyddsombudet ger råd om konsekvensbedömningar och fungerar som kontaktpunkt för tillsynsmyndigheten.

Läs mer:

Statskontorets praxis

Statskontorets analytiker genomför analyser på uppdrag. I analyserna används i huvudsak statens gemensamma informationsplattform, dit material som definieras i uppdraget förs. Med hjälp av en datanavigator fastställer analytikern tillsammans med uppdragsgivaren de informationsområden som behövs för analysen. I navigatorn beskrivs uppgifterna i statens gemensamma serviceproducenters system. I beskrivningen definieras om fältet kan innehålla person- eller sekretessbelagd information tillsammans med serviceproducenten och ämbetsverken. För de beskrivna fälten skapas på förhand fastställda bestämmelser om maskering.

Analytikern beställer uppdragsenliga data av dataingenjören. Dataingenjören hämtar de kolumner som behövs för uppdraget från serviceproducenternas system via gränssnitt, och avlägsnar eventuella onödiga kolumner för att minimera informationen och maskera uppgifterna i enlighet med regelverket:

  • Textfält som eventuellt innehåller personuppgifter raderas
    • T.ex. Förklaringarna till uppföljningsobjekt 1 och 2 tas bort från uppgifterna om ekonomisk uppföljning
    • T.ex. Fält med personnamn eller e-postadresser raderas
  • I materialet krypteras personens identifikationskoder med krypteringsalgoritm så att det ursprungliga värdet inte kan identifieras samtidigt som identifikationskoden bevaras
    • Innehållet i de fält som innehåller personbeteckning behandlas t.ex. med hjälp av kryptografisk tätningsfunktion som en teckensträng från vilken det ursprungliga värdet inte direkt kan härledas
  • Statskontoret har inte nödvändigtvis rätt till uppgifter på en viss precisionsnivå, men aggregeringar som producerats av uppgifterna kan vara offentliga. I dessa fall förgrovar (aggregerar) tjänsteleverantören materialet tillsammans med ämbetsverken till en fastställd offentlig nivå specifikt för varje fall. Med förgrovning/aggregering avses i detta sammanhang att informationen omgrupperas till en grövre nivå på basis av en eller flera faktorer.
    • T.ex. I stället för verksamhetsenheten anges summan eller medeltalet på bokföringsenhetsnivå
    • T.ex. Resor till olika kontinenter anges i stället för resor till ett enskilt land

Den maskerade, minimerade informationen överförs till en analysplattform för analytikerns bruk. Analytikern genomför analysen utifrån maskerade data som inte innehåller direkta personuppgifter. Om analytikern ändå upptäcker att data eventuellt innehåller direkta personuppgifter, meddelar han eller hon detta till dataingenjören, så att maskeringsregelverket för fälten i fråga kan korrigeras. Varmed materialet inte behandlas innan korrigeringen har gjorts och data är fri från personuppgifter. När analysen har genomförts förgrovar analytikern resultatet till en statistisk nivå innan resultaten presenteras för uppdragsgivaren, dvs. säkerställer att de grupper som presenteras innehåller uppgifter om minst fem personer, så att individen inte kan identifieras i resultaten.

Statistikcentralens praxis

Vid säkerställandet av dataskydd för informationsmaterial är det viktigt att granska att det i det informationsmaterial som behandlas inte finns målenheter vars identitet eller egenskaper kan avslöjas direkt eller indirekt. Direkt identifiering kräver att informationsmaterialet innehåller en entydig egenskap hos målenheten, till exempel namn, adress, FO-nummer. Det är fråga om indirekt identifiering när målenheten kan identifieras med hjälp av flera egenskaper, till exempel kommundirektören som yrkesuppgift och kommunen där personen arbetar som tilläggsuppgift. Egenskaperna hos en enskild målenhet kan avslöjas även utan att målenheten identifieras i en situation där en större grupp som målenheten tillhör delar vissa egenskaper som är lika. Till exempel i enkäten om arbetshälsa har alla personer vid en viss avdelning svarat på enkäten och uttryckt sitt missnöje med den fysiska arbetsmiljön.

Vid bedömningen av risken för avslöjande är det stor skillnad om man talar om material på enhetsnivå eller sammanställd, dvs. på något sätt aggregerad information. När man behandlar material på enhetsnivå, där egenskaperna hos en enskild målenhet granskas objektspecifikt, kan indirekt avslöjande fortfarande vara möjligt även om uppgifterna har förgrovats enligt egenskaper. Ett bra exempel är långvariga informationsmaterial som granskar målenhetens situation på längre sikt. En personens flytt- eller arbetshistoria kan mycket snabbt leda till en situation där möjligheten till indirekt identifiering inte kan uteslutas även om uppgifterna skulle förgrovas något. I fråga om enhetsmaterial ska risken för avslöjande granskas omfattande med beaktande av flera egenskaper samtidigt. I allmänhet leder anonymiseringen av enhetsmaterial med hjälp av förgrovningar och avgränsning av information till att små datamaterial som främst används för exempeländamål produceras. Alternativa dataskyddsmetoder är till exempel användning av förvirrande dataskyddsmetoder, (fler)imput eller produktion av syntetiskt material. 

Statistikcentralen har producerat anonymt informationsmaterial på enhetsnivå som är avsett för undervisningsbruk. Resultaten från dessa material kan vara riktgivande, men de lämpar sig under inga omständigheter för statistiska utredningar eller vetenskaplig forskning. Mer information om undervisningsmaterialen.

I fråga om sammanställd eller aggregerad information talar man om uppgifter där man har samlat värden som flera målenheter fått för egenskapen. Dessa uppgifter kan delas in i frekvenstabeller som beskriver antalet målenheter och mängdtabeller som beskriver egenskapernas värden. I tabellerna anges till exempel egenskapens summor eller medelvärden. I fråga om frekvenstabellerna fastställs risken för avslöjande enligt varje cells cellvärde som ett tröskelvärde. Cellen ska innehålla minst denna mängd målenheter. Tröskelvärdet beror på de egenskaper som granskas. Statistikcentralen producerar den officiella befolkningsstatistiken delvis till och med genom att inkludera enskilda personer i statistiken. I allmänhet kräver skyddet dock minst tre målenheter i cellen. Med detta minimivärde undviker man en situation där två målenheter som delar samma egenskaper kan dra slutsatser om varandras värden utifrån publicerad information. Vid Statistikcentralen används ett högre tröskelvärde när man granskar uppgifter på regional nivå som är noggrannare än kommunens (tröskelvärdet kan stiga till femtio när man granskar rutdata) och i allmänhet är tröskelvärdet tio om det är fråga om särskilda datagrupper eller brottsuppgifter enligt dataskyddsförordningen. 

I fråga om mängdtabeller räcker det inte med att enbart granska tröskelvärdet för att förhindra slutledningen av värdena för egenskapen hos en annan målenhet, om målenheterna finns i samma cell. Då använder Statistikcentralen dessutom dominansregeln för identifiering av celler som riskerar att avslöjas. Med dominansregeln skyddas celler där en enskild målenhet eller flera målenheter tillsammans dominerar, dvs. producerar största delen av cellens värde. Om man i cellen till exempel granskar företagens omsättning enligt näringsgren och region vill man inte att ett enskilt stort företags värde ska kunna härledas från en cell där de övriga företagen har en mycket liten omsättning i förhållande till det största.

De primära cellerna med risk för avslöjande kan fastställas med hjälp av tröskelvärdet eller dominansregeln. Om uppgifterna raderas, dvs. täcks över i det informationsmaterial som publiceras, är det lätt att omräkna deras värden om informationsmaterialet också innehåller marginalbelopp, dvs. summor över rader och kolumner. Då ska kompletterande täckning användas för att säkerställa att uppgifterna skyddas. När det gäller kompletterande täckning finns det specialprogram som säkerställer ett tillräckligt skydd för sekundär täckning vid bestämning av celler. Sådana specialprogram är till exempel Tau-Argus och R-paketet sdcTable. Mer information om programvara i GitHub (på engelska).  

Tilläggsuppgifter om skydd av uppgifter i Statistikcentralens material som är riktat till forskare:

HRI:s instruktion för bedömning av behovet av aggregering och anonymisering av enkätdata

Helsinki Region Infoshare har tillsammans med Helsingfors stads dataskyddsombud skapat anvisningar för att öppna förfrågningsdata (och andra data som innehåller personuppgifter)(på finska)

VAHTI-arbetsgruppernas goda praxis, stödmaterial och andra publikationer 

VAHTI är samarbets-, berednings- och samordningsorgan för organisationer som ansvarar för utvecklandet av den digitala säkerheten inom den offentliga förvaltningen och produktionen av centrala tjänster. Organisationerna kan utnyttja bästa praxis och VAHTI-anvisningar för att utveckla säkerhetens olika delområden. 

VAHTI-verksamheten överfördes till Myndigheten för digitalisering och befolkningsdata i början av år 2020.

Föråldrade rekommendationer kan utnyttjas genom att tillämpa och beakta den ändrade lagstiftningen.

Myndigheten för digitalisering och befolkningsdata har genomfört flera Ett digitalt säkert liv -utbildningar i eOppiva, till exempel webbutbildningen Riskhantering i den digitala världen samt webbutbildningen Dataskyddets ABC - Djupdykning i dataskyddet.

Val av delnings- och filformat

I det här skedet beskrivs i vilka format informationen kan delas och vilket format det lönar sig att beakta när man väljer. 
Det finns inga officiella rekommendationer för definitionen av delnings- och filformat för information som ska öppnas.

Vid valet av sätt för att dela informationsmaterial ska man beakta de lagar som gäller rätten att få uppgifter, utlämnande av uppgifter och tillhandahållande av uppgifter i maskinläsbar form och de skyldigheter som följer av dem, såsom paragraferna 22 och 24 i informationshanteringslagen. Dessutom ska eventuella ändringar som behövs i informationsmaterialet beaktas, såsom pseudonymisering eller anonymisering.

I de organisationer som redan öppnat information har informationen delats som filer, via programmeringsgränssnitt eller via en laddningstjänst. Det tekniska genomförandet av informationsdelningen beror i hög grad på hurdana lösningar för delning som har utvecklats i informationssystemet. I systemet kan man få ut information i filformat som en rapport av batchtyp och/eller via programmeringsgränssnittet. I äldre datasystem har man mer sällan utvecklat eller kan mer sällan utveckla ett programmeringsgränssnitt, varmed det eventuellt är möjligt att dela information endast som batchfiler. Om möjligt är det bra att dela informationsmaterialet i flera olika format, till exempel så att det utöver gränssnittet finns en fil.

När öppna data publiceras är det bra att alltid när det är möjligt använda öppna dataformat, dvs. filformat. Mer information om val av öppet filformat (på engelska) i tjänsten data.europa.eu.

Vilket delningssätt lämpar sig för hurdana data?

Delning av information som fil

Fil lämpar sig för små och/eller statiska datamaterial som ändras lite eller sällan. Data som har öppnats på ett högklassigt sätt delas i öppet filformat.

Med öppet filformat avses ett sådant icke-kommersiellt filformat som vem som helst kan utnyttja avgiftsfritt. Användningen av öppna filformat begränsas inte av upphovsrätt, patent, varumärken eller andra begränsningar. Till exempel Microsofts filformat .docx- eller. xslx är inte öppna, utan kommersiella, och det är svårt att använda dem med gratis programvara. Öppna filformat möjliggör i allmänhet vidareutnyttjande av data som inte är beroende av programvara. Detta är viktigt eftersom kommersiella rättigheter inte begränsar vidareutnyttjandet av data.

I listan nedan finns tips för publicering av olika typer av datamaterial:

  • Data i textform: TXT. Det enklaste och säkraste filformatet för att publicera text är.txt.
  • Data i tabellform: CSV. Det bästa och enklaste filformatet för tabeller är.csv (Comma-separated Values). Det är enkelt att skapa filer i CSV-format med allmänna kalkylprogram som Microsoft Office Excel genom att välja csv som filformat när man ska spara.
  • Geografisk information, små vektordata: GeoJSON, KML, Esri shapefile (shp) eller GeoPackage. I de två första används det globala koordinatsystemet WGS84 för att beskriva koordinaterna. Systemet är lätt att hantera med flera olika program och verktyg. Shp-filen stöder å sin sida flera koordinatsystem, även sådana som utvecklats för finländska förhållanden.
  • Geografisk information, stora rasterdata: GeoTIFF eller NetCDF. Data kan publiceras i rasterformat till exempel i GeoTIFF-filformat. 

Om information delas i PDF-format är det bra att beakta vilken PDF-version som används och se till att data är i maskinläsbart format. På 1990-talet utvecklade och patenterade Adobe PDF som kommersiellt filformat. År 2008 standardiserades version 1.7 (ISO 32000-1) till en nästan öppen standard, men en del av dess egenskaper var fortfarande endast Adobes egendom (till exempel Adobe XML Forms Architecture, Adobe JavaScript). I versionen PDF 2.0 (ISO-32000-2) som publicerades år 2017 var alla egenskaper emellertid öppna. Mer information om öppna filformat (på engelska)

Bekanta dig med Wikipedias omfattande lista över öppna filformat (på engelska).
Enligt Tim Berners-Lees modell med fem stjärnor (på engelska) får data som publicerats i ett öppet filformat minst 3/5 stjärnor.

En stjärna för öppna data: Gör din information tillgänglig på webben, i vilket format som helst, men under öppen licens. Två stjärnor för strukturerad/maskinläsbar data: Gör din information tillgänglig som strukturerad data (t.ex. i Excel istället för en inskannad bild av en tabell). Tre stjärnor för öppen mjukvara: Använd icke-proprietära format (t.ex. CSV istället för Excel). Fyra stjärnor för länkbar data: Använd URI:er för att identifiera ting och öppna standarder från W3C (RDF och SPARQL) för att uttrycka påståenden om dem. Fem stjärnor för länkad data: Skapa sammanhang genom att länka dina data till andras data
Tim Berners-Lees modell med fem stjärnor

Delning av information via programmeringsgränssnitt

Vad är API?

Programmeringsgränssnitt, dvs. API (Application Programming Interface), är dokumenterade gränssnitt som gör det möjligt för programvara, applikationer eller system att utbyta information eller funktioner sinsemellan. Programmeringsgränssnittet erbjuder information eller funktion i maskinläsbar, dokumenterad form så att någon annan programvara, applikation eller system kan utnyttja den programmässigt. 

I denna verksamhetsmodell avses samma sak med API, programmeringsgränssnitt och det tekniska gränssnitt som definieras i informationshanteringslagen. Anmärkningsvärt är att programmeringsgränssnittet inte avser användargränssnitt avsedda för slutanvändare, utan programmeringsgränssnittet används alltid av någon annan programvara, applikation, applikationskomponent eller system.

Varför använda programmeringsgränssnitt för att dela information?

Att dela information via programmeringsgränssnitt är på många sätt lönsamt och nyttigt, i synnerhet om det finns mycket information och informationen uppdateras ofta eller i realtid, det vill säga att det är fråga om så kallade dynamiska data. Tågtidtabeller eller väderleksuppgifter är exempel på sådana data. Det är dock bra att komma ihåg att även fildelning är till nytta särskilt för de personer och aktörer som inte kan utnyttja programmeringsgränssnitt. Om gränssnittet inte i övrigt används kan fildelning kräva betydligt mindre resurser av delaren än vad som behövs för att genomföra och underhålla det nya gränssnittet.

Programmeringsgränssnittet kan vara ett webbaserat fil- eller databasbaserat programmeringsgränssnitt som genomförts med till exempel REST, SOAP eller GraphQL -teknik. Det väsentliga är att programmeringsgränssnittet erbjuder information i maskinläsbar, dokumenterad form så att någon annan programvara, applikation eller system kan utnyttja den programmässigt. Det är bra att tillhandahålla informationen via webbaserade gränssnitt, om det är möjligt och ändamålsenligt. 

Webbaserade gränssnitt kan utnyttjas både i interna och externa gränssnitt och olika datasäkerhetskontroller kan genomföras i dem i stor utsträckning. Filformat som ska delas beror på dataöverföringsprotokollet, i webbaserade gränssnitt utnyttjas till exempel i allmänhet http-baserat dataöverföringsprotokoll eller -arkitektur, såsom REST. API-gränssnitten lämpar sig också väl för delning av statistikdata i databasform. Bekanta dig till exempel med materialet i Statistikcentralens öppna databasmaterial.  

Det är viktigt att organisationen definierar vilka eller hurdana informationsmaterial som erbjuds eller utnyttjas internt och externt via programmeringsgränssnitten, och vilka informationsmaterial som borde tas i bruk via gränssnitten. Internt tillhandahållande och utnyttjande kan göras via interna gränssnitt (internt API). Externt tillhandahållande och utnyttjande kan göras med partnergränssnitt (partner API) eller offentliga gränssnitt (offentligt API) enligt klassificeringen av information. Det väsentliga är att gränssnitten beaktas i organisationens övriga informationshantering och verksamhetsprocesser samt i målen för ledning genom information. 

Vid planeringen och utvecklingen av programmeringsgränssnitt lönar det sig att utnyttja de nationella API-principerna. API-principerna för den offentliga förvaltningen erbjuder aktörer inom den offentliga förvaltningen stöd och anvisningar för utveckling, hantering och filformat för programmeringsgränssnitt. API-principerna stöder bland annat definition, ansvarsfördelning, främjande av interoperabilitet, upphandling, testning och implementering av programmeringsgränssnitt. I samband med planeringen av gränssnittet är det bland annat viktigt att fastställa hur förändringarna i gränssnittets livscykelplan eller servicenivå ska hanteras.

Tilläggsuppgifter och stödmaterial för att utveckling, hantering och filformat för programmeringsgränssnitt:

Jämförelse av formerna för delning av information

Med hjälp av tabellen nedan kan man bedöma valet av lämplig form för delning. I tabellen strävar man efter att lyfta fram skillnader.

Jämförelse av fil och API

  Fil Gränssnitt (API)
Användarvänlighet Oftast enklast att använda. Små CSV-filer kan till exempel öppnas med vanliga kontorsprogram. I praktiken används gränssnitt ofta endast av personer som kan programmera.
Planeringen av gränssnittet påverkar hur lätt det är att använda. I planeringen är det bra att beakta gränssnittets hela livscykel.
Tekniskt kunnande som krävs av upprätthållaren Kräver ingen särskild teknisk kompetens. Kräver kompetens både i utveckling och underhåll av gränssnitt.
Mängden information Lite information Mycket information
Avgränsning av data Från data som publicerats som fil laddas alltid hela materialet på en gång. Data begränsas på basis av begäran eller så är det möjligt att söka alla uppgifter på en gång.
Gränssnittet kan också erbjuda filer.
Förändringstakt av data Filen lämpar sig i första hand för data som ändras mycket lite / sällan.
Om data ändras måste den uppdaterade versionen delas separat.
Gränssnitt rekommenderas för data som ändras ofta.
Uppföljning av användning Utmanande eftersom filen enkelt kan kopieras. Enkelt eftersom det går att samla in analyser från gränssnittsinbjudningar, t.ex. IP-adress, enkät, klockslag, datum, enkätsvar osv.
Praktiskt exempel Postnummer, statsbudgeten, de mest populära förnamnen, småskalig statistik Väder- och tidtabellsuppgifter, företagsuppgifter, rörlighet

Meteorologiska institutets delningssätt

Meteorologiska institutet delar sitt informationsmaterial från sina egna gränssnittstjänster och Amazons tjänst för öppna data.

Helsinki Region Infoshares tips för valet av delningssätt

Tjänsten Helsingfors Region Infoshare för städerna i huvudstadsregionen har sammanställt tips för bedömningen av den tekniska genomförbarheten. Frågorna nedan är till hjälp vid bedömningen. 

I vilket format kan man öppna data?​​​​​​

Som fil:

  • Fil där data upprätthålls (xlsx / csv / shp /...) 
  • Uppgiften tas manuellt ur systemet
  • Uppgiften tas automatiserat ur systemet
  • I allmänhet ett snabbt och avgiftsfritt sätt att öppna data, men kräver ofta manuell och minnesbaserad uppdatering

Via gränssnitt:

  • Programmeringsgränssnitt görs automatiskt för information som tas ur systemet
  • Programmeringsgränssnitt skapas i systemet / dess kopia
  • I början krävs mer arbete och resurser, men ingen separat uppdatering krävs

Frågor som det är bra att fundera på när man väljer dataformat:

  • Hur ofta uppdateras / uppdaterar man data?
  • Hur stor är datamängden?
  • Är data realtidsdata eller t.ex. årlig information?
  • Hur mycket manuellt arbete krävs för att redigera data?
  • Vad kan data användas till?
  • Finns det standarder?
  • Har någon annan aktör redan öppnat motsvarande data? Hur har det gjorts? Skulle det vara möjligt att öppna data i motsvarande format?

I Helsinki Region Infoshare har man utvecklat verktyget Datasette, som gör det möjligt att publicera data som är tillgänglig via gränssnitt i filformat. Mer information om verktyget Datasette på HRI:s webbplats (på finska).  

Definition av informationens kvalitet

I detta skede beskrivs hur kvaliteten på det informationsmaterial som ska öppnas kan bedömas, definieras och beskrivas.

Det finns inga officiella rekommendationer för definitionen av kvaliteten på det informationsmaterial som ska öppnas.

De organisationer som redan öppnat information har strävat efter att i beskrivnings- eller metadata beskriva sin bedömning av informationsmaterialets aktuella kvalitet med eventuella svagheter. Till exempel i tjänsten avoindata.fi kan kvalitetsbedömningen av uppgifterna anges i fältet Beskrivning av datamaterialets metadata eller läggas till utredningen som ett separat datamaterial i PDF-format. 

Det är viktigt att beakta att även om kvaliteten på det informationsmaterial som ska öppnas inte är så god som den instans som förvaltar informationen eller intressentgrupperna önskar, hindrar det inte nödvändigtvis att informationen delas. Informationsmaterialet kan delas genom att i metadata betona svagheter i informationens kvalitet.

Vid bedömningen och beskrivningen av informationsmaterialets kvalitet kan man utnyttja den offentliga förvaltningens gemensamma kvalitetskriterier och indikatorer som har utvecklats för att stöda en förbättring av kvaliteten på den offentliga förvaltningens information.

Kvalitetskriterier för information

Under ledning av Statistikcentralen, och genom ett omfattande samarbete inom den offentliga förvaltningen, har man utvecklat en allmän Kvalitetsram för information. Arbetet har gjorts som en del av Finansministeriets projekt för att utnyttja och öppna data. Kvalitetskriterierna och indikatorerna för informationen publicerades våren 2020. 

Med hjälp av kvalitetskriterierna för information kan man beskriva och bedöma kvaliteten på informationsmaterialet. De hjälper också användaren att bedöma om informationsmaterialet är av tillräckligt hög kvalitet för det avsedda användningsändamålet. På längre sikt stöder kvalitetskriterierna förbättringen av kvaliteten på informationsmaterial och datalager.

Kvalitetskriterierna är avsedda som ett flexibelt verktyg; alla kriterier eller i synnerhet alla indikatorer är inte nödvändigtvis relevanta i alla situationer eller informationsmaterial. Dessutom är det bra att observera att informationens användningsändamål påverkar vilken nivå som eftersträvas för varje kvalitetskriterium. Till exempel med tanke på aktualiteten borde informationen för ett användningsändamål uppdateras kontinuerligt (uppföljning av pandemin), medan det för den andra uppgiftens del räcker med en årlig granskning, eller mer sällan (gamla byggnaders läge). Även om kvalitetskriterierna jämte indikatorer utgör en hierarkisk struktur påverkar och länkar kvalitetskriterierna och mätarna till varandra.

Kvalitetsramens kvalitetskriterier, och i synnerhet indikatorerna för dessa, gäller strukturerade data. Kvalitetskriterierna för informationsmaterialet har med tanke på användarens perspektiv ordnats under tre frågeställningar.

Hur beskriver informationen verkligheten?

  • Aktualitet: Aktualiteten beskriver tidsdimensionen för informationen i informationsmaterialet. Aktualiteten är bättre ju närmare uppgiftens referenstidpunkt är nuet. Referenstidpunkten är den tidpunkt som uppgiften gäller.
  • Konsekvens (regelmässighet, logisk integritet): Konsekvens visar att informationsmaterialet är enhetligt och utan motstridigheter. Med konsekvens kan man också beskriva konsekvens mellan olika informationsmaterial.
  • Täckning (fullständighet): Täckningen beskriver informationsmaterialets eftersträvade tidsmässiga och regionala täckning samt de målenheter och egenskapsuppgifter som eftersträvas. Å andra sidan anger täckningen till vilka delar informationsmaterialet innehåller de eftersträvade uppgifterna.
  • Riktighet (felfrihet): Riktigheten beskriver hur uppgifterna i informationsmaterialet motsvarar verkligheten. Genom att granska informationens riktighet kan man också få fast systematiska förvrängningar i informationsmaterialet.
  • Noggrannhet (inte vilseledande): Noggrannheten beskriver hur väl uppgifterna i informationsmaterialet motsvarar det som eftersträvas och hur exakt informationen träffar rätt.

Hur har informationen beskrivits?

  • Spårbarhet (obestridlighet): Spårbarheten visar att ändringar i informationsmaterialet och dess uppgifter kan spåras. Informationens ursprung är känt.
  • Begriplighet (tolkningsbarhet, förståelse): Begriplighet beskriver hur omfattande datamaterialet har sådana metadata som hjälper att förstå informationen när den används.
  • Överensstämmelse med rekommendationerna (kompatibilitet, semantisk enhetlighet, enhetlighet): Överensstämmelse med rekommendationerna visar att informationsmaterialet och dess egenskapsuppgifter följer kända standarder, praxis och bestämmelser och att de har angetts i samband med informationsmaterialet.

Hur kan informationen användas?

  • Maskinläsbarhet: Maskinläsbarhet beskriver om informationsmaterialet är strukturerat så att det kan behandlas maskinellt och om det kan behandlas i olika datasystem.
  • Punktlighet (rättidighet): Punktlighet innebär att informationsmaterialet är tillgängligt vid den angivna tidpunkten och tillräckligt ofta i förhållande till de ändringar som sker i informationsmaterialet.
  • Användarrättigheter: Användarrättigheterna beskriver hur rätten att använda informationsmaterial har definierats och vad man kan göra med materialet, dvs. för vilka ändamål datamaterialet kan utnyttjas. 

Bekanta dig närmare:

Specifikation av nyttjanderätter

I det här skedet beskrivs hur det lönar sig att licensiera informationen, dvs. vilka användarvillkor det lönar sig att ställa för utnyttjandet av den öppna informationen.  

Det finns inga officiella rekommendationer för definitionen av nyttjanderätter för det informationsmaterial som ska öppnas.

Nyttjanderätter till data fastställs genom att välja en lämplig licens för data som berättar för dem som utnyttjar data på vilka villkor den publicerade informationen kan utnyttjas. Licensen ska nämnas i metadata för det informationsmaterial som publiceras. 

Hur väljs ett lämpligt användningstillstånd för den öppna informationen?

För att den delade informationen ska betraktas som öppen information krävs en öppen licens, dvs. en licens som tillåter fri spridning, bearbetning och användning av informationsmaterial för alla, även kommersiella ändamål. En helt öppen licens (till exempel CC0) innebär att man inom ramen för lagstiftningen avstår från alla upphovsrätter som begränsar utnyttjandet.

Informationsmaterial som publiceras som öppna data licensieras i allmänhet med Creative Commons CC BY 4.0 eller CC0-licens. I Finland finns för närvarande ingen nationell rekommendation för licensiering av öppet informationsmaterial inom den offentliga förvaltningen, men användningstillståndet för öppet informationsmaterial JHS-189, som tidigare användes, rekommenderade att man använder licensen CC BY 4.0. 

De vanligaste licenserna för öppen information

Creative Commons CC0 1.0 Universal

Med CC0-licensen avstår man från alla upphovsrätter till data. Data med CC0-licens har överlåtits för helt fritt bruk för både kommersiella och icke-kommersiella ändamål. Den som utnyttjar data behöver inte uppge datans ursprung eller be om tillstånd för att använda den. 

Datamaterialets metadata är ofta licensierade med CC0-licens. Exempelvis är tillståndet att använda metadata i tjänsten hri.fi CC0, som möjliggör automatisk kopiering av metadata till tjänsten avoindata.fi.

Creative Commons Erkännande Internationell (CC BY 4.0)

Licensen CC BY 4.0 eller CC Erkännande 4.0 förpliktar den som utnyttjar data att namnge datans ursprung. Den som använder data ska ange källan, erbjuda en länk till licensen samt informera om ändringar har gjorts i data. Data med licens CC BY 4.0 kan användas fritt.

Exempel på källhänvisning

Helsinki Region Infoshare rekommenderar att använda följande källhänvisning vid utnyttjande av informationsmaterial som publicerats i tjänsten: ”Källa: Helsingfors stads inkomster och utgifter. Materialet upprätthålls av Helsingfors stadskansli. Materialet har laddats ner från tjänsten Helsinki Region Infoshare den 15.11.2021 med licensen Creative Commons Attribution 4.0."

Exempel på ansvarsfrihetsklausul

Ibland kan det utöver licensen finnas ett behov av att begränsa ansvaret i förhållande till dem som utnyttjar data med en ansvarsfrihetsklausul.

Organisationens namn ansvarar inte för förluster, rättegångar, anspråk, käromål, yrkanden eller kostnader, eller skada, oavsett art, beskaffenhet eller orsak till uppkomst, som direkt eller indirekt föranletts av kontakt med Organisationens namn öppna data eller användning av öppna data som publicerats av Organisationens namn.

Varför lönar det sig att använda Creative Commons-licenser?

Med Creative Commons-licenser vet man på förhand hur man ska gå till väga till exempel i olika tvister som gäller nyttjanderätt till data. Det är viktigt att man inte skapar licenser själv, eftersom deras rättspraxis inte kan förutses. 

Användningen av kända licenser är till nytta även för dem som utnyttjar data,

  • Creative Commons licenser är internationellt kända och gör det möjligt att utnyttja data över landsgränserna 
  • Det är lättare att kombinera och vidareutnyttja data när de har likadana, bekanta användarvillkor

Mer information om Creative Commons

Creative Commons är en internationell, icke-kommersiell organisation som bidrar till att dela och använda kreativitet och information med kostnadsfria juridiska verktyg. Creative Commons avgiftsfria och lättanvända upphovsrättslicenser ger ett enkelt och standardiserat sätt att ge allmänheten rätt att på valda villkor dela och vidareanvända kreativa produkter. CC-licenserna ersätter inte upphovsrätter, utan de fungerar parallellt med upphovsrätten. 

Mer information om Creative Commons verksamhet i Finland (på finska).

Mer information om licensiering av öppen information (på engelska) i tjänsten data.europa.eu.

Creative Commons erbjuder dig hjälp för att välja rätt licens.

Beslut om att öppna information

I det här skedet beskrivs hur man inom organisationen kan gå till väga för att fatta beslut om att öppna information.

Det finns inga officiella rekommendationer för beslut om att öppna informationsmaterial.

Enligt finsk lagstiftning är det den myndighet som i lagstiftningen har fått i uppgift att administrera informationen som beslutar om öppnandet av informationsmaterial. THL beslutar till exempel om att öppna informationsmaterial som förvaltas av Institutet för hälsa och välfärd (THL) som öppna data. I Finland finns det ingen centraliserad aktör som centraliserat fattar beslut om öppenheten i hela förvaltningens information.

Information öppnas så att någon kan utnyttja den. Ofta känner organisationerna till åtminstone några klienter som skulle kunna fra nytta av öppen information och se värde i den.  Tillsammans med dem som eventuellt utnyttjar informationen lönar det sig att till exempel i en workshop bedöma möjligheterna som öppnandet av information för med sig. Som basuppgift behövs en beskrivning av vilken information organisationen skulle kunna öppna. Organisationer har ofta mycket information och endast en liten del av informationen kan öppnas på en och samma gång.

Samtidigt är det bra att besluta om hanteringen av eventuella kvarstående risker. Med kvarstående risk avses en risk eller del av en risk som förblir i kraft eller som man inte kan eller vill vidta åtgärder för. Mer information om kvarstående risker finns i instruktionen för riskhantering (på finska).

Om organisationen har för avsikt att öppna flera informationsmaterial kan det vara nödvändigt att organisationen prioriterar ordningen för öppnandet av informationsmaterial och utvecklingsåtgärder.

Helsinki Region Infoshares praxis

Vid Helsingors stad fattas det inget officiellt beslut om öppnandet, utan instansen som äger data fastställer vilka data som ska öppnas utan en officiell beslutsprocess. Det kommer så få Data-öppningar till HRI att öppningarna inte behöver prioriteras. Öppningar som pågår en längre tid syns på HRI:s webbplats (på finska)

Meteorologiska institutets praxis

Vid Meteorologiska institutet är det institutets styrgrupp som beslutar om öppnande av information i gränssnitt och om prioritering.

Praxis för avoindata.fi

Tjänsten avoindata.fi är en avgiftsfri publikationsplattform för hela den offentliga förvaltningen. Tjänsten fungerar enligt självbetjäningsprincipen, så att varje myndighet fritt kan utnyttja den för att öppna och utnyttja data.