6. Publicering

Denna fas kan till exempel genomföras så här

Personen som främjar informationsdelning i organisationen och dataförvaltaren

  • utarbetar omfattande metadata för data.
  • utreder var data kan publiceras.
  • publicerar data i en dataportal, såsom Öppnadata.
  • kommer tillsammans med organisationens kommunikation överens om hur man informerar om publiceringen av data.

Organisationens IT-experter 

  • bereder data för publicering.

Beskrivning av metadata

I det här avsnittet går vi igenom vad metadata är samt varför och hur det är bra för organisationen att beskriva de datamängder som ska öppnas och var beskrivningsinformationen kan publiceras. Beskrivningsinformation kallas också metainformation eller metadata.

Avoindata Note icon

INSPIRE-direktivet

Enligt INSPIRE-direktivet ska EU:s medlemsländer utarbeta metadata om de geografiska datamängder och tjänster som omfattas av direktivet samt publicera dem i en söktjänst, som i Finland är Paikkatietohakemisto.

Avoindata Note icon

Dataförvaltningsakten (DGA)

Observera att dataförvaltningsakten förpliktar till att beskriva datamängder som omfattas av akten i tjänsten Suojattudata.

Vad är metadata?

Materialet har i allmänhet två typer av metadata:

  • Materialets interna metadata, som beskriver materialets datafält samt deras strukturer, betydelser och kopplingar till varandra.
  • Materialets externa metadata, som beskriver hela materialet, till exempel dess upprätthållare, kvalitet och hur materialet har uppkommit.

Exempel på metadata för datamängder

Metadata för datamängder är till exempel:

  • Basuppgifter såsom namn och licens
    • När du publicerar datamängden i dataportalen är de nödvändiga basuppgifterna i allmänhet obligatoriska fält
  • Beskrivning av datainnehållet och eventuella brister
  • Beskrivning av informationens kvalitet med hjälp av indikatorer som är gemensamma för den offentliga förvaltningen.
  • Processen för produktion av information
    • Eventuella beräkningsformler eller motsvarande i anslutning till produktionen av datamängden, om möjligt
  • Kontaktuppgifter till upprätthållaren av datamängden
  • Uppdateringstidpunkt och uppdateringscykel för datamängden
    • Information som delas ut som gränssnittsdelning (såsom väderinformation) kan till och med uppdateras i realtid, men information som delas som fil (såsom statistik) kan uppdateras mer sällan, till exempel en gång per år. 

Varför är det viktigt att beskriva datamängden?

Beskrivningen av datamängden hjälper dataanvändarna, såväl människor som maskiner, att förstå data och underlättar därmed vidareutnyttjandet av datamängden. Metadata som beskriver data berättar till exempel om ursprunget, strukturen eller användarvillkoren för data. Utan dessa uppgifter skulle det vara omöjligt att utnyttja data. När data publiceras på internet försvinner dess ursprungliga kontext lätt och därför är det särskilt viktigt att erbjuda användaren metadata. 

Exempel

Om siffran 37 förekommer i datamängden, kan den utan metadata hänvisa till exempel till inomhustemperatur, skostorlek, sittplats eller något annat. Endast med hjälp av metadata kan man förstå siffrans betydelse på rätt sätt. I detta fall bör man i metadata beskriva att siffrorna i datamängden hänvisar till inomhustemperatur och att temperaturerna anges i celsiusgrader. 

Vad är DCAT-AP-datamodellen?

DCAT-AP är ett gemensamt avtal mellan EU-länderna om vilka metadata som ska tillhandahållas om datamängder med öppna data. Syftet är att förenhetliga kraven på metadata i olika länder och på så sätt underlätta utnyttjandet av data. När alla länder tillhandahåller likadan information om sitt material i samma form underlättas utvecklingen av internationella applikationer.

Datamodellen DCAT-AP bygger på den beskrivningsordlista DCAT (Data Catalog Vocabulary) som skapades av World Wide Web Consortium (W3C). Syftet med DCAT-beskrivningsordlistan är att förenhetliga metadata som används i tjänster avsedda för delning av olika datamängder.

DCAT-AP förenhetligar metadata som krävs för olika länders dataportaler genom att erbjuda en gemensam metadatamodell som alla dataportaler kan utnyttja. Metadatamodellen definierar till exempel att alla datamängder ska ha ett namn och en beskrivning. I DCAT-AP finns dessutom rekommenderade och valfria fält såsom nyckelord.

Det finns separata versioner av DCAT-AP för geografisk information (GeoDCAT-AP) och statistikdata (StatDCAT-AP). 

Fördelar med att använda datamodellen DCAT-AP:

  • När datamängder från olika länder beskrivs på samma sätt blir materialet mer interoperabelt och lättare att utnyttja även internationellt
    • Till exempel finns det en beskrivning av datainnehållet i allt material och beskrivningen finns gärna även på engelska
  • En på förhand fastställd minimimängd beskrivningsdata garanterar att datamängderna har beskrivits på ett tillräckligt högklassigt sätt
    • Det är omöjligt för dataanvändarna att utnyttja data vars beskrivningsuppgifter till exempel saknar licens, eftersom användaren inte kan veta vilka villkor som gäller för användningen av data. 
  • Det blir lättare att hitta material ju mer metadata som erbjuds om materialet
    • Nyckelord som läggs till i metadata hjälper till exempel dem som utnyttjar data att hitta data om ett visst ämne i olika tjänster.

Läs mer om DCAT-AP.

Kvalitetssäkring av metadata i tjänsten data.europa.eu

Kvalitetssäkringen av metadata kontrollerar metadata i samband med varje skördning. Syftet med kvalitetssäkringen är att hjälpa informationsproducenter och dataportaler att kontrollera kvaliteten på metadata och få förbättringsförslag.

Delområdena som bedöms i kvalitetssäkringen av metadata har härletts från FAIR-principerna. Delområdena är:

  • lätt att hitta,
  • tillgängliga,
  • interoperabla,
  • återanvändbara och
  • situationsspecifika.

Du hittar mer information om kvalitetssäkringen av metadata på webbplatsen för tjänsten data.europa.eu.

 

Metadata bör vara tillgängliga i både människo- och maskinläsbart format. Det lönar sig att erbjuda metadata på finska, men i mån av möjlighet även på svenska och engelska. I synnerhet engelskspråkiga metadata är till nytta för eventuella internationella dataanvändare. De datamängder som beskrivs i tjänsten Öppnadata finns automatiskt i tjänsten data.europa.eu. Tjänsten samlar europeiska data och på så sätt ger den internationell synlighet för öppna data i olika länder.

Publiceringskanaler

Publicering av metadata i tjänsten Öppnadata

När du publicerar information i tjänsten Öppnadata måste du åtminstone fylla i de obligatoriska metadatafälten. Dessa beskrivningsuppgifter krävs för att publicerade data ska finnas i tjänsten och för att de ska kunna utnyttjas. Sådana metadata är bland annat beskrivning och licens. Om man vill kan man också lägga till en separat textfil till datamängden, där materialet kan beskrivas närmare.

Tjänsten Öppnadata har skapat och dokumenterat en egen DCAT-AP-utvidgning (på engelska). Tack vare utvidgningen är även Öppnadata kompatibel med DCAT-AP, sökningen av tjänsten fungerar bättre och data mängderna hittas enkelt i data.europa.eu-tjänsten, dit materialens metadata kopieras, dvs. skördas. Metadatamodellen för beskrivning av datamängder beskrivs också i referensramen för tjänsten Öppnadata (på finska, Google docs).

Mer information om DCAT-AP och utvidgningen av Öppnadata (på finska).

Utnyttjande av interoperabilitetsplattformen

Interoperabilitetsplattformen som upprätthålls av Myndigheten för digitalisering och befolkningsdata erbjuder verktyg för att beskriva informationsinnehåll och definiera metadata. Det är fråga om en öppen webbaserad plattform där man kan skapa både människo- och maskinläsbara beskrivningar av information. Verktygen på plattformen består av Datamodeller, Ordlistor och Kodsystem.

Målet är att de som behöver informationen ska ha ett ställe där de hittar metadatabeskrivningar för information som byts ut mellan olika organisationer. Målet är också att de datadefinitioner som beskriver datainnehållet är enhetliga och vidareutnyttjas: ordlistor, koder och datamodeller som tidigare skapats ska utnyttjas i så hög grad som möjligt. 

Principen för vidareutnyttjande en del av interoperabilitetsmetoden, dvs. ett sätt att producera, administrera och uppdatera de datadefinitioner och de metadata som behövs i bakgrunden av digitala tjänster och dataflöden. Interoperabilitetsmetoden styr skapandet av gemensamma kärnbegrepp, kärnklasser och kodsystem för organisationer samt hur beskrivningar som gjorts av en enskild organisation för organisationens egen användning bör göras allmänt tillgängliga för alla. Samtidigt styr den också hur dessa gemensamma beskrivningar kan utnyttjas när organisationer gör egna beskrivningar.

Att använda enhetliga begrepp underlättar planeringen och förståeligheten av tjänster. Utnyttjande av färdiga ordlistor, kodsystem och datamodeller sänker kostnaderna för utveckling av informationssystem, eftersom det påskyndar utvecklingen av informationssystemen för de instanser som utnyttjar dessa beskrivningar och främjar interoperabiliteten mellan organisationens informationssystem och andra instansers informationssystem. Man talar om semantisk interoperabilitet, dvs. att både den som producerar och den som utnyttjar informationen förstår informationens betydelse på samma sätt och kan sinsemellan utbyta information så att informationens betydelse förblir oförändrad under resans gång.

De färdiga datadefinitionerna på interoperabilitetsplattformen kan utnyttjas fritt av alla. Verktygen i plattformen kan utan avgift användas av producenter av informationsinnehåll för terminologiskt arbete med ordlistor, för att administrera koder och för datamodellering. Innehåll kan produceras av aktörer inom såväl den offentliga förvaltningen som den privata sektorn. De som producerar informationsinnehållet ansvarar för att definiera sin information samt för att den är uppdaterad och av god kvalitet.

I den offentliga dokumentationen av interoperabilitetsplattformen har man samlat information om hur man kan ansluta sig till Interoperabilitetsplattformen och grundläggande anvisningar om hur man kan komma igång med användningen av verktygen.

Organisationernas praxis

De organisationer som redan har öppnat data har publicerat metadata tillsammans med datamängderna antingen i en dataportal (såsom Öppnadata), på organisationens egna webbsidor eller i båda.

Praxis för metadata i metadatakatalogen Paikkatietohakemisto

Tjänsten Metadatakatalogen som upprätthålls av Lantmäteriverket gör det möjligt för producenter av geografiska data att lagra och dela metadata både för material och tjänster enligt INSPIRE och för andra geografiska datamängder och -tjänster.

I geografiska datamängder beskrivs bland annat den geografiska och tidsmässiga täckningen, produktionsprocessen och begränsningar av tillgången. I tjänsterna för geografisk information beskrivs till exempel det material som erbjuds och länkar till själva tjänsten. När man skriver in nyckelordet avoindata.fi i metadata för öppna geografiska datamängder och -tjänster överförs de vid skördning till tjänsten Öppnadata. För material och tjänster utanför INSPIRE bör nyckelordet ei-inspire (icke-inspire) läggas till, så att de inte hamnar bland Finlands INSPIRE-uppföljningsresultat.

Nästan 300 personer har registrerat sig i tjänsten, och de representerar cirka 150 organisationer. Metadata har publicerats för över 1 500 geografiska datamängder eller -tjänster. Ungefär hälften av dem omfattas av INSPIRE.

Praxis för metadata i tjänsten Helsinki Region Infoshare

Det lönar sig att ge data ett så lättbegripligt namn som möjligt. Dessutom lönar det sig att skriva en lättbegriplig beskrivning av data i ord, där bland annat följande framgår,

  • vilken och hurdan data det är fråga om,
  • hur den har upprättats eller samlats in och
  • finns det något särskilt i dessa data som användaren bör känna till för att kunna tolka data rätt.

I beskrivningen lönar det sig också att öppet berätta om brister i data och om eventuella fel. Det vore också bra om egenskapsuppgifterna för data samt de förkortningar som används i data beskrivs och skrivs ut. Det lönar sig att också översätta metadata för data till engelska.

Metadatamodell som används av HRI (på finska).

Praxis för metadata vid Finlands miljöcentral

Vid SYKE används ett lagringsverktyg för att beskriva metadata (metadataeditor) och en separat metadatatjänst avsedd för slutanvändare (på finska).

Metadata kan produceras från datamängder och informationssystem, gränssnittstjänster, miljörapporter och forskningsdata. För alla dessa har egna metadataprofiler skapats. Datamängdernas och gränssnittstjänsternas metadataprofiler följer kraven i INSPIRE-direktivet. 

Både metadataeditorn och metadatatjänsten erbjuder öppna gränssnitt för skördning av metadata. Via gränssnitten överförs beskrivningarna av SYKEs material och gränssnitt till Metadatakatalogen (metadata enligt INSPIRE-direktivet) som upprätthålls av Lantmäteriverket, till tjänsten Öppnadata (metadata för SYKEs öppna material) som upprätthålls av MDB samt till CSC:s tjänst Etsin.fi.

Praxis för metadata vid Statistikcentralen

För att skapa och tolka tillförlitlig statistik krävs mycket bakgrundsinformation om statistiken och de saker som beskrivs i dem. I avsnittet Information om statistik har man samlat metadata för Statistikcentralens statistik.

Metadatatjänsten innehåller följande metadatahelheter.

Statistikcentralen upprätthåller och publicerar nationella klassificeringsrekommendationer. De flesta av dessa grundar sig på internationella standarder som fastställts genom EU-direktiv. Genom att använda klassificeringsrekommendationerna främjas jämförbarheten mellan statistikuppgifter som producerats vid olika tidpunkter och från olika områden.

Klassificeringarna består av benämningar, dvs. namn på klasser, dvs. nummer- eller bokstavsserier, samt beskrivningar av klasserna, dvs. definitioner. Med en klassificering avses en indelning av enskilda uppgifter som förekommer i statistikmaterialet efter fastställda egenskaper i olika grupper på ett sådant sätt att varje enhet ingår i endast en grupp. I samband med indelningen namnges grupperna och de får koder. Statistikcentralens klassificeringar har också publicerats via den öppna gränssnittstjänsten (på engelska).

Publicering

I det här avsnittet beskrivs hur och var det lönar sig att publicera datamängder som ska öppnas.

De organisationer som redan har öppnat data har i allmänhet publicerat datamängderna som ska öppnas jämte metadata i den offentliga dataportalen, så att datamängderna kan hittas så enkelt och snabbt som möjligt.

Iakttagande av FAIR-principerna vid publicering av data

FAIR-principerna har ursprungligen utvecklats för forskningsdata. De kan dock också tillämpas vid publicering av öppna data, även om alla principer inte nödvändigtvis kan följas som sådana.

Förkortningen FAIR kommer från orden Findable (lätt att hitta), Accessible (tillgänglig), Interoperable (interoperabel) och Re-usable (återanvändbar).

 

Bild: FAIR-principerna i korthet

Genom att följa principerna strävar man efter att säkerställa att data är lätta att återanvända och att publicerade data jämte beskrivningar håller hög kvalitet. 

Kontrollera att de öppna data som du publicerar följer FAIR-principerna:

  • Publicera data i en offentlig dataportal, till exempel i Öppnadata. 
  • Säkerställ att data får en individuell identifikation.
  • Publicera data i öppet filformat.
  • Beskriv data på ett heltäckande sätt.
  • Licensiera data med öppet användningstillstånd, såsom Creative Commons BY 4.

Läs mer om FAIR-principerna vid publicering av öppna data (på finska).

Var lönar det sig att publicera öppna data?

Det är bra om statsförvaltningens öppningar av data görs synliga i tjänsten Öppnadata. På så sätt når meddelandet många som är intresserade av att utnyttja data.

I Finland finns det flera dataportaler som inrättats för att dela information.

  • I tjänsten Öppnadata kan vem som helst publicera alla typer av öppna data.
  • Städerna i huvudstadsregionen publicerar i regel sina data i HRI-tjänsten.
  • Metadatakatalogen samlar metadata om geografisk information och geografiska tjänster som utarbetats och publicerats av informationsproducenterna.
  • På ett internationellt plan kan metadata om datamängder inom olika offentliga förvaltningar sökas och visas i tjänsten data.europa.eu.

Tjänsten Öppnadata fungerar som en nationell kontaktpunkt för öppna data, där beskrivningsuppgifterna för de datamängder som finns i tjänsten skördas och publiceras i tjänsten data.europa.eu som administreras av Europeiska kommissionen. Öppnadata innehåller mycket beskrivningsinformation om datamaterial som publicerats i andra finländska dataportaler - uppgifterna skördas bland annat från tjänsten Helsinki Region Infoshare och Metadatakatalogen.

Utöver att organisationen publicerar beskrivningen av sina datamängder i någon dataportal kan organisationen också publicera information på sina egna webbsidor.

Publicering på Suomi.fi-öppnadata

Tjänsten Öppnadata är en nationell tjänst för öppna data. Syftet med den är att samla alla öppna data i Finland på ett och samma ställe.

En fördel med den nationella portalen är att organisationen inte behöver använda sina egna resurser för att utveckla och underhålla en portal. Öppnadata utvecklas kontinuerligt och portalen har en etablerad användarkrets, vilket innebär att olika användare lätt hittar nytt material. Tjänsten grundar sig på öppen källkod och är tillgänglig på tre olika språk.

Tjänsten Öppnadata erbjuder bland annat

  • En avgiftsfri publiceringsplattform för öppna datamängder. 
  • Internationell synlighet. Data.europa.eu-tjänsten skördar från tjänsten Öppnadata, dvs. alla data som laddats upp i tjänsten finns också i den europeiska internationella portalen för öppna data.
  • Statistik. Öppnadata ger information om bland annat hur tjänsten används samt om hur populära organisationer och datamängder är.
  • Stödmaterial för att öppna och publicera data.

Det är också möjligt att använda Öppnadata tjänsten via gränssnitt. Mer information om användningen av Öppnadata via gränssnitt (på finska).

Publicering i metadatakatalogen Paikkatietohakemisto och i tjänsten Paikkatietoikkuna.fi

Metadatakatalogen är en nationell metadatatjänst som upprätthålls av Lantmäteriverket och där informationsproducenterna utarbetar, publicerar och uppdaterar metadata. Läs mer om publicering av metadata Metadatakatalogen.

Tjänsten Paikkatietoikkuna.fi är en nationell geoportal som upprätthålls av Lantmäteriverket och som presenterar geodatamängder och -tjänster samt möjligheterna att utnyttja dem. Lantmäteriverket exporterar på begäran kartlager som publicerats via informationsproducenternas gränssnittstjänster till Paikkatietoikkuna. Med varje informationsproducent ingås ett avtal där man bland annat kommer överens om användarvillkoren. Mer information om Paikkatietoikkuna.

Tjänsterna är en central del av Finlands implementering av INSPIRE. INSPIRE-direktivet förpliktar myndigheter som administrerar eller underhåller geografiska datamängder som omfattas av direktivets tillämpningsområde. Mer om skyldigheterna i INSPIRE-direktivet på Lantmäteriverkets webbsidor.

Publicering i HRI-tjänsten

Öppna data från städerna i huvudstadsregionen (Helsingfors, Esbo, Vanda och Grankulla med samkommuner) publiceras på hri.fi, varifrån metadata för data automatiskt skördas till tjänsten Öppnadata.

Kommunikation

I det här avsnittet beskrivs hur och var det lönar sig att kommunicera om datamängder som ska öppnas. Kommunikation är ett sätt att göra datamängderna lättare att hitta, så det lönar sig att genomföra kommunikationen på ett mångsidigt sätt i olika kanaler.

Hur lönar det sig att kommunicera om publiceringen av data?

Det lönar sig för organisationen att marknadsföra datamängder som den öppnat med hjälp av olika kommunikationssätt och uppmuntra till att utnyttja data. Nedan listas god praxis för kommunikation om öppna data.

  • Det lönar sig att kommunicera så omfattande som möjligt om öppnade datamängder, men också att rikta kommunikationen till målgruppen.
  • Det är bra att beskriva vilken typ av data du har öppnat och var de har publicerats.
  • Berätta om i vilken form data är tillgängliga, varifrån de härstammar och för vilken tid de har producerats.

Det lönar sig också att uppmuntra användare av datamängder att berätta om applikationer eller tjänster som de utvecklar, vilka utnyttjar öppna data som organisationen publicerar. Eventuella exempel på applikationer kan lyftas fram till exempel i sociala medier och på så sätt inspirera andra applikationsutvecklare och dataanvändare.

Var lönar det sig att kommunicera om publiceringen av data?

Meddelanden om öppnad information kan publiceras till exempel

  • på organisationens webbplats,
  • i nyhetsbrev och
  • på sociala medier.

Dessutom kan data presenteras för organisationens nätverk. Man kan även uppmuntra till att utnyttja data genom att ordna olika evenemang där data utnyttjas.

Det är bra att komma ihåg att kommunikationen kan skötas av flera aktörer. Till exempel i huvudstadsregionen informerar både den som öppnar data och HRI-tjänsten om öppnandet.

Läs mer om kommunikation om öppnade datamängder i Open Data Handbook (på engelska).

Stödmaterial inom ämnet

I detta avsnitt hittar du stödmaterial med anknytning till fasens ämnen.

Utbildningar på engelska på webbplatsen data.europa.eu: