Skip to main content
Skip table of contents

Kuvaile ja dokumentoi tietoaineistosi

Arkistoinnin ja aineistonhallinnan peruskeinoja on tietoaineistojen kuvailu ja dokumentointi. Niiden tavoite on varmistaa tiedon ymmärrettävyys, käytettävyys ja säilyvyys sen välittömän muodostumis- ja käyttökontekstin ulkopuolella.


Kuvailu ja dokumentointi ovat tietoaineistojesi turva

Kuvailutiedon merkitys on erityisen suuri, kun kyse on arkistoitavasta tiedosta, jota säilytetään ilman aikarajaa. Tiedon alkuperäinen käyttökonteksti, tietojärjestelmä, sovellus tai tiedon tuottajien ja käyttäjien asiantuntemus eivät pääsääntöisesti ole arkistoidun tiedon hyödyntäjän saatavilla ja tukena. Kuvailussa huomio kiinnitetäänkin tietoaineiston nimeämisen ja tietosisällön lisäksi sen muodon, muodostumiskontekstin ja käyttötapojen monipuoliseen kuvaamiseen.

Kuvailu kattaa tietoaineiston

  • tietosisällön ja -rakenteet

  • alkuperän, muun muassa aineiston syntyyn liittyvät tehtävät ja toimijat, ajoitustiedot ja paikkatiedot

  • käsittelyä, elinkaarihallintaa sekä niihin liittyviä toimijoita koskevat tiedot

  • suhteet muuhun tietoon, tietoaineistoihin ja muihin asiayhteyksiin, mukaan lukien erilaiset tunnisteet

  • käyttöön liittyvät rajoitukset.

Kuvailua tukee tietoaineistojen muu dokumentointi ja oheisdokumentaatio. Oheisdokumentaatiolla tarkoitetaan tietoaineiston käytettävyyttä ja tulkintaa tukevaa aineistoa, jota säilytetään tietoaineiston yhteydessä. Yleensä dokumentaationa hyödynnetään esimerkiksi kuvauksia ja ohjeita, joita tietoaineistoista ja tietojärjestelmistä on laadittu niiden elinkaaren eri vaiheissa. Arkistoitavan tiedon myöhemmän ymmärrettävyyden ja käytettävyyden varmistamiseksi pitää myös aina dokumentoida ja arkistoida tietoaineistoon liittyvät luokitukset, koodistot ja koodistoavaimet.

Kontekstia, tietorakennetta ja käyttöä kuvaavaa tietoa tarvitaan aina. Esimerkiksi automaattisen sisällöntunnistamisen menetelmät voivat tulevaisuudessa vähentää tietoaineistojen tietosisällön kuvailutarvetta. Sen sijaan tietorakenteen ja aineiston muodostumiskontekstin kuvailu sekä aineistoa koskevien käyttöohjeiden merkitys lisääntyy monimuotoisten, laajojen tai tietyn aihepiirin erityisosaamista vaativien digitaalisten tietoaineistojen kohdalla.

Tieto menettää ymmärrettävyyttään suhteellisen nopeasti aina, kun sillä ei ole enää aktiivisia käyttäjiä tai kun se on irrotettu siitä yhteydestä, jossa se on tuotettu ja jossa sitä on käytetty. Näin voi tapahtua muun muassa silloin, kun digitaalinen tieto siirretään syntyjärjestelmästään toiseen järjestelmään. Muista, että arkistoitavan tiedon elinkaari on aina erilainen kuin yksittäisen organisaation, toiminnon, prosessin tai tietojärjestelmän. Samat ymmärrettävyyteen ja säilymiseen liittyvät reunaehdot pitää huomata myös silloin, kun tiedon säilytysaika sen alkuperäisessä käyttötarkoituksessa on hyvin pitkä.


Kuvailu on myös tehtävä ja prosessi

Kuvailu ja dokumentointi tukevat arkistoitavien ja arkistoitujen tietoaineistoja käyttämistä ja käsittelyä koko niiden pitkän elinkaaren ajan. Ne auttavat myös hallinnoimaan tietoaineistoja kokonaisuutena. Vaikka tiedon hyödyntäjä ei tuntisi tiedon alkuperää tai käyttötapoja, kuvailuun ja dokumentointiin tutustumalla hän pystyy ymmärtämään:

  • Millaisesta tiedosta on kyse.

  • Mitkä tahot ovat muodostaneet tietoaineistot tai liittyvät niiden muodostumiseen tai käsittelyyn muilla tavoilla.

  • Miten ja milloin tietoaineistot ovat muodostuneet.

  • Miten eri tehtävissä, eri aikoina tai eri tavoin muodostuneet tietoaineistot liittyvät toisiinsa.

  • Miten ja missä tietoaineistoja voidaan käyttää.

Tietoaineistoa kuvailevan metatiedon lisäksi kuvailu tarkoittaa myös tehtävää ja prosessia, jolla kuvailutietoa tuotetaan. Kuvailu alkaa käytännössä tietoaineiston muodostumishetkellä ja jatkuu läpi koko sen elinkaaren. Tehtävänä se ei siksi rajoitu siihen kuvailuun, jota tehdään arkistossa, vaikka osa metatiedosta voidaankin liittää tietoaineistoihin, kun ne arkistoidaan tai siirretään arkistoon.

Metatiedon laatu, saatavuus ja ylläpito on erityisen tärkeää, kun kyse on pitkään säilytettävistä tietoaineistoista. Varmista, että tämä otetaan huomioon, kun metatietoon liittyviä  sääntöjä kehitetään. Tärkeää on myös se, että tietoaineistojen kuvailu ja kuvailutietojen ylläpito kattaa niiden koko elinkaaren. Arkistossa metatietoja voidaan edelleen täydentää ja rikastaa.

Piirroshiiri tutkii tietokonetta ja kuvailuun liittyviä kysymyksiä. Puhekuplassa lukee katsotaanpa, ainakin näihin pitää löytyä vastaus.

Kuva. Kuvailutieto auttaa ymmärtämään, miten, milloin ja miksi tietoaineistot ovat muodostuneet. Niiden avulla voi hallinnoida myös sitä, miten eri tehtävissä, eri aikoina tai eri tavoin muodostuneet aineistot liittyvät toisiinsa ja miten niitä voidaan käyttää.

Kuvailutietoa voi käytännössä tuottaa useilla tavoilla tiedon elinkaaren eri vaiheissa. Digitaalisessa toimintaympäristössä tarpeelliset arkistoinnin metatiedot kannattaa tuottaa mahdollisimman pitkälle samoilla menetelmillä ja samanaikaisesti muun tiedonhallinnan metatiedon kanssa. Sekä virheiden että kustannusten määrä yleensä lisääntyy, kun metatietoa tuotetaan myöhemmin erikseen sen sijaan, että se kertyisi tiedon käytön ja muun käsittelyn aikana. Siksi prosesseissa ja tietojärjestelmissä, joissa muodostuu ja käsitellään arkistoitavia tietoaineistoja, pitää ottaa huomioon myös niiden arkistollinen toiminta- ja käyttökonteksti.


Noudata vaatimuksia - tukeudu suosituksiin ja standardeihin

Metatietoa tarvitaan ja myös tuotetaan moniin eri käyttötarkoituksiin tiedon elinkaaren aikana. Samalla metatiedolla voi olla myös erilainen merkitys tiedon elinkaaren vaiheesta riippuen. Tärkeä näkökulma metatietoon on tiedon varsinainen alkuperäinen käyttötarkoitus ja sen muodostajien ja käyttäjien tarpeet. Tällaisen metatiedon määrittelemisessä pitää ottaa huomioon organisaation omat metatietokäytännöt ja toiminta sekä alakohtaiset metatietovaatimukset ja -suositukset eli suositustenmukaisuus. Esimerkiksi paikkatiedolle, taloustiedolle, tilastotiedolle ja maankäyttöön ja rakentamiseen liittyvälle tiedolle on olemassa standardeja ja muita määrityksiä.

Yleiset ja alakohtaiset hyvät käytännöt, suositukset ja standardit ovat yleensä syntyneet käytännön tarpeesta. Ne voivat olla oppaita, sanastoja, ontologioita, koodistoja, luokituksia tai metatietomalleja. Standardeista ja suosituksista pitää olla tietoinen. Niiden tunteminen on edellytys myös sille, että niistä poikkeaminen pystytään tarvittaessa tekemään harkitusti.

Arkistoitavan tietoaineiston yhteydessä tulisi aina säilyä tieto siitä, mitä suosituksia ja käytäntöjä sen muodostamisessa ja käsittelyssä on noudatettu, samoin se, miten ja miksi niistä on mahdollisesti poikettu.

Julkisessa hallinnossa metatietoja ja muuta tiedonhallintaa määrittää suositustenmukaisuuden lisäksi vaatimustenmukaisuus. Viranomaisen on noudatettava toiminnassaan lainsäädännön tai muun sääntelyn asettamia vaatimuksia. Esimerkiksi asiarekisteristä ja asiankäsittelyn välttämättömistä metatiedoista säädetään tiedonhallintalaissa (906/2019)Ikoni_linkki_ulkoiselle_sivulle. Lisäksi tiedonhallintaan ja asiankäsittelyyn liittyviä metatietovaatimuksia on muussa yleislainsäädännössä ja erityislainsäädännössä.

Asiankäsittelyn metatiedon tuottamista ohjaa ensisijaisesti Julkisen hallinnon tiedonhallintalautakunta, joka on julkaissut suosituksen asianhallinnan metatiedoistaIkoni_linkki_ulkoiselle_sivulle. Se ylläpitää myös Julkisen hallinnon tiedon elinkaaren hallinnan metatietomalliaIkoni_linkki_ulkoiselle_sivulle Yhteentoimivuusalustalla.

Suositukset ja vaatimukset tukevat omalta osaltaan digitaalisen tiedon käytön, hallinnan, säilymisen ja arkistoinnin näkökulmasta elintärkeää tietojen ja tietojärjestelmien yhteentoimivuutta. Niitä voi ja pitää hyödyntää metatietojen, tietorakenteiden ja prosessien suunnittelussa, ylläpidossa ja dokumentoinnissa.


Kansallisarkiston metatietosuositukset

Kansallisarkistolla on tällä hetkellä kaksi arkistoitavia tietoaineistoja koskevaa metatietosuositusta. Niiden tavoite on

  • varmistaa asiakirjallisen kulttuuriperinnön säilyminen ja saatavuus,

  • mahdollistaa arkistoidun tiedon ymmärrettävyys ja käytettävyys hyvin pitkällä aikavälillä

  • edistää arkistoitavien tietoaineistojen siirtämistä Kansallisarkistoon pitkäaikaissäilytyksen ja arkistokäytön piiriin.

Suositukset tukevat myös organisaation tiedonhallintaa silloin, kun se vastaa arkistoitujen tietojen säilyttämisestä itse tai tietoaineistojen säilytysajat ovat pitkiä. Metatietosuositusten väliset erot liittyvät muun muassa siihen käsittelytasoon, jolla ne metatiedosta ohjeistavat:

  • Arkistoitavien tietoaineistojen perusmetatiedot -suosituksenIkoni_linkki_ulkoiselle_sivulle(2024) tavoitteena on digitaalisten tietoaineistojen kuvailun ja arkistoitavien aineistojen hallinnan laaja kehittäminen. Suosituksessa ei määritellä tiettyä metatietomallia tai muita tietorakenteita, vaan arkistokuvailu ymmärretään siinä näkökulmaksi mihin tahansa arkistoitavaan tietoaineistoon. Arkistometatiedolla tarkoitetaan suosituksessa metatietokokonaisuutta, joka auttaa varmistamaan tietoaineistojen ymmärrettävyyden, todistusvoimaisuuden, tunnistamisen ja käytettävyyden myös arkistoinnin jälkeen. Kuvailevan metatiedon lisäksi arkistometatietoon kuuluu siksi myös tietoaineistojen arkistointia ohjaavaa hallinnollista metatietoa.

  • Suositukseen Sähke2-metatietomallin hyödyntämisestäIkoni_linkki_ulkoiselle_sivulle(2023) liittyy konkreettinen metatietomalli sekä siirtorakenne, joka mahdollistaa arkistoitavien tietoaineistojen siirtämiseen Kansallisarkistoon. Suositus perustuu Kansallisarkiston SÄHKE-määräykseen.

Huomaathan, että kun tietoaineistoja siirretään Kansallisarkistoon noudatetaan aina ajantasaista siirto-ohjeistusta ja Kansallisarkiston määrittelemiä siirtorakenteita. Tämä voi edellyttää käytettyjen metatietoarvojen sovittamista yhteen esimerkiksi tietyssä siirtoskeemassa vaaditun metatietojen esitystavan kanssa.

📚 Lue lisää: Kansallisarkiston metatietosuositukset

📚 Arkistoitavien tietoaineistojen perusmetatiedot -suositus (KA/20011/30.00.00/2023, 2024)Ikoni_linkki_ulkoiselle_sivulle on yleistasoinen ja laajennettava arkistokuvailun viitekehys. Suosituksessa on määritelty arkistometatiedon tarpeellista ja riittävää vähimmäistasoa eli arkistoinnin perusmetatietoja.

Elinkaaren aikana kertyvä ja tuotettu arkistometatieto muodostaa aineiston kontekstia, sisältöä ja rakennetta sekä hallintaa ja käsittelyä koskevan arkistokuvailun. Se myös ohjaa omalta osaltaan tietoaineistojen arkistointia. Arkistometatiedolla on yhtymäkohtia myös arkistolain (831/1994)Ikoni_linkki_ulkoiselle_sivulle mukaisessa arkistonmuodostussuunnitelmassa ja tiedonhallintalain (906/2019)Ikoni_linkki_ulkoiselle_sivullemukaisessa tiedonhallintamallissa ylläpidettäviin tietoihin. Näiden kuvausten avulla hallinnoidaan ja dokumentoidaan osaltaan tietoaineistojen kontekstitietoja, kuten yhteyttä tehtävään ja toimintaprosessiin, joiden hoitamisen yhteydessä tietoaineistot muodostuvat, sekä elinkaaritapahtumia, kuten tuhoamista, arkistointia ja arkistosiirtoja.

Suosituksessa on huomioitu arkistokuvailun ja sen standardoinnin kansallinen ja kansainvälinen kehitys. Sen määritykset perustuvat kansainväliseen arkistokuvailun RiC-CM-käsitemalliin, jonka yhtenä lähtökohtana on ollut asiakirjahallinnon metatietoja määrittelevä ISO 23081-standardi.

📚 Suositus Sähke2-metatietomallin hyödyntämisestä (KA/12266/07.01.01.00/2022, 2023) pohjautuu Kansallisarkiston Sähke2-määräykseen (AL/9815/07.01.01.00/2008)Ikoni_linkki_ulkoiselle_sivulle, joka oli sähköisen arkistoinnin ja asiankäsittelyn ohjeistus, metatietomalli sekä siirtorakenne Kansallisarkistoon.

Sähke2-määräys on kumottu 31.12.2022 ja sen ylläpito muuna kuin arkistoitavien tietoaineistojen siirtorakenteena on päättynyt Kansallisarkistossa. Sen sisältö on kuitenkin edelleen hyödynnettävissä arkistoinnin suunnittelussa ja toteutuksessa. SÄHKE2-suositus antaa SÄHKE2-metatietoihin ja metatietomalliin (SÄHKE2-metatietomalli, versio 1.3, 18.3.2020) liittyviä soveltamisohjeita. Se käsittelee SÄHKE2-määrityksiä erityisesti tiedon arkistoinnin näkökulmasta ja kommentoi SÄHKE2-metatietomallia lainsäädännön muutoksiin liittyvillä huomioilla.

SÄHKE2:n määritykset ovat tietojärjestelmäriippumattomia, eikä niissä oteta kantaa teknisiin ratkaisuihin tai järjestelmäarkkitehtuuriin. Hyödyntäjä määrittelee, miten se SÄHKE2:n sisältöä käyttää. Digitaalisten aineistojen siirroissa noudetaan aina Kansallisarkiston Sähköisen arkistoinnin palvelun voimassa olevia siirto-ohjeita ja ohjeita säilytykseen hyväksyttävistä tiedostomuodoista Ikoni_linkki_ulkoiselle_sivulle.

📚 Lue lisää: Kansallisarkiston Sähke-määräykset

Asiakirjahallinnan ja asianhallinnan metatietoja määriteltiin Suomessa 2000-luvulla Kansallisarkiston SÄHKE-määräyksissä (SÄHKE1, 2005Ikoni_linkki_ulkoiselle_sivulle ja SÄHKE2, 2009Ikoni_linkki_ulkoiselle_sivulle). Määrittelyä jatkoi SÄHKE2-mukaiseen tiedonohjaussuunnitelmaan eli sähköiseen arkistonmuodostussuunnitelman tai säilytysaikasuunnitelmaan perustuvaa tiedonohjausta kehittänyt JHS 191 -suositus (2015). 

Sähke2-määräys on kumottu 31.12.2022 ja sen ylläpito muuna kuin arkistoitavien tietoaineistojen siirtorakenteena on päättynyt Kansallisarkistossa. Sen sisältö on kuitenkin edelleen hyödynnettävissä arkistoinnin suunnittelussa ja toteutuksessa. Sisällöltään SÄHKE2 on laaja koonti asiankäsittelyä ja sähköistä asiakirjahallintaa koskevista vaatimuksista sekä ohjeistus niiden sovittamiseksi yhteen. Sen taustalla ovat asiakirjahallinnan standardit, lainsäädännön hallinnollisten asioiden ja viranomaisen asiakirjojen käsittelylle asettamat vaatimukset ja julkisen hallinnon rekisteröintikäytännöt.

SÄHKE2-metatiedot sisältävät asiankäsittelyyn liittyvien metatietojen lisäksi hallinnollisia ja kuvailevia metatietoja, jotka tukevat arkistointia ja arkistoitujen tietoaineistojen hallintaa ja käyttöä. Tavoite on liittää tieto sen muodostumisesta lähtien sen ymmärtämistä tukevaan viitekehykseen, auttaa hallitsemaan tiedon käsittelyä, käyttörajoituksia, henkilötietojen suojaamista sekä tiedon säilytysarvoa ja säilytysaikoja ja näin tukea aineiston arkistoon siirtämistä ja käyttöä arkistossa.

📚 Lue lisää: Arkistokuvailun kehitys Suomessa ja muualla

Arkistokuvailun yhtenäisyys kansallisesti ja kansainvälisesti varmistetaan noudattamalla standardeja. Standardit ja niihin perustuvat ohjeistukset ohjaavat kuvailukohteiden identifiointia, metatiedon sisältöä ja yksittäisten metatietojen muotoa, esimerkiksi aikatietojen ja kielen merkitsemistapaa.

Nykyiset kansalliset arkistokuvailun säännöt ovat vuodelta 1997Ikoni_linkki_ulkoiselle_sivulle. Ne eivät vastaa Kansallisarkiston nykyistä kuvailujärjestelmää, eikä niissä ole huomioitu riittävästi sähköisessä tiedonhallinnassa ja arkistoinnissa ja niitä koskevassa säädösympäristössä tapahtunutta kehitystä. Uuden kuvailusovelluksensa kehittämisen yhteydessä Kansallisarkisto julkaisi luonnoksen kansallisesta arkistokuvailun käsitemallistaIkoni_linkki_ulkoiselle_sivulle (2015).  Siinä otettiin huomioon ICA:n eli kansainvälisen arkistoneuvoston vuonna 2012 asettaman EGAD-työryhmän työ, jonka tuloksena syksyllä 2016 julkaistiin luonnos arkistokuvailun kansainvälisestä Records in Contexts -käsitemallista (RiC-CM)Ikoni_linkki_ulkoiselle_sivulle.

RiC-CM-käsitemallin ja sen määrämuotoisen ontologiaversion (RiC-O)Ikoni_linkki_ulkoiselle_sivulle ensimmäiset viralliset versiot julkaistiin marraskuussa 2023. Kansallisarkiston vuonna 2024 julkaistu Arkistoitavien tietoaineistojen perusmetatiedot -suositusIkoni_linkki_ulkoiselle_sivullepohjautuu RiC-CM-malliin.

Keskeistä kansainvälisen ja kansallisen kuvailujärjestelmän kehityksessä on tietoaineistojen kontekstien kuvailun erottaminen varsinaisesta tietoaineistojen kuvailusta omiksi kuvailukohteiksi. Konteksteilla tarkoitetaan ensisijaisesti tehtävä- ja toimijakonteksteja. Kuvailu kertoo silloin, minkä tehtävien hoitamisesta ja minkä viranomaisten tai muiden toimijoiden toiminnassa tietoaineistot ovat syntyneet tai kertyneet ja niitä on käsitelty ja käytetty. Tehtävä- ja toimijakuvailut linkitetään niihin tietoaineistoihin, joiden kontekstia ne kuvaavat. Tästä seuraa, että tehtäviä ja toimijoita koskevaan arkistometatietoon on kiinnitettävä aiempaa enemmän huomiota.

Arkistokuvailun painopiste on siirtynyt tietoaineiston ominaispiirteiden kuvailusta aineiston ja sen kontekstien välisten suhteiden tunnistamiseen ja kuvailuun. Kontekstien kuvailussa tulee hyödyntää paitsi itse tai yhteistyössä muiden organisaatioiden kanssa tuotettua kuvailutietoa, myös mahdollisuuksien mukaan linkitettynä datana saatavilla olevia nimistöjä, sanastoja, luokituksia ja tunnisteita. Kuvailutyön painopiste siirtyy metatiedon tuottamisesta tietojen yhdistelyyn.

Myös itse tietoaineiston kuvailu jakaantuu ”aineiston” ja ”ilmentymän” kuvailuun. Tällöin tietoaineiston eri analogiset ja digitaaliset ilmentymät ja ilmentymäkohtaisten ominaisuuksien kuvailu voidaan erottaa toisistaan. Kun digitoidun aineiston alkuperäinen analoginen ilmentymä katsotaan arvonmäärityksessä arkistoitavaksi digitoidun ilmentymän ohessa, kuvailussa on kyettävä tekemään ero saman aineiston eri säilytysmuotoja edustavien ilmentymien välillä.

Lisäksi omina kohteinaan voidaan kuvailla tietoaineistojen elinkaarihallintaan ja tietoaineistoihin kohdistuviin muihin elinkaaritapahtumiin liittyvää tietoa, kuten aineiston käsittelyä ja arkistointia dokumentoivaa tietoa, ja aineistoon liittyviä käyttörajoituksia.

Piirroshiiri näyttää peukkua ja kehottaa noudattamaan ajantasaisia siirto-ohjeita.

Kuva. Arkistoitavien aineistojen siirroissa noudetaan aina Kansallisarkiston voimassa olevia siirto-ohjeita ja ohjeita säilytykseen hyväksyttävistä tiedostomuodoista.

Tiedonhallintalautakunnan asiankäsittelyn metatietosuositusta ja Kansallisarkiston arkistometatietoon liittyviä ohjeita ja suosituksia yhdistää se, että ne ovat tiedon- ja aineistonhallinnan metatietomäärityksiä. Niiden yhteinen tavoite on varmistaa, että tiedot ja tietoaineistot säilyvät todistusvoimaisina, käytettävinä ja ymmärrettävinä koko niiden elinkaaren ajan.


Suunnittele metatiedon tuottaminen ja ylläpito

Arkistoinnin metatietomääritykset pyrkivät osaltaan varmistamaan tietoaineistojen todistusvoimaisuuden ja tukemaan niiden hyödynnettävyyttä tiedon uudelleenkäytön tavasta, ajasta ja paikasta riippumatta. Siksi tietty metatieto voi arkistoitavan tietoaineiston yhteydessä olla tarpeellinen, vaikka muun tiedonhallinnan konteksti, standardit, käytännöt, lainsäädäntö tai yksittäinen tietojärjestelmä eivät sitä edellyttäisi. Myös nimellisesti samaa metatietoa koskevat vaatimukset voivat arkistokuvailun näkökulmasta olla erilaisia kuin organisaation muun tiedonhallinnan näkökulmasta. 

Tietoaineiston ja siihen liittyvän arkistometatiedon välisen yhteyden säilyminen on varmistettava elinkaaren kaikissa vaiheissa. Erityisen tärkeää se on silloin, kun kuvailutieto ei ole suoraan tietoaineiston yhteydessä. Esimerkiksi arkistolain (831/1994)Ikoni_linkki_ulkoiselle_sivullemukaisissa arkistonmuodostussuunnitelmissa ja tiedonhallintalain (906/2019)Ikoni_linkki_ulkoiselle_sivullemukaisessa tiedonhallintamallissa ylläpidettävien tietojen avulla hallinnoidaan ja dokumentoidaan osaltaan tietoaineistojen kontekstitietoja, kuten yhteyttä siihen tehtävään ja toimintaprosessiin, jonka hoitamisen yhteydessä aineistot muodostuvat, sekä elinkaaritapahtumia, kuten tuhoamista, arkistointia ja arkistosiirtoja. Näiden tietojen yhdistäminen tietoaineistoihin vaatii tiedonhallinnan ja arkistoinnin asiantuntemusta tiedon elinkaaren kaikissa vaiheissa. Apuna ovat myös tiedon ja tietoaineistojen luokittelu sekä erilaiset tunnisteet.

Piirroshiiri kertoo hoksanneensa että arkistometatietoa muodostuu monessa paikassa. Muun muassa kuvailussa, asiankäsittelyssä, tiedonhallinnan kuvauksissa ja alakohtaisesti.

Kuva. Arkistometatiedolla tarkoitetaan sellaista metatietokokonaisuutta, joka auttaa varmistamaan arkistoitavien tietoaineistojen ymmärrettävyyden, todistusvoimaisuuden, tunnistamisen ja käytettävyyden. Kuvailun lisäksi alakohtainen metatieto, asiankäsittelyn metatieto ja muu tiedonhallinnan metatieto tukevat tietoaineistojen todistusvoimaisuutta, käytettävyyttä ja monipuolista hallintaa.

Kuvailussa voi tukeutua tekstimuotoisiin kuvailutietoihin, mutta erityisesti koneluettavuutta tukevat määrämuotoiset ja rakenteiset ratkaisut helpottavat kuvailutiedon hallintaa, laatua ja monikäyttöisyyttä sekä tiedon myöhempää käsittelyä. Metatiedon tuottaminen kannattaa automatisoida aina kun se on mahdollista. Jos metatietoa pitää lisätä manuaalisesti, varmista, että tätä varten on olemassa selkeä toimintatapa ja ohjeistus. Kuvailutiedon tuottaminen ja ylläpito pitää kaikissa tapauksissa suunnitella, määritellä ja dokumentoida huolellisesti ja sen laatua pitää valvoa.

Rise vai Rikosseuraamuslaitos? Hilkka vai Hilkka-asianhallintajärjestelmä? Kun suunnittelet arkistoitavien tietoaineistojen metatietoja, pidä mielessä niiden tuleva käyttökonteksti arkistossa. Kuvailutietojen on oltava itsenäisesti ymmärrettäviä, koska käyttäjän pitää pystyä ymmärtämään niitä ilman lisätietoja tai muita apuvälineitä. Esimerkiksi lyhenteet, jotka kuvailuhetkellä ovat ymmärrettäviä ja vakiintuneita, muuttuvat ilman lisätietoa nopeasti tunnistamattomiksi. Kirjoita lyhenteet aina auki tai vältä niiden käyttämistä kokonaan.

Hyödynnä arkistometatiedon tuottamisessa standardoituja merkintätapoja (esimerkiksi ajanilmauksille) sekä yleisiä että ala- ja organisaatiokohtaisia sanastoja, nimistöjä, luokituksia ja koodistoja. Arkistoitavan tiedon myöhemmän ymmärrettävyyden ja käytettävyyden varmistamiseksi on tärkeää myös dokumentoida tai arkistoida käytetyt luokitukset, koodistot ja koodistoavaimet. Lisäksi on tärkeää säilyttää tietojen ja aineiston yhteydet niille niiden elinkaaren aikana annettuihin luokituksiin ja tunnisteisiin sekä huolehtia näiden säilymisestä ymmärrettävinä.

Voit käyttää metatietojen tuottamisessa suunnitellusti ja hallitusti muun muassa:

  • Erilaisia oletusmetatietoja, jotka tietoaineisto saa ennakkomäärittelyjen mukaisesti jo muodostumisvaiheessaan tai muun käsittelynsä aikana. Oletusmetatietojen arvoja muutetaan, jos muodostuvan tiedon luonne sitä vaatii. Tämä tapa on muun muun muassa tiedonohjauksen taustalla.

  • Työnkulkuja ja esimerkiksi automaattisia aikaleimoja. Tietojärjestelmät tuottavat yleensä automaattisesti ajoitustiedot, kun asiakirja tai muu tietokokonaisuus muodostetaan, sitä muutetaan tai muuten käsitellään tai se merkitään valmiiksi tai arkistoiduksi.

  • Metatiedon periyttämistä hallitusti esimerkiksi hierarkkisesti ylemmältä tasolta tiedon alemmille tasoille. Halutut kuvailu- tai käyttörajoitustiedot voidaan esimerkiksi tarvittaessa periyttää koskemaan kaikkia samaan tietoaineistoon kuuluvia asiakirjoja.

  • Metatietojen rikastamista tai korjaamista massana esimerkiksi migraatioiden yhteydessä eli silloin, kun tietoaineistoja siirretään tai muuten käsitellään. Puuttuvia metatietoja voidaan lisätä, ylimääräisiä metatietoja poistaa tai virheellisiä tietoja korjata. Metatietoja voidaan yhdistää tai toisaalta erotella omiksi tiedoikseen. Arvolistojen tai koodistoarvojen tietoja voidaan yhtenäistää tai selkeyttää ja esimerkiksi ajoitustietoja voidaan muuttaa standardoituihin muotoihin. Tietoaineistoille voidaan tuottaa myös esimerkiksi tieto siitä tehtäväluokasta, johon ne kuuluvat.

  • Tiedonhallinnan ja arkistoinnin kuvauksissa ylläpidettävää kuvailutietoa voidaan liittää tietoaineistoihin esimerkiksi arkistosiirron tai muun migraation yhteydessä, mikäli metatieto on laadultaan ja sisällöltään yhtenäistä. Tietoaineistoille voidaan tuottaa kuvauksista metatietoa esimerkiksi sen tietosisällöstä, tehtäväluokasta, omistajasta, elinkaaritapahtumista tai tietorakenteista.

✔ Luokittelu ja tunnisteet ovat tärkeitä digitaalisen tiedonhallinnan keinoja

Tiedon luokittelu mahdollistaa samankaltaisten tietojen koostamisen yhteen sekä käsittelemisen samoilla periaatteilla ja säännöillä. Luokittelu auttaa myös rajaamaan ja kohdistamaan tietoaineiston vaatimia hallintatoimenpiteitä.

Tunnisteet ovat johonkin kohteeseen, tietoon tai aineistoon liittyviä yksilöiviä, ainutkertaisia tunnuksia, joiden avulla kohteeseen voidaan yksiselitteisesti viitata. Ne auttavat yhdistelemään tietoaineistoja tai esimerkiksi tietoaineistoja ja niiden kuvailutietoja myös silloin, kun tietoja ei säilytetä tai ylläpidetä samassa järjestelmässä tai paikassa:

  • Tunnus tai tunniste voi yksilöidä kohteita yksittäisen tietojärjestelmän tai organisaation sisällä. Tuttu esimerkki tunnisteesta on asioiden ja asiakirjojen rekisteröinnin yhteydessä saama asiatunnus.

  • Globaalisti yksilöivät tunnukset yksilöivät kohteen ainutlaatuisesti ja pysyvästi. Ne perustuvat ylläpidettyihin tunnistejärjestelmiin, jotka mahdollistavat tunnisteen luotettavan hyödyntämisen ajasta, paikasta tai organisaatiosta riippumatta.

  • Tunnisteita saavat tietoaineistojen lisäksi monenlaiset reaalimaailmaan kohteet, muun muassa organisaatiot ja rakennukset.

Metatiedot on usein hyvä toteuttaa niiden hallinnan vuoksi rakenteisesti. Silloin metatiedolle määritetään riittävä määrä sitä laajentavia tai tarkentavia ominaisuuksia. Aineistoon liittyvän tunnisteen arvon lisäksi sen yhteydessä pitää kertoa muun muassa se, millaisesta tunnisteesta on kyse eli kerrottava tunnisteen tyyppi tai tunnistejärjestelmä, johon se perustuu. Esimerkiksi aineiston OID-tunnisteen metatietorakenne voisi yksinkertaisimmillaan koostua itse tunnisteen arvoa esittävästä merkkijonosta ja tyyppitiedosta, joka kertoo, että kyseessä on nimenomaan OID-tunniste:

  • Tunnisteen arvo: 1.2.246.10.1901409.10.0

  • Tunnisteen tyyppi: ISO OID


Jäsennä ja kuvaile tietoaineistoja useista näkökulmista

Kansallisarkiston Arkistoitavien tietoaineistojen perusmetatiedot -suositus esittää tietoaineistojen ja niiden kontekstin kuvailun moniulotteisena suhdeverkostona. Tiedon myöhemmän ymmärrettävyyden varmistamiseksi tietoaineiston suhteita kuvaillaan tietoaineiston sisällön ja rakenteen lisäksi muihin tietoaineistoihin ja niihin yhteyksiin, joissa tietoaineistoa on elinkaarensa aikana käsitelty. Erityisen tärkeää on huomioida tiedon syntykonteksti. Tietoaineistot pitää kuvailutiedon ja muun metatiedon avulla kytkeä niiden muodostumiseen liittyviin toimijoihin, toimintaan ja tehtäviin. Tiedon elinkaaren aikana on tarpeen myös hallita aineistojen ja ilmentymien elinkaaritapahtumien metatietoja.

image-20241116-135024.png

Kuva. Arkistoitavien tietoaineistojen perusmetatiedot -suositus esittää tietoaineistojen ja niiden kontekstin kuvailun suhteiden verkostona. Aineistot eli asiakirjakokonaisuudet ja asiakirjat muodostuvat toimijan tehtävien hoitamisen ja muun toiminnan yhteydessä. Ne todentavat tätä toimintaa. Toiminta tapahtuu ajassa ja paikassa. Aineistoilla voi olla useita ilmentymiä eli fyysisiä ilmenemismuotoja. Aineistot voivat myös liittyä toisiinsa eri tavoin, ja niihin voi liittyä useita käyttörajoituksia.

Tietoaineiston tarkastelu useista eri näkökulmista helpottaa kuvailua. Se myös parantaa kuvailun laatua ja kattavuutta. Samalla muodostuu kuva siitä toiminnasta, jonka yhteydessä tieto on muodostunut. Tietosisällön, tehtäväkontekstin ja toimijan kuvaileminen täydentävät toisiaan ja kertovat aineistosta eri näkökulmista. Tietorakenteen kuvailu ja dokumentointi tarjoaa vielä yhden uuden näkökulman, joka auttaa myös säilyttämään ja käyttämään tietoa sen elinkaaren myöhemmissä vaiheissa.

Elinkaaritapahtumat ovat tietoaineistoon tai johonkin sen ilmentymään kohdistuvia suunniteltuja toimenpiteitä tai hallitsemattomia tapahtumia, jotka voivat vaikuttaa niiden ymmärrettävyyteen, saatavuuteen tai eheyteen. Ilmentymällä tarkoitetaan tietoaineiston digitaalisia tai analogisia ilmenemismuotoja, joita muodostuu, kun tietoa tallennetaan jollekin tallennusvälineelle tai -alustalle.

✔ Tietoaineiston ja sen ilmentymien välinen suhde voi olla monimuotoinen

Tietoaineistoilla ja asiakirjoilla voi olla useita ilmentymiä. Osa niistä voi olla olemassa yhtä aikaa, osa taas on voitu jo tuhota. Tyypillinen esimerkki ilmentymästä on analogisesta asiakirjasta digitoimalla tuotettu digitaalinen ilmentymä.

Ilmentymän kautta voidaan kuvailla sellaisia aineiston ominaisuuksia, jotka ovat riippuvaisia nimenomaan asiakirjan tai tietoaineiston tietystä ilmenemismuodosta. Samoin voidaan kuvata eri ilmentymien välisiä suhteita. Ilmentymiä ei aina tarvitse kuvailla erikseen, vaan niitä voidaan kuvailla itse tietoaineiston yhteydessä. Joskus ilmentymän kuvailu kuitenkin on tarpeen tai jopa välttämätöntä.

Huomaa, että digitaalisen tiedon kohdalla alkuperäisen tietoaineiston ja sen erilaisten ilmentymien välinen suhde voi olla monimuotoinen. Pohdi esimerkiksi sitä, muodostuuko tietoaineistosta kokonaan uusi ilmentymä silloin, kun se siirretään tietojärjestelmästä toiseen. Arvioi tarvittaessa myös ilmentymän ja aineiston elinkaaritapahtumien välistä suhdetta.

Elinkaaritapahtumien jäsentämistä voit hyödyntää sekä tietoaineistojen ja ilmentymien elinkaaren suunnittelussa että niiden dokumentoinnissa ja kuvailussa. Minimivaatimus on, että tietoaineistoon merkittävästi vaikuttavien tapahtumien yhteydessä aina arvioidaan sitä, pitääkö tapahtuma jollakin tavalla kuvailla tai dokumentoida, jotta tietoaineistoa pystytään sen elinkaaren myöhemmissä vaiheissa myös näiltä osin ymmärtämään ja tulkitsemaan. Elinkaaritapahtumiin liittyviä näkökulmia voi hyödyntää myös tietojärjestelmien toiminnallisuuksien arvioinnissa ja kehittämisessä.

✔ Elinkaaritapahtumat tukevat arkistoinnin suunnittelua ja tietoaineistojen dokumentointia

Suunnitellut eli tulevat elinkaaritapahtumat auttavat hallinnoimaan ja toteuttamaan tietoaineistojen elinkaaren eri vaiheissa edellyttämiä hallintatoimenpiteitä. Niitä voivat olla muun muassa:

  • Migraatio, digitointi, kuvailu ja muu metatietojen tuottaminen

  • Elinkaaren vaiheen muutos, käyttörajoituksiin, käyttöoikeuksiin tai tiedon omistajuuteen liittyvä muutos tai siirto arkistoon.

Eri tavoin hallitsemattomat tapahtumat voivat vaikuttaa tiedon ymmärrettävyyteen, saatavuuteen tai eheyteen. Niitä voivat olla esimerkiksi:

  • Tiedon korruptoituminen, katoaminen, tietojen eriytyminen toisistaan, tiedon alkuperään tai omistajuuteen liittyvän informaation hämärtyminen

  • Kun menneet elinkaaritapahtumat dokumentoituvat tietoaineiston yhteyteen, ne samalla kuvailevat ja dokumentoivat suoraan tiedon ja aineistojen autenttisuuden, eheyden ja tulkinnan kannalta merkityksellisiä synty-, säilytys-, käsittely- ja omistushistoriaan liittyviä tapahtumia ja toimenpiteitä.

📌 Erilaiset näkökulmat helpottavat kuvailua ja parantavat sen kattavuutta

Tietosisällön kuvailu

Tietosisällön kuvailu kertoo tietoaineistosta ja sen sisällöstä kokonaisuutena. Se tarjoaa yleiskuvan ja perustiedon lisäksi aineiston ymmärtämistä ja käyttöä tukevia yksityiskohtia.

Esimerkiksi: Sähköinen diaari on ollut käytössä ja muodostunut vuosina 1988–1997. Diaari on asiarekisteri, joka sisältää tiedot saapuneista ja käsiteltäviksi otetuista asioista, niiden välivaiheista sekä ratkaisuista. Diaariin merkityt asiakirjat on säilytetty ensin analogisessa muodossa arkistotunnuksella X ja myöhemmin digitoitu.

Toiminnan, tehtävän ja toimijan kuvailu

Toiminnan, tehtävän ja toimijan kuvailu asettaa tietoaineistot niiden muodostumista ja käyttöä koskevaan kontekstiin. Se myös tukee ja täydentää aineiston tietosisällön kuvailua.

Esimerkiksi: Virasto X:n toimintavuodet ovat 1960–1997. Sen seuraaja on virasto XY vuodesta 1998. Virasto X oli alueviranomainen, joka edisti, arvioi ja valvoi alueella tapahtuvia julkisia palveluja liikunta- ja nuorisotoimessa sekä opetus- ja kulttuurihallinnossa.

Tietorakenteen kuvailu ja dokumentointi

Tietorakenteen kuvailu ja dokumentointi kuvaa tietoaineiston fyysisiä ja loogisia rakenteita. Se tukee sekä tietoaineiston ymmärrettävyyttä, käyttöä, säilyvyyttä että digitaalista pitkäaikaissäilytystä.

Esimerkiksi: Sähköinen diaari on rakenteisessa muodossa oleva asiarekisteri, joka ei sisällä asiakirjatiedostoja. Diaari rakentuu seuraavista tietoryhmistä: asian metatiedot, toimenpiteiden metatiedot ja asiakirjojen metatiedot. Diaariin liittyy vireillepanijarekisteri. Asiarekisteriin liittyvät asiakirjat on säilytetty ensin analogisessa muodossa ja myöhemmin digitoitu.

Elinkaaritapahtumien kuvailu ja dokumentointi

Elinkaaritapahtumien kuvailu ja dokumentointi kuvaa tiedon, tietoaineistojen ja niiden ilmentymien käsittelyä. Se tukee sekä tietoaineiston ymmärrettävyyttä, käyttöä, säilyvyyttä että digitaalista pitkäaikaissäilytystä.

Esimerkiksi: Sähköinen diaari on otettu käyttöön 1.1.1988. Viimeiset uudet asiat on avattu 31.12.1997. Keskeneräiset asiat on siirretty 1.1.1998 alkaen käyttöön otettuun asianhallintajärjestelmään. Asioiden siirto on dokumentoitu asian yhteyteen vapaatekstikenttään. Diaarista on tulostettu paperille arkistotulosteet, jotka on tuhottu 5.8.2024 digitaalisten ilmentymien todistusvoimaisuuden arvioinnin jälkeen.

Ilmentymien kuvailu

Ilmentymien kuvailu kuvaa sellaisia tietoaineiston ominaisuuksia, jotka ovat riippuvaisia aineiston tietystä ilmenemismuodosta. Se tukee tietoaineiston ymmärrettävyyttä ja todistusvoimaisuutta.

Esimerkiksi: Diaarista on tulostettu vuosittain paperille arkistotulosteet, jotka on tuhottu 5.8.2024 digitaalisten ilmentymien todistusvoimaisuuden arvioinnin jälkeen. Arvioinnissa todettiin, että digitaalinen diaari on kattava ja ehyt.


Tue tietoaineistojen ymmärrettävyyttä ja käytettävyyttä dokumentoinnilla

Oheisdokumentaatiolla tarkoitetaan täydentävää dokumentaatiota, joka tukee arkistoitavan tietoaineiston käytettävyyttä, ymmärrettävyyttä ja tulkitsemista. Oheisdokumentaatio arkistoidaan yhdessä arkistoitavan tietoaineiston kanssa. Sitä kannattaa myös elinkaaren aiemmissa vaiheissa säilyttää joko tietoaineiston yhteydessä tai niin, että se on luotettavasti yhdistettävissä siihen.

Oheisdokumentaatiota voivat olla esimerkiksi yleiskuvaukset aineistosta tai toiminnasta, jonka tuloksena aineisto on muodostunut. Se kuvaa usein myös tietorakenteita ja tarvittaessa aineiston käyttötapoja erilaisissa käyttöyhteyksissä.

Arkistoitavan tietoaineiston dokumentointitarve riippuu aineiston tietosisällöstä ja käyttötarkoituksesta, tiedon muodosta sekä tietojärjestelmistä tai sovelluksista, joissa tietoa on käsitelty. Joskus dokumentointia ei tarvitse tuottaa erikseen, vaan hyödynnetään sellaista monipuolista informaatiota, jota tiedon elinkaaren varrella on jo kertynyt ja tuotettu. Usein dokumentaatiota pitää arkistoinnin yhteydessä silti täydentää. Dokumentaation määrää ja laatua kannattaa siksi arvioida tiedon elinkaaren eri vaiheissa ja tietoaineiston tai järjestelmän elinkaaritapahtumien yhteydessä.

Dokumentaatiota muodostuu muun muassa tiedon elinkaaren suunnittelussa ja hallinnassa käytettävistä kuvauksista, kuten tiedonhallintamallista, arkistonmuodostussuunnitelmasta tai tiedonohjaussuunnitelmasta. Myöhemmin tiedon käytön ja muun käsittelyn yhteydessä kertyy erilaisia määrityksiä, ohjeita ja selosteita. Lisäksi on tärkeää säilyttää aineiston yhteydessä dokumentaatiota sen muodostumiseen ja käyttöön liittyvistä suosituksista ja standardeista.

Tietojärjestelmien kehittämisen ja ylläpidon yhteydessä syntyy tiedon muodosta, käyttötavoista, sisällöstä ja kontekstista kertovaa dokumentaatiota. Esimerkiksi tietojärjestelmien tai tietokantojen tietomallit, tekninen dokumentaatio ja ohjeistukset dokumentoivat järjestelmiä ja tietorakenteita, mutta myös itse tietoa ja sen käyttötapoja. Niiden säilyttäminen auttaa varmistamaan myös sitä, että arkistoitavaa aineistoa pystytään säilyttämään eheästi ja käsitellään koneellisesti. Tietokannat ja järjestelmät voivat rakentua hyvin eri tavoin, joten myös niitä täydentävän dokumentaation muoto ja tarve vaihtelee.

✔ Esimerkki dokumentoinnista: Tietokantojen arkistointi ja dokumentointi

Tietokantojen ja niiden sisältämän datan arkistointiin, arkistointitapaan ja myös tarvittavaan oheisdokumentaatioon vaikuttaa paljon se, miten johdonmukaisesti tietokanta itsessään on dokumentoitu. Tietokantoja arkistoidaan muun muassa datakoosteina, joihin tietokannan taulujen sisältö on tuotettu rakenteiseen muotoon. Esitystapa tai tiedostomuoto on tällöin esimerkiksi XML, CSV tai JSON. Osa tietokannan tietoelementtien kuvailusta voidaan tallentaa osaksi itse datakoostetta, mutta yleensä sen rinnalle tarvitaan datakoosteen tiedostomuodosta riippuen esimerkiksi erillinen skeematiedosto tai muuta teknisen rakenteen dokumentointia.

Kansallisarkistoon otetaan tietokantoja vastaan myös erityisesti relaatiotietokantojen arkistointiin kehitetyssä avoimen lähdekoodin SIARD-säilytysformaatissa. Relaatiotietokannan tietojen tallentaminen SIARD-muotoon parantaa niiden käytettävyyttä. SIARD ei tallenna käyttöliittymän ominaisuuksia, eikä aineisto ole sellaisenaan käytettävissä oleva operatiivinen tietokanta. Sisältö voidaan kuitenkin palauttaa käytettäväksi tietokannanhallintajärjestelmään.

Tietokannan sujuvan uudelleenkäytön ja ymmärtämisen takaamiseksi tietokannan pitäisi aina sisältää muun muassa sen tauluja ja sarakkeita kuvaavat nimet, niiden väliset suhteet ja taulukot, joissa koodatut arvot on avattu. Tietokanta voi sisältää myös näkymiä tärkeiden tietojen visualisointia varten. Sen käyttöä ja ymmärrettävyyttä voi tukea lisäksi muilla visualisoinneilla sekä aina tietomallilla, josta pystytään esittämään yhteydet käsitemalleihin.

📚 Lue lisää SIARD-formaatistaIkoni_linkki_ulkoiselle_sivulle


Oheisdokumentaation monet muodot

Oheisdokumentaatio voi olla erilaisissa muodoissa:

  • Tekstitiedostot, esimerkiksi selosteet ja käyttöohjeet, hyödynnetyt suositukset, standardit

  • UML-kaaviot tai muut tiedon mallintamisessa käytetyt kuvaukset

  • Skeemat

  • Kuvat ja kuvakaappaukset, mukaan lukien järjestelmän käyttöliittymä tai tietokannan hallintanäkymät ja taulut

  • Videoklipit, jotka dokumentoivat esimerkiksi tiedon käyttötapoja alkuperäisessä järjestelmässä.

Huomaa, että oheisdokumentaation pitää olla itsenäisesti ymmärrettävää. Se ei saa olla riippuvaista ulkoisista tietolähteisestä, esimerkiksi internetissä ylläpidettävästä tiedosta. Oheisdokumentaatio pitää myös tallentaa pitkäaikaissäilytettävään muotoon aivan samalla tavalla kuin muukin arkistoitava tietoaineisto.

Oheinen taulukko löytyy Kansallisarkiston Sähköisen arkistoinnin palvelun rakenteisten tietoaineistojen siirto-ohjeesta. Se kertoo siitä, millaista oheisdokumentaatiota tyypillisesti arkistoidaan Kansallisarkistoon siirrettävien tietoaineistojen kanssa.

TAULUKKO. Oheisdokumentaation avulla kuvattavia kokonaisuuksia

Yleiskuvaus siirrettävästä aineistosta

  • vapaa kuvaus

  • esimerkiksi asiakirjajulkisuuskuvaus ja muut valmiit kuvaukset

  • muut tarvittavat dokumentit

Data-aineiston syntykonteksti

Kuvaukset toiminnasta, jonka tuloksena aineisto on muodostunut

  • vapaa kuvaus

  • esimerkiksi liittyvät lait, asetukset, normit

  • toimintaohjeet, toimintakertomukset, raportit tms.

  • muut tarvittavat dokumentit

Kuvaus data-aineiston muodostumisprosessista ja tietojen alkuperästä

 

  • mistä lähteistä tietoja on saatu tai saadaan

  • miten tiedot on kerätty eri lähteistä

  • mahdolliset ohjeet ja säännöt, jotka määrittelevät, miten tiedot on kirjattu/tallennettu alkuperäisessä ympäristössä

  • miten tietoja on käsitelty

Data-aineiston tietorakenteiden kuvaus

 

  • aineiston sisäinen tietorakenne

  • yhteys Kansallisarkiston seulontapäätöksessä yksilöityihin, arkistoitaviksi määrättyihin tietokokonaisuuksiin

  • seloste siirrettävästä tietoaineistosta pois jätetyistä kentistä tai tauluista ja niiden sisällöstä

Kuvaustapana voidaan käyttää graafisia tietomallikuvauksia (esim. ER-malli) ja teksti- tai taulukkodokumentteja tietojen rakenteista ja suhteista.

Data-aineiston sisältämien koodistojen ja niiden arvojoukkojen kuvaukset

  • data-aineistossa hyödynnetyt yleiset koodistot ja niiden arvojoukot

  • data-aineistossa hyödynnetyt organisaation sisäiset koodistot ja niiden arvojoukot

Data-aineistossa hyödynnetyt standardit ja suositukset

  • hyödynnetyt yleiset standardit ja suositukset

  • hyödynnetyt alakohtaiset standardit ja suositukset

Kattavat esimerkit data-aineiston käyttötavoista, käytöstä ja hyödyntämisestä

  • vapaa kuvaus

  • ohjeet

  • dokumentoivat kuvakaappaukset

Siirrettävään kokonaisuuteen kuuluvat datakoosteet

  • seloste (esimerkiksi taulukko) datakoosteista

  • viittaus tiedoston nimen ja sisällön välillä

Datakoosteiden rakenne

  • datakoosteiden sisäinen tietorakenne

  • datakoosteiden väliset suhteet ja rakenteet


Muistilista

  • Arkistoitavaksi säädettyjä tai määrättyjä tietoaineistoja säilytetään ilman aikarajaa osana asiakirjallista kulttuuriperintöä. Käyttö on pääasiassa monipuolista tutkimuskäyttöä. Aineistoja pitää pystyä hyödyntämään, vaikka käyttäjä ei tuntisi tietoaineistoa, sen historiaa ja alkuperäisiä käyttötapoja. Siksi arkistoinnissa hyödynnetään muiden digitaalisen tiedon hallinnan keinojen rinnalla myös tiedon ja aineistojen kuvailua ja dokumentointia.

  • Arkistometatiedolla tarkoitetaan sellaista metatietokokonaisuutta, joka auttaa varmistamaan tietoaineistojen ymmärrettävyyden, todistusvoimaisuuden, tunnistamisen ja käytettävyyden myös arkistoinnin jälkeen. Kuvailevan metatiedon lisäksi arkistometatietoon kuuluu siksi myös tietoaineistojen arkistointia ohjaavaa hallinnollista metatietoa.

  • Tietoaineistoon pitää aina liittyä riittävä metatietokokonaisuus, joka varmistaa sen ymmärrettävyyden, hakemisen ja käyttämisen. Tarpeellisen metatiedon pitää seurata tietoaineiston mukana koko sen elinkaaren ajan. Arkistometatieto ei korvaa muita metatietoja, vaan tuo tietoaineistojen hallintaan oman näkökulmansa.

  • Tietoaineistojen arkistointitarkoitusten huomiointi metatietojen tuottamisessa on osa julkishallinnon toimijan tiedonhallintatehtävää.

  • Metatiedon riittävyyttä pitää arvioida käytännöllisesti, tarvittaessa tapauskohtaisesti ja riskiperusteisesti. Se kannattaa ottaa näkökulmana ja toimintatapana osaksi organisaation tiedonhallintaa.

  • Kuvailutietoa pitää tuottaa, kun tietoaineistojen ymmärrettävyys, käytettävyys, säilyvyys tai autenttisuuden ja eheyden varmistaminen sitä edellyttää.

  • Kuvailutiedon tarkentamisen ja rikastamisen tarve pitää arvioida aina, kun arkistoitavia tietoaineistoja siirretään tietojärjestelmistä toiseen tai arkistoon. Myös itse kuvailu on elinkaaritapahtuma. Sen tuottaminen pitää dokumentoida.

  • Tietoaineiston ja kuvailutiedon välisen yhteyden säilyminen pitää varmistaa elinkaaren kaikissa vaiheissa. Erityisen tärkeää se on silloin, kun kuvailutieto ei ole suoraan tietoaineiston yhteydessä.

  • Tiedonhallinnan ja arkistoinnin kuvauksissa ylläpidettävää kuvailutietoa voidaan liittää tietoaineistoihin esimerkiksi arkistosiirron tai muun migraation yhteydessä, mikäli metatieto on laadultaan ja sisällöltään yhtenäistä. Tietoaineistoille voidaan tuottaa kuvauksista metatietoa esimerkiksi sen tietosisällöstä, tehtäväluokasta, omistajasta, elinkaaritapahtumista tai tietorakenteista.

  • Kun tietoaineistoja siirretään Kansallisarkistoon tulee noudattaa ajantasaista siirto-ohjeistusta ja Kansallisarkiston määrittelemiä siirtorakenteita. Tämä voi edellyttää käytettyjen metatietoarvojen sovittamista yhteen esimerkiksi tietyssä siirtoskeemassa vaaditun metatietojen esitystavan kanssa.

  • Oheisdokumentaatio arkistoidaan yhdessä arkistoitavan tietoaineiston kanssa. Sitä kannattaa myös elinkaaren aiemmissa vaiheissa säilyttää joko tietoaineiston yhteydessä tai niin, että se on luotettavasti yhdistettävissä siihen. Myös oheisdokumentaatio pitää tallentaa pitkäaikaissäilytettävään muotoon aivan samalla tavalla kuin muukin arkistoitava tietoaineisto.

JavaScript errors detected

Please note, these errors can depend on your browser setup.

If this problem persists, please contact our support.