Muut digitaaliset tietoaineistot - siirtopaketin muodostaminen
1. Ohjeen tarkoitus
Ohjeessa kuvataan, miten muodostetaan Kansallisarkistoon siirrettävä siirtopaketti sellaisesta digitaalisesta tietoaineistosta, joka ei sovi siirrettäväksi muissa Sähköisen arkistoinnin palvelun määrittelemissä siirtopakettityypeissä. Siirrettävä aineisto voi olla esimerkiksi verkkolevyillä säilytettyä monimuotoista aineistoa mukaan lukien AV-aineistot. Ohjetta tulee hyödyntää yhdessä taulukon 1 dokumenttien kanssa.
Tässä ohjeessa Siirtäjällä tarkoitetaan organisaatiota, joka on Kansallisarkistoon siirrettävän tietoaineiston rekisterinpitäjä/hallinnoija.
Taulukko 1 Viittaukset muihin ohjeisiin ja dokumentteihin
Dokumentti | Tarkoitus |
Vastaanotettavia tiedostoja koskevat ohjeet -ohje ja sen LIITE 1 Luettelo Kansallisarkistoon vastaanotettavista tiedostomuodoista sekä LIITE 2 Tekniset vaatimukset AV-tiedostoille | Ohjeessa kuvataan Kansallisarkistoon vastaanotettavia tiedostoja koskevat yleiset vaatimukset, tekstitiedostoissa sallitut merkistöt ja siirtokelpoiset tiedostoformaatit. Ohjeeseen on eritelty, missä siirtorakenteessa mitäkin tiedostomuotoa voi siirtää. Ohje on Kansallisarkiston verkkosivuilla. |
Metatietolomake | Siirtäjä ilmoittaa metatietolomakkeella Sähköisen arkistoinnin palvelulle siirtoerää koskevat metatiedot. Siirtäjä voi hyödyntää metatietolomaketta siirrettävän aineistokokonaisuuden rakenteen, arkistollisen kontekstin kuvailutietojen ja käyttörajoitusten kokonaisuuden hahmottamisessa. Lomake on Kansallisarkiston verkkosivuilla. |
2. Siirrettävä aineisto ja siirtoerät
Muilla digitaalisilla tietoaineistoilla tarkoitetaan tässä ohjeessa audiovisuaalista tietoaineistoa, kuva-aineistoa tai muuta digitaalista tietoaineistoa, joka ei sovellu siirrettäväksi muissa siirtorakenteissa. Siirrettävien tiedostojen on oltava Kansallisarkiston hyväksymässä muodossa.
Siirrettävä tietoaineisto yksilöidään Kansallisarkiston ja Siirtäjän välisessä siirtosuunnitelmassa, jonka Siirtäjä on toimittanut Kansallisarkistoon. Siirrosta sopimisen ja siirtosuunnitelman perusteella siirrettävästä tietoaineistosta koostetaan yksi tai useampi siirtoerä. Yksittäinen siirtoerä on looginen, ehyt ja valmis kokonaisuus, jonka aineistoihin tai tietoihin ei kohdistu enää muokkaustarpeita.
Kun siirtoeriä on useampia, Siirtäjän tulee huolehtia, että jokaisen siirtoerän osalta kaikki arkistoitavaksi määrätty aineisto tulee siirretyksi.
Siirtoerä jaetaan yhteen tai useampaan siirrettävään kokonaisuuteen, joka tallennetaan ohjeiden mukaiseen hakemistorakenteeseen ja paketoidaan siirtoa varten tiedostoksi (siirtopaketti), katso luku 3.
Kansallisarkisto ei tarjoa työkaluja siirtopakettien muodostamiseen, vaan Siirtäjän on muodostettava siirtopaketti käytössään olevilla työkaluilla tai luotava tarvittava ratkaisu sovellustoimittajansa/palveluntarjoajansa tai muun teknisen kumppanin kanssa

Kuva 1 Siirrettävä aineisto muodostaa yhden tai useamman loogisen siirtoerän, josta muodostetaan yksi tai useampi siirtopaketti.
Onnistunut tietoaineistojen siirto edellyttää siirtopaketin muodostamista ohjeiden mukaisesti.
Pakettiin ei saa lisätä mitään muuta kuin ohjeen mukaiset hakemistot tiedostoineen.
Lue ohje tarkkaan, niin vältyt turhalta työltä.
Ohjeen tulkintaan liittyvissä kysymyksissä ole yhteydessä Sähköisen arkistoinnin palveluun.
3. Siirtopaketin muodostaminen
Hakemistorakenteet
Siirrettävä tietoaineisto pitää tallentaa kuvan 2 mukaiseen hakemistorakenteeseen (kansiorakenne).
Juurihakemisto nimetään Siirtäjän määrittämällä siirtopaketin yksilöllisellä tunnisteella. Tunnistetta käytetään myös siirtokäyttöliittymässä siirtopaketin kontekstimetatietojen luonnin yhteydessä. Tunnisteen avulla siirtopaketti yhdistetään siihen liittyviin metatietoihin. Mikäli siirtopaketille annettu yksilöllinen tunniste ja siirtokäyttöliittymässä määritetty tunniste eivät ole identtiset, ei tietoaineiston siirto käyttöliittymässä onnistu.
Siirrettävä tietoaineisto tallennetaan omaan alihakemistoonsa (master).

Kuva 2 Hakemistorakenne
Jokaiselle alihakemistossa siirrettävälle tiedostolle on laskettava tarkistussumma, jotta Kansallisarkisto voi varmistua, että säilytykseen otetaan eheä tiedosto. Tarkistussummat tallennetaan csv-tiedostoon, joka tallennetaan juurihakemistoon.
Hakemistojen ja tiedostojen nimet ja sisältö on kuvattu taulukoissa 2 ja 3. Hakemistojen nimet ovat merkkikokoriippuvaisia. Alihakemiston nimi kirjoitetaan pienellä alkukirjaimella.
Taulukko 2 Juurihakemiston sisältö
Hakemisto/Tiedosto | Selite/sisältö |
juurihakemisto | Juurihakemisto (pääkansio) pitää nimetä siirtopaketin tunnisteella, esimerkiksi Paketti1 tai vuodet9195. Siirtäjä määrittelee tämän tunnisteen siirtokäyttöliittymässä siirtopaketin kontekstimetatietojen luonnin yhteydessä. Olennaista on, että tunniste yksilöi siirtopaketin muista saman siirtoerän paketeista.
|
Alihakemistoissa olevat tiedostot nimetään lukujonon avulla. Lähtökohtaisesti lukujonon tulee koostua neljästä numerosta. Numerointi on juokseva niin, että ensimmäinen tiedosto saa nimen 0001, toinen 0002 jne. Alihakemisto itsessään nimetään pienellä alkukirjaimella ”master”.
Taulukko 3 Alihakemistojen sisältö
master | Alihakemisto sisältää siirrettävän tietoaineiston. Hakemisto on pakollinen, ja sen on sisällettävä tiedostoja.
|
siirtopaketin tunniste.csv | csv-tiedosto sisältää master-hakemiston sisältämien tiedostojen tiedostonimet (sarake Filenumber) ja tiedostoille lasketut tarkistussummat (sarake Hashvalue). Filenumber-sarakkeeseen ei sisällytetä tiedostopäätettä. Tarkistussumma annetaan muodossa MD5.
|
Siirtopaketti
Juurihakemisto nimetään siirtopaketin tunnisteella. Hakemistot (kansiot) tiedostoineen paketoidaan siirtopaketiksi eli yhdeksi TAR-tiedostoksi. TAR-tiedoston saa lisäksi pakata häviöttömään GZIP- (.tar.gz) tai BZIP2- (.tar.bz2) muotoon.
Kun siirtopaketti ladataan siirtokäyttöliittymään, sen nimenä käytetty tunniste ohjaa aineiston osaksi oikeaa kuvailukokonaisuutta Kansallisarkiston metatietovarannossa.

Kuva 3 Hakemistorakenne ja siirtopaketti. Tiedostot tallennetaan siirtopakettia varten kuvan mukaiseen hakemistorakenteeseen. Juurihakemisto nimetään siirtopaketin tunnisteella ja alihakemistot tiedostoineen paketoidaan yhdeksi TAR-tiedostoksi.
4. Tietoaineiston kuvailu
Siirrettävän tietoaineiston arkistointi vaatii aina erillistä kuvailua. Kuvailun avulla varmistetaan, että tietoaineisto säilyy saavutettavana ja ymmärrettävänä, vaikka käyttäjä ei tuntisi aineistoa tai sen alkuperäistä käyttötarkoitusta ja historiaa.
Siirtopaketit eli arkistoyksiköt kuvaillaan siirtokäyttöliittymässä ennen niiden vastaanottoa. Siirtäjä toimittaa Sähköisen arkistoinnin palvelulle myös siirrettävän tietoaineistokokonaisuuden ja siihen kuuluvien siirtoerien arkistollista kontekstia, käyttörajoituksia ja aineistoon liittyviä toimijoita kuvaavat metatiedot erillisellä metatietolomakkeella.
Siirtäjä voi hyödyntää metatietolomaketta myös aineistokokonaisuuden rakenteen hahmottamisessa ja siirtopakettien kontekstimetatietojen suunnittelussa ennen pakettien metatietojen määrittelyä siirtokäyttöliittymässä.
