Musiikkiarkiston digitaalinen aineisto ja sen säilyttäminen ennen Kulttuuriperintö-PAS-palvelun käyttöönottoa
Terveiset 35-vuotiaasta Musiikkiarkistosta. Näin juhlavuoden päätteeksi on hyvä käydä katsaus arkistomme digitaaliseen aineistoon ja sen säilyttämiseen. Jaan kirjoitukseni kahteen osaan:
- Osa 1: Musiikkiarkiston digitaalinen aineisto ja sen säilyttäminen ennen Kulttuuriperintö-PAS-palvelun käyttöönottoa
- Osa 2: Kulttuuriperintö-PAS-palvelun hyödyntäminen Musiikkiarkistossa
Musiikkiarkisto liittyi 1998 Kansanperinteen arkiston hankkeeseen, jonka tavoitteena oli digitoida ja konservoida vanhat, tuhoutumisvaarassa olevat ääninauhat. Yhteishankkeessa olivat lisäksi mukana Kotimaisten kielten keskus (KOTUS) ja Suomalaisen kirjallisuuden seura (SKS). Musiikkiarkistossa aloitettiin äänitteiden digitointi loppusyksynä 2000.
Alkuaikoina toiminta oli suhteellisen yksinkertaista: arkiston pienestä aineistomäärästä oli helppo valita digitoitaviksi kohtalaisen yhdenmukaiset avokelanauhat ja C-kasetit. Digitaalisen formaatinkin valinta oli ajan yleisen käytännön mukaisesti CD-tasoinen WAV-tiedosto. Äänitteiden lisäksi alkuaikoina digitoimme 2003 alkaen VHS-tallenteita DVD-levyille. VHS-nauhoille olimme1990-luvulla tallentaneet esimerkiksi kotimaista kevyttä musiikkia käsittelevät TV-ohjelmat sekä ulkomaiset musiikkidokumentit.
Ensimmäiset 20 vuotta olivat formaattien osalta yksinkertaista aikaa. Digitointi tuotti vain WAV- ja MPEG-tiedostoja; näistä jälkimmäiset eivät ole PAS-yhteensopivia AC-3-ääniraitansa vuoksi, mutta tuolloin ei PAS-palvelusta – eikä edes Kansallinen digitaalinen kirjasto -hankkeesta (KDK) – ollut etiäistäkään. Jonkin verran arkistossa oli myös digitaalisia valokuvia, mutta muu aineisto oli omilla medioillansa arkistotiloissa vasta odottamassa digitointia.
Pian digitointitoiminnan alkamisen jälkeen Musiikkiarkisto oli mukana TAPE-hankkeessa 2004–2008 (Training for Audiovisual Preservation in Europe), jota hallinnoi European Commission on Preservation and Access (ECPA). Hankkeen tarkoitus oli edistää audiovisuaalisen aineiston pitkäaikaiseen säilyttämiseen ja digitointiin liittyvän tietotaidon leviämistä Euroopassa koulutuksen, ohjeiden ja julkaisujen avulla.
Musiikkiarkisto avasi syksyllä 2007 kaikille kotimaisille muistiorganisaatioille tarkoitetun kuvien, videoiden ja äänitteiden digitoinnin ja digitaalisen pitkäaikaissäilyttämisen tietopalvelun Digiwikin, jonne kerättiin muun muassa TAPE-hankkeen aikana kerääntynyttä tietotaitoa. Loppuvuonna 2008 Digiwikiä alettiin hyödyntää Kansallinen digitaalinen kirjasto -hankkeessa. Näiden hankkeiden perintö elää tätä nykyä audiodigi.fi-palvelussa.
Aivan alussa kesästä 2000 alkaen digitaalinen aineisto varmuuskopioitiin Tandbergin 50-gigaisille SLR100-nauhoille. 2006 otettiin käyttöön LTO-2-sukupolven 200-gigaiset nauhat. Katselin juuri läpi LTO-2-nauhojen indeksit vuodelta 2011: 13 nauhaa sisälsivät ääni- ja kuvatiedostoja, lopuilla 48 nauhalla oli hieman päälle 5600 videotallennetta.
Musiikkiarkiston digitaalinen aineisto lisääntyi ja monipuolistui huomattavasti 2010-luvulla. Opetus- ja kulttuuriministeriön nuorisotyöttömyyttä vähentävän hankkeen seurauksena saimme 2010–2011palkattua noin vuodeksi kolme täysipäiväistä digitoijaa. 2012 otimme vastaan CD-valmistamo Dicentian konkurssipesän, joka sisältää noin 750 gigatavua CD- ja DVD-levyjen alkuperäisiä taittoaineistoja. Kokonsa puolesta tämän aineiston säilyttäminen ei ole ongelmallista, mutta se sisältää noin 188000 tiedostoa mitä erilaisimmissa formaateissa. Mitä tehdä esimerkiksi Freehand- ja InDesign-taittotiedostoille, PSD-, EPS- tai fonttitiedostoille? Onhan siellä seassa PAS-kelpoisia kuva-, ääni- ja tekstitiedostoja, mutta tuon kokonaisuuden siirtäminen PAS-palvelun säilytettäväksi on vähintäänkin haasteellista; PAS-palvelua ei tosin vieläkään ollut olemassa – KDK-hanke sentään oli käynnissä.

Digitaalisuuden etuja ei tarvinne nykyaikana perustella. Aineiston säilyvyyden lisäksi saavutettavuus ja käytettävyys saadaan varmistettua. Edellyttäen toki, että alkuperäismedian sisältö on saatu digitoitua.
Aineistomäärämme lisääntyi 2010-luvulla sen verran, että enää ei ollut mielekästä säilyttää teratavuittain aineistoa yksittäisillä kovalevyillä nauhavarmennuksen lisäksi. Ostimme arkistoon useita RAID-varmennettuja verkkolevyjä, jotta pääsy digitaalisiin arkistoaineistoihin olisi ollut nauhalta lukemista nopeampaa ja aineiston hallinnointi yksittäisiä levyjä käytännöllisempää. Luovuimme myös DVD-levyistä TV-tallenteiden käyttökopiovälineenä. Noihin aikoihin oli selvää, että itsekirjoitetut DVD-levyt eivät olleet säilytysvarmuudeltaan luotettavia, ja myös mediana DVD alkoi olla aikansa elänyt. Tiedostopohjainen aineistonhallinta yhdessä tai kahdessa levyjärjestelmässä oli huomattavasti järkevämpi ratkaisu, kuin puolentoista tuhannen yksittäisen DVD- tai muun median hallinnointi.
2013 otimme käyttöön LTO-3-sukupolven 400-gigaiset varmuuskopionauhat, jotka tulivatkin tarpeeseen. Edellä mainittujen aineistojen lisäksi 2013 Oranssi ry:n kanssa toteutetun hankkeen seurauksena saimme arkistoomme noin 3,5 teratavua pienlehtiskannauksia TIFF-muodossa, ja 2014 alkaen Suomen Akatemian rahoittama Musiikki, monikulttuurisuus ja Suomi -hanke tuotti lähes viisi teratavua video-, ääni- ja kuva-aineistoa.
Pian tulikin tarpeeseen päivittää varmuuskopiointinauhat noin kaksiteraisiin LTO-6-sukupolven nauhoihin 2017. Kreivin aikaan, etten sanoisi, sillä 2010-luvun puolivälistä alkaen arkistoomme tuli suuria aineistoja esimerkiksi Lauri Luhdalta (noin 6,6 Tt), Hasse Wallilta (noin 10 Tt), Suomen äänitearkisto ry:ltä (vajaa teratavu), Populaarimusiikin museolta (POMUS, noin 8 Tt), Hannu Puttoselta (noin 1,5 Tt) sekä Matti ja Pirjo Bergströmiltä (noin 1,7 Tt). Osa aineistoista oli saatu arkistoon digitaalisina tiedostoina, mutta suurin osa vastaanotetusta aineistosta on digitoitu Musiikkiarkistossa. Digitoimiseksi laskettakoon tässä yhteydessä myös esimerkiksi syntysähköisten MiniDV-nauhojen sisältöjen siirtäminen kameraa käyttäen tietokoneelle videotiedostoiksi sekä digitaalisten DAT-nauhojen sisältöjen siirtäminen tietokoneelle äänitiedostoiksi.
Digitointitoimintamme oli erityisesti videopuolella monipuolistunut 2010-luvulla aineistolahjoitusten seurauksena, ja nykyään erilaiset videotiedostot vievätkin arkistossamme eniten tallennustilaa. Alkuperäisformaattien kirjo sekä ääni- että videopuolella on, no, sanalla sanoen kirjava. Äänitteistä yleisimpinä mainittakoon vaikkapa avokelanauha, C-kasetti, DAT, ADAT, mikro- ja minikasetit, äänilevyt, MiniDisc, CD sekä Elcaset. Videoformaateista mainittakoon VHS, VHS-C, Betamax, Betacam SP, Digital Betacam, MiniDV, Video8, Hi8, Digital8 ja DVD. Mitä milläkin medialla on sisällänsä, millä nopeudella, kohinanpoistolla, ekvalisoinnilla, koodekilla tai ties millä, ovat vielä omia kysymyksiään.
Vedetäänpä tässä välissä hieman henkeä ja onnitellaan samalla nyt hieman yli kymmenvuotiasta PAS-palvelua. Musiikkiarkisto oli mukana KDK-hankkeessa kehittämässä tulevaa PAS-palvelua, mistä oli apua erityisesti moninaisten videoformaattien parissa työskennellessä 2010-luvulla. Elokuussa 2019 teimme sopimuksen PAS-palvelun käyttöönotosta. Tarinamme jatkuu hetken kuluttua. Pysykää kanavalla.
Jouni Eerola
Järjestelmäasiantuntija / Musiikkiarkisto
(Osa 2: "Kulttuuriperintö-PAS-palvelun hyödyntäminen Musiikkiarkistossa" julkaistaan vuodenvaihteen jälkeen.)