Een digitaliseringsopdracht uitbesteden
Wanneer je je archief of collectie wil digitaliseren, is het vaak aangeraden om dit aan een externe partner uit te besteden. Die heeft de expertise om hoogwaardige gedigitaliseerde bestanden aan te leveren. Er zijn echter veel zaken waar je rekening mee moet houden.
In deze tool leer je het volgende:
- Wat is het voordeel van het uitbesteden van een digitaliseringsopdracht?
- Welke afspraken moet je met de leverancier maken?
- Hoe volg je het digitaliseringsproces op?
- Hoe voer je na de digitalisering de kwaliteitscontrole uit?
Bij een uitbesteding ga je in zee met een extern bedrijf om je archief of collectie te digitaliseren.
Wanneer je uitbesteedt, is de kans op kwaliteitsvolle reproducties groter, omdat specialisten dit voor jou doen. Dit is zeker aan te raden wanneer je grote hoeveelheden waardevol materiaal hebt, of wanneer het simpelweg gaat om zaken die je niet zelf kan digitaliseren, omdat ze bijvoorbeeld te groot zijn qua formaat, of omdat het gaat over moeilijke formaten, zoals videotapes.
Maar let op: een digitalisering uitbesteden is niet zozeer een kwestie van een bedrijf bellen. Er zijn veel zaken waarmee je rekening moet houden. Probeer die op voorhand zo goed mogelijk vast te leggen om prijzen te vragen bij leveranciers, en vervolgens te laten opnemen in de overeenkomst die je met de leverancier sluit.
Bij het uitbesteden van een digitalisering moet je uitgaan van drie fases: voor, tijdens en na het digitaliseren.
- Voor het digitaliseren: Je bereidt je materiaal voor, zoekt een leverancier, maakt afspraken en voert eerste tests uit.
- Tijdens het digitaliseren: Je volgt vragen van de leverancier op en voert tussentijdse controles uit.
- Na het digitaliseren: Je controleert of al je materiaal correct is teruggeleverd + doet finale kwaliteitscontrole van de reproducties.
Inhoud
Ten geleide
Neem voor je verdergaat de algemene principes van een kwaliteitsvolle digitalisering even door. Deze leggen we voor je uit in de tool Kwaliteitsvol digitaliseren van tekst- en beeldmateriaal. De algemene vereisten van een goede digitalisering (voldoende opslagruimte, beschrijving, reproductiekwaliteit en kwaliteit van het bestandsformaat) zijn ook hier van toepassing.
Voor het digitaliseren: afspraken met de leverancier
Praktische afspraken
Zorg dat logistiek, ophaling, datum van oplevering, contactpersonen, de wijze waarop de digitale bestanden worden aangeleverd etc. duidelijk geregeld zijn.
Rechten
Spreek af dat de leverancier geen aanspraak kan maken op intellectuele eigendom of gebruiksrecht van de reproducties. Bevat je collectie privacygevoelig materiaal, vraag dan een geheimhoudingsclausule.
Bepalingen over logistiek en bewaring
Zorg dat de leverancier duidelijk beschrijft waar de originelen zullen worden bewaard, en hoe hij deze zal vervoeren. Bij voorkeur stel je een conditierapport op van de collectie, zodat je nadien kan controleren of er niets beschadigd is.
Bepalingen over volledigheid
Vraag garanties dat de leverancier wel degelijk alles scant. Om dit te controleren heb je best je collectie zo gedetailleerd mogelijk beschreven en geregistreerd. (Zie hiervoor ook de tool Kwaliteitsvol digitaliseren van tekst- en beeldmateriaal) Op die manier kan je niet enkel controleren of alles wel degelijk is gedigitaliseerd maar ook of de leverancier wel degelijk alle originelen terug bezorgd heeft.
Bepalingen over de kwaliteit van het reproduceren en het reproductieproces
- Spreek goed af op welke resolutie en bitdiepte er wordt gedigitaliseerd en welk kleurprofiel zal worden gebruikt.
- Zorg dat de leverancier duidelijk beschrijft welke opnameapparatuur hij zal gebruiken.
- Zorg dat de leverancier verklaart dat de apparatuur dagelijks wordt gekalibreerd: bij de start van het proces, bij heropstart van de apparatuur en bij aanpassing van de instellingen.
- Vraag hoe de leverancier de kwaliteit van de opnames en kalibratie zal controleren en dat hij je de bewijzen bezorgt van zijn controleproces.
Standaarden m.b.t. beeldkwaliteit
Neem in je lastenboek op dat de inschrijver voldoet aan internationaal geldende standaarden als Metamorfoze, FADGI of Guidelines Digitalisation of photographic materials. Zo moet de leverancier zich conformeren aan een internationale norm en moet hij ook de kwaliteitscontroles uitvoeren die de norm stelt.
Post processing
Spreek af of er nabewerking zal gebeuren en hoe die dan moet gebeuren (bv. rechtzetten, croppen, verscherpen). Wil je dat een bepaald proces absoluut niet wordt toegepast? Vermeld dit dan expliciet.
Gaat het om tekstdocumenten? Dan is het een goed idee om de documenten ook meteen te laten OCR'en. OCR staat voor Optical Character Recognition en zet de tekst in je document om naar machineleesbare tekst, zodat je binnen je reproducties op woorden kunt zoeken. Dat kan vaak zonder een al te grote meerkost. Spreek goed af hoe de OCR-data worden aangeleverd. Een tekstbestand per scan is het minimum en moet je altijd opvragen, maar je kan additioneel de OCR bv. ook laten inbedden in een PDF voor optimale doorzoekbaarheid.
De aan te leveren bestanden
Spreek goed af of de leverancier een masterbestand, archiveringsbestand en raadplegingsbestand moet leveren. (Zie voor meer info de tool Kwaliteitsvol digitaliseren van tekst- en beeldmateriaal.) Spreek af welke bestandsformaten daarvoor zullen worden gebruikt. Uncompressed baseline TIFF v6 voor moederbestanden en archiveringsbestanden, JPEG voor raadplegingsbestanden als het beeldmateriaal betreft, PDF voor raadplegingsbestanden als het tekstmateriaal betreft.
Zorg ervoor dat de leverancier ook de checksums van ieder bestand aanlevert, zodat je kan controleren of er geen fouten zijn gebeurd bij bv. het doorkopiëren van de bestanden. Het eenvoudigst is dat de leverancier je een tekstdocument of spreadsheet bezorgt van alle bestanden met hun checksums.
De metadata
Spreek af hoe de leverancier de bestanden moet benoemen en wat de mappenstructuur moet zijn. Idealiter maak je in een spreadsheetsoftware al een lijst op van al het materiaal dat de leverancier moet digitaliseren, waarbij je in een andere kolom duidelijk aangeeft wat de bestandsnamen zijn. Een voorbeeld van een dergelijk spreadsheet voor tijdschriftdigitalisering vind je op de website van het VAi.
Wil je dat de leverancier ook andere metadata toevoegt tijdens het scanproces? Spreek dan goed af hoe hij deze invult en levert, en hoe hij de kwaliteit controleert.
Je kan de leverancier ook vragen om bepaalde technische en inhoudelijke metadata in te bedden in de bestanden. Zie voor meer info de tool Ingebedde metadata bij foto's.
Een testfase
Het is aan te raden dat je een testfase afspreekt met de leverancier, waarbij je ook zelf ter plekke kan gaan kijken naar het digitaliseringsproces. Zorg dat hij eerst een beperkt aantal stukken als proef digitaliseert. Ben je niet tevreden, dan kan je nog aanpassingen laten maken tot er een 'referentiescan' ontstaat, waarover je tevreden bent. Deze vormt dan de graadmeter voor de kwaliteit van de volgende digitaliseringen.
Voorzie controletijd
Idealiter controleer je of de leverancier wel alles doet zoals je het hem vraagt. Zie verder voor meer info over hoe je de kwaliteitscontrole kunt aanpakken.
Spreek met je leverancier een termijn af waarin je tijd hebt om het geleverde materiaal te controleren. Bij voorkeur levert de leverancier je via internet al tussentijdse resultaten zodat je meteen kan controleren en ingrijpen als er iets misloopt. Bepaal op voorhand met de leverancier welke methode en software je zult gebruiken om het materiaal te controleren.
Tijdens het digitaliseren
Tijdens het digitaliseren volg je vragen van de leverancier op en doe je idealiter tussentijdse kwaliteitscontroles. Deze tips kunnen je hiermee helpen:
- Besteed genoeg tijd aan het bepalen van de referentiescan.
- Hoe sneller een fout wordt opgemerkt, hoe beter. Vraag aan je leverancier om je tussentijdse resultaten te bezorgen, zodat je meteen kan reageren bij een fout. Targetscans, waarmee de correctheid van de kalibratie wordt getest, kunnen bijvoorbeeld meteen na kalibratie en controle via het internet worden verstuurd. Ook gegenereerde raadplegingsbestanden kunnen meegestuurd worden over het internet, zodat je meteen ook de beeldende kwaliteit kan beoordelen.
- Als je naast het digitaliseren van het materiaal ook specifieke vragen hebt gesteld m.b.t. postprocessing (bv. OCR en metadata toevoegen), las dan een tussenstap in waarbij eerst de kwaliteit van de digitalisering wordt gecontroleerd. Pas wanneer je zeker bent dat de digitalisering zelf goed is gebeurd, geef je toelating om over te gaan tot verdere post-processing van de bestanden. Anders loop je het risico dat de leverancier tijd gaat steken in het verwerken van foute bestanden, wat kan leiden tot discussies achteraf.
Na het digitaliseren: Kwaliteitscontrole
Door een digitalisering uit te besteden win je veel tijd, omdat je zelf niet de reproducties hoeft te maken, maar als je het goed wil doen, moet je wel veel tijd uittrekken voor de kwaliteitscontrole. Onderschat dit niet, er kan van alles fout gaan. Grosso modo controleer je het materiaal op:
- de volledigheid
- de beeldkwaliteit
- de correctheid van het bestandsformaat
- de kwaliteit van de post-processing (bv. OCR)
- de kwaliteit van de metadata
De volledigheid van het materiaal
Als je op voorhand een goede lijst hebt gemaakt van al het materiaal, is dit erg snel gebeurd. Controleer of er per folder evenveel bestanden zijn als er opgelijste items (pagina’s, foto’s enz.) zijn.
Controleer ook of er geen fouten zijn geslopen in de bestanden door bv. kopieeracties over het web. Indien je met de leverancier een goed checksumbestand hebt afgesproken, kan dit automatisch. (Zie de tool Checksums als middel om de integriteit van bestanden te bewaken.)
Tot slot is het altijd een goed idee om te controleren of ook het originele materiaal in zijn volledigheid is teruggebracht.
De beeldkwaliteit
Probeer deze controle al zoveel mogelijk tijdens het digitaliseringsproces te doen. De enige vorm van herstel is immers opnieuw digitaliseren.
Hierboven bespraken we al dat het een goed idee is om je leverancier te vragen om een internationale norm voor digitaliseren te volgen (Metamorfoze, FADGI of Guidelines Digitalisation of photographic materials). Op die manier verbindt de leverancier zich er contractueel toe om bepaalde stappen te ondernemen die de kwaliteit van de digitalisering garanderen.
Maar het is niet zo dat een leverancier die zegt dat hij een norm zal respecteren, dat ook daadwerkelijk zal doen. De normen bieden je een kader waarin je zelf kan nameten of dit gebeurt of niet aan de hand van “targetscans” (zie voor meer info de desbetreffende norm).
Weet wel dat deze normen voer zijn voor specialisten en dat de controles specifieke software vereisen. Lukt dit je niet, kijk dan in ieder geval zelf altijd goed de beelden na. Zijn ze scherp genoeg? Zijn ze leesbaar? Tonen de beelden geen vreemde verkleuring of artefacten (bv. moiré)? Is het beeld bruikbaar voor publicaties in boeken en op het web?
Wens je ondersteuning om intensief te controleren of een reproductie correct volgens de normen is gemaakt, contacteer dan een TRACKS-partner.
De correctheid van het bestandsformaat
Probeer deze controle zoveel mogelijk tijdens het digitaliseringsproces te doen.
Concentreer je voor de kwaliteitscontroles vooral op de moederbestanden en archiveringsbestanden. De raadplegingsbestanden zijn minder kritiek. Nieuwe raadplegingsbestanden kunnen altijd nog worden gegenereerd op basis van de archiveringsbestanden.
Let op! Het is niet omdat een bestand de extensie “.tif” heeft, dat het ook gaat om een TIFF. Om te testen of je TIFF daadwerkelijk een TIFF is, kan je een tool als Droid gebruiken. Zie de tool Bestanden uit je digitaal archief identificeren met DROID.
Om te testen of je TIFF daadwerkelijk een Uncompressed Baseline TIFF v6.0 is (dus de meest duurzame soort TIFF) kan je de tool DPF-manager gebruiken. Naar onze ervaring komt het best nog wel vaak voor dat een TIFF niet overeenstemt met een gevraagde norm, dus doe zeker de test. Aarzel niet om een TRACKS-partner te contacteren voor hulp bij het controleren.
De kwaliteit van de post-processing (OCR)
OCR is zelden tot nooit volledig foutloos. De kwaliteit van de OCR is afhankelijk van de gebruikte software maar vooral ook van de aard van het bronmateriaal. Om de kwaliteit te controleren vraag je steeds de OCR-gegevens op in afzonderlijke tekstbestanden en niet enkel in PDF-bestanden. Je kunt dan steekproefsgewijs een aantal tekstbestanden met OCR-tekst openen en nagaan of de kwaliteit goed is.
Contacteer eventueel een TRACKS-partner voor meer informatie.
De kwaliteit van de metadata
Vraag je aan de leverancier om ook metadata aan de gedigitaliseerde bestanden toe te voegen (zoals titels), dan is er geen andere mogelijkheid om dit te controleren dan door het na te kijken, eventueel via steekproef. Ongeacht de wijze waarop de leverancier de metadata aanlevert, vraag je best ook een uitdraai van de metadata in een spreadsheet op. Dat vereenvoudigt de handmatige controle.
Een digitaal bestand heeft ook ingebedde, technische metadata. Indien je wil, kan je ook hiervan de kwaliteit beoordelen. Zie hiervoor de tool Ingebedde metadata bij foto's.
Meer lezen
- Poppe Jeroen. Handboek digitaliseren van documenten. Technische aspecten en kwaliteitseisen, 2017
- Richtlijnen m.b.t. Collecties digitaliseren
- Kennisdocument digitalisering tijdschriften | VAi
- Modellastenboek en modelovereenkomst voor een digitaliseringsopdracht | eDAVID
- De Metamorfoze- en FADGI-richtlijnen voor digitalisering
Auteurs: dit artikel is oorspronkelijk gebaseerd op een tekst van Wim Lowet (VAi), in samenwerking met Nastasia Vanderperren en Bart Magnus (meemoo).