E-mails archiveren: hoe en waarom?

Het digitaal archiveren van e-mails is voor veel organisaties een uitdaging. Mailboxen puilen uit van inkomende en uitgaande berichten en worden steeds meer een vergaarbak van informatie en kennis, mede omdat ze allerlei bestanden in bijlagen kunnen bevatten. E-mails zijn documenten die digitaal geboren zijn. Dat digitale is dan ook een essentieel kenmerk dat bewaard moet worden.[1]

Bij de bewaring van e-mails vormt het behoud van de band tussen bijlagen en e-mail een extra uitdaging.


Waarom?

Voor de bewaring van e-mails op mailservers en in e-mailclients bestaat er geen standaardformaat. E-mailclients, zoals Microsoft Outlook of Apple Mail, gebruiken een eigen gesloten bestandsformaat. Dit kan betekenen dat niet alle metadata bewaard worden en dat e-mails onleesbaar worden wanneer de e-mailclient niet meer beschikbaar is. Bovendien gebruiken steeds meer mensen webmaildiensten zoals Gmail of Outlook.com (het vroegere Hotmail). Wanneer deze diensten stoppen of (hoge) kosten beginnen vragen, dreig je al je e-mails te verliezen.

Hoe?

Orden je e-mails

E-mails kan je ordenen door je mailbox[2] te structureren volgens de mappenstructuur van je organisatie (Zie Maak een ordeningsplan/mappenstructuur). Wanneer je je persoonlijk e-mailadres gebruikt, kan je aparte mappen maken voor je persoonlijke e-mails en voor de e-mails die je hebt verstuurd en ontvangen bij het uitoefenen van taken of activiteiten voor je organisatie. Dit maakt het eenvoudiger om e-mails terug te vinden, en om e-mails en bijlagen achteraf buiten de e-mailclient in de juiste mappen van de mappenstructuur op te slaan.

Schoon je mailbox

Je e-mailarchief wordt toegankelijker door je mailbox regelmatig te schonen. E-mailcorrespondentie bevat immers veel ballast - denk aan bv. spam, reclameberichten en nieuwsberichten - die niet bewaard hoeven te worden. Het opkuisen van je mailbox maakt dat je makkelijker e-mails kan terugvinden en dat enkel archiefwaardige e-mails bewaard worden. Binnen je organisatie kan je via een selectielijst afspreken welke e-mails bewaard moeten worden en welke niet.[3] E-mails die verstuurd of ontvangen worden bij het uitoefenen van taken of activiteiten van je organisatie worden bewaard; louter informatieve e-mails die geen rechtstreekse band hebben met je organisatie kunnen verwijderd worden.

Gebruik een geschikt protocol

Om e-mails te archiveren, worden ze van de mailserver opgehaald. Maak hierbij gebruik van het IMAPS-protocol. IMAPS is een vorm van IMAP, een standaardprotocol[4] om e-mails van de mailserver naar een e-mailtoepassing op te halen, over een versleutelde (en dus beveiligde) verbinding. Het bewaart e-mails volgens de structuur waarin je je e-mails in je mailbox ordent en vernietigt ze niet wanneer ze van de server worden opgehaald.

Bewaar alle essentiële kenmerken van e-mails

Centrale concepten bij archivering zijn authenticiteit en integriteit. Authenticiteit verzekert je dat een archiefstuk is wat het beweert te zijn en integriteit verzekert dat de inhoud van een archiefstuk volledig en waar is. Om deze twee eigenschappen bij e-mails te preserveren, dienen de volgende elementen bewaard te worden:

  • Ontstaanscontext: dit zijn alle gegevens die de functie van een archiefstuk weergeven in relatie tot de activiteiten van de archiefvormer. Het verduidelijkt het onderwerp of de zaak waarop de e-mail betrekking heeft, de herkomst en de onderlinge samenhang tussen verwante e-mails, bijlagen en archiefdocumenten.
  • Structuur geeft de relaties weer tussen de verschillende componenten van een e-mail (Header, body[5] en bijlagen) en tussen verwante e-mails (bv. bij het beantwoorden of doorsturen van een e-mail).
  • Inhoud bestaat uit het onderwerp van de e-mail, de tekst die verstuurd werd en de bijlagen.
  • Verschijningsvorm: lay-out is geen essentieel gegeven bij e-mails. De lay-out is immers afhankelijk van de e-mailclient en het toestel waarmee je de e-mail opent. Wanneer een e-mail een artistieke waarde heeft of wanneer via de opmaak de structuur of inhoud van een e-mailbericht duidelijk wordt, kan het wel belangrijk zijn om ook dit aspect te bewaren.

Deze essentiële gegevens kan je bewaren door te kiezen voor een bestandsformaat dat e-mails bewaart volgens het Internet Message Format (IMF). IMF is een standaardformaat voor het transport van e-mails. Het maakt het mogelijk dat iedere e-mail die iemand naar je verstuurt via zijn e-mailclient of webmaildienst leesbaar is in je e-mailapplicatie, zonder dat jullie dezelfde applicatie gebruiken.

Druk daarom e-mails nooit af. E-mails bevatten verborgen metadata die je niet ziet wanneer je de e-mail in je e-mailtoepassing opent. Ze bevatten informatie over de te bewaren elementen van het document. Deze metadata verlies je bij het afdrukken. De ontstaanscontext van e-mails bewaar je ook door e-mails onder te brengen in een gestructureerde mappenstructuur (zie 1. Orden je e-mails).

Scheid e-mails en bijlagen

Wanneer bijlagen verstuurd worden in een bestandsformaat dat niet duurzaam is, dreigt het gevaar van obsoletie. Ook wanneer e-mails in HTML opgesteld werden, staan afbeeldingen soms op een externe webserver omdat het bericht anders te groot wordt. Deze afbeeldingen kan je verliezen, wanneer je ze niet gescheiden bewaart. Bewaar afbeeldingen en bijlagen daarom apart van de e-mail in een geschikt archiveringsformaat, maar zorg wel dat de relatie tussen de e-mails, afbeeldingen en bijlagen duidelijk is. Je kan de link tussen een e-mail en bijlagen duidelijk maken door eenzelfde bestandsnaam te gebruiken.

Kies een geschikt bestandsformaat

Een geschikt bestandsformaat is een formaat dat gestandaardiseerd is, waarvan de bestandsspecificatie open is en dat gelezen kan worden door verschillende toepassingen. Zo ben je niet afhankelijk van een bepaalde softwareleverancier. Het is essentieel dat het bestandsformaat alle essentiële kenmerken van de e-mail bewaart.

Voor de bewaring van e-mails zijn EML en MBOX de facto standaarden.[6] De bestandsformaten slaan de e-mails met bijlagen op volgens het Internet Message Format (IMF) en kunnen geopend worden door de meeste e-mailtoepassingen en tekstverwerkingsprogramma’s. EML slaat bestanden apart op (één e-mail is één EML-bestand), terwijl MBOX een volledig e-mailarchief kan bewaren (één e-mailarchief is één MBOX-bestand). MBOX slaat in de e-mailclient een e-mailarchief op volgens de structuur waarin de e-mails geordend zijn. Doordat MBOX een volledig e-mailarchief in één bestand bewaart, is het moeilijk om bijlagen en e-mails apart te bewaren en de band tussen bijlagen en e-mails door middel van de bestandsnaam te behouden. Probeer daarom EML te gebruiken. MBOX kan wel een nuttig formaat zijn wanneer je een e-mailarchief in bulk wil exporteren, bv. wanneer een medewerker de organisatie verlaat en zijn volledig e-mailarchief wil overdragen.

Bewaar de e-mails duurzaam

E-mailclients en mailservers zijn niet ontwikkeld om e-mails duurzaam te bewaren. Daarom moeten archiefwaardige e-mails steeds buiten de e-mailapplicatie bewaard worden. Sommige e-mailclients en webmailapplicaties bieden een archiveringsfunctie aan. Dit is echter geen duurzame bewaring. E-mailclients gebruiken propriëtaire en gecomprimeerde formaten waardoor je metadata en informatie kan verliezen. Bij webmail is het niet duidelijk hoe de e-mails gearchiveerd worden. Bovendien blijf je hierbij afhankelijk van bedrijven zoals Google en Microsoft voor het beheer van je bestanden.

Bij webmailapplicaties is het vaak niet mogelijk om e-mails eenvoudig te exporteren. Gebruik daarom een e-mailclient, zoals Mozilla Thunderbird. Dit is een gratis en open source e-mailtoepassing die het mogelijk maakt om e-mails te exporteren in het EML- en MBOX-formaat. E-mailclients hebben als voordeel dat je een mappenstructuur kan opbouwen in de mailbox.[7] Let op, sommige e-mailclients, zoals Microsoft Outlook, kunnen niet exporteren in EML of MBOX.[8]

Verder gelden voor de duurzame bewaring van e-mails de algemene regels met betrekking tot duurzame bewaring. Zorg steeds dat je goede back-upprocedures gebruikt en dat je van je bestanden verschillende back-ups hebt die op verschillende (geografische) locaties bewaard worden. Bewaak de integriteit van je bestanden door checksums te gebruiken en de bestanden periodiek te controleren. Volg evoluties op het vlak van bestandsformaten. Dit is zeker voor bijlagen belangrijk, aangezien je hier een grote verscheidenheid aan bestandsformaten kan hebben (Zie Bewaring van je digitaal archief).

Aan de slag met enkele tools


Auteurs: Nastasia Vanderperren (meemoo) m.m.v. Rony Vissers (meemoo) en Pieter De Praetere

  1. Zie ook: Richtlijn 1 van Edavid.
  2. Met mailbox bedoelen we zowel de inbox als de outbox.
  3. Een selectielijst is een document waarin bepaald wordt welke documenten bewaard of vernietigd worden. Een voorbeeld van een selectielijst voor e-mails vind je hier
  4. Protocols zijn regels waaraan computers zich moeten houden om met elkaar te communiceren. POP en IMAP zijn protocols voor het ophalen van e-mails van de server. Internet Message Access Protocol, meestal afgekort tot IMAP, maakt het mogelijk dat e-mails gesynchroniseerd kunnen worden, zodat je je e-mails zowel kan consulteren op je smartphone als op je tablet, laptop, computer, etc. POP, kort voor Post Office Protocol, verwijdert de e-mails van de mailserver bij het ophalen. IMAPS is een vorm van IMAP waarbij het verkeer versleuteld wordt. Dit maakt IMAPS veiliger dan IMAP.
  5. De body is het tekstveld van een e-mail. Dit is het gedeelte waarin de afzender zijn boodschap geschreven heeft.
  6. EML en MBOX zijn gestandaardiseerd en worden breed ondersteund, maar zijn niet open.
  7. Zie ook: https://kadoc.kuleuven.be/advies/digitaalorde
  8. Het eerder vermelde Apple Mail kan wel e-mails exporteren in EML.

TRACKS is een samenwerking tussen deze partners: