Langzeitarchivierung mit ODF: eine zukunftssichere Strategie

Digitale Dokumente in proprietären Formaten werden oft innerhalb weniger Jahre unzugänglich, weil es zu undokumentierten Änderungen am XML-Schema kommt, die absichtlich gemacht werden, um Leute an sich zu binden. Um dieses Problem zu vermeiden, ist es ratsam, das Open Document Format (ODF) nicht nur für alltägliche Aufgaben, sondern auch für die langfristige Speicherung zu nutzen. So bleibt sichergestellt, dass Dokumente über Jahre oder sogar Generationen hinweg zugänglich bleiben.
Ohne diesen Ansatz laufen Regierungsdokumente, akademische Forschungsarbeiten, Rechtsdokumente und Unternehmensarchive Gefahr, zu echten digitalen Waisen zu werden – Dateien, die zwar existieren, aber nicht gelesen werden können. Dies liegt weniger daran, dass die Software, mit der sie erstellt wurden, veraltet ist, sondern daran, dass das XML-Schema so geändert wurde, dass die Dateien nur mit einer bestimmten Version einer einzigen Software gelesen werden können. Die Überlagerung der Änderungen führt jedoch dazu, dass sie langfristig von keiner Software mehr gelesen werden können.
Warum ist ODF für die Archivierung geeignet?
ODF (ISO/IEC 26300 und nachfolgende Versionen) ist ein offener Standard, der transparent von OASIS verwaltet wird. Sein Entwicklungsprozess und seine Spezifikationen sind dokumentiert und öffentlich zugänglich, im Gegensatz zu proprietären Formaten, bei denen der Prozess nicht dokumentiert ist und die ISO/IEC-Spezifikationen nicht die Realität des Formats widerspiegeln. Das bedeutet, dass selbst wenn die aktuelle Software verschwinden würde, Entwickler neue Programme erstellen könnten, die mit dem Standard kompatibel sind, um die Dateien zu verarbeiten und auf ihren Inhalt zuzugreifen.
Darüber hinaus sind ODF-Dateien komprimierte Archive (ZIP), die XML-Dateien enthalten, die auf einem Schema basieren, das auch von nicht-technischen Anwendern leicht gelesen werden kann, sodass jeder den Inhalt extrahieren und interpretieren kann. Diese Transparenz des Formats ist ein grundlegendes Element seines Archivierungswertes. Im Gegensatz dazu ist das XML-Schema proprietärer Dateien absichtlich so gestaltet, dass es nicht lesbar ist. In diesem Sinne ist es ein perfektes Beispiel dafür, wie eine zur Vereinfachung geschaffene Sprache wie XML zu einem subtilen Lock-in-Instrument werden kann, wenn sie entgegen ihrer Natur verwendet wird.
Schließlich gewährleistet ODF eine starke Abwärtskompatibilität zwischen den Versionen. Das bedeutet, dass alle Dateien, die 2005 – unmittelbar nach der Standardisierung durch OASIS – mit ODF 1.0 erstellt wurden, ohne Probleme mit Anwendungen geöffnet werden können, die 2025 veröffentlicht werden. Diese Stabilität ist beabsichtigt; das Format wurde mit Blick auf die langfristige Aufbewahrung entwickelt.
Bewährte Verfahren für die Archivierung im ODF-Format
Obwohl neuere Versionen zusätzliche Funktionen bieten, ist die beste Option für die Langzeitarchivierung die Verwendung einer von ISO/IEC anerkannten Version, wie beispielsweise ODF 1.2 (ISO/IEC 26300-1:2015) oder in naher Zukunft ODF 1.3 (ISO/IEC 26300:2025). Der Grund dafür ist, dass diese Version ausgereift und gut dokumentiert ist, über Jahrzehnte hinweg kompatibel bleiben wird und ein ausgezeichnetes Gleichgewicht zwischen Funktionalität und Umfang der Unterstützung bietet.
Bei Dokumenten, bei denen eine originalgetreue visuelle Wiedergabe wichtig ist, empfiehlt es sich, Schriftarten in ODF-Dateien einzubetten, um Probleme mit der Schriftartersetzung zu vermeiden, wenn Dateien Jahre später in einer anderen Umgebung als derjenigen geöffnet werden, in der sie erstellt wurden.
Darüber hinaus sollten alle mit den Dokumenten verbundenen Ressourcen (Bilder, Grafiken usw.) in die ODF-Datei eingebettet und nicht extern verlinkt werden, da externe Links mit der Zeit nicht mehr funktionieren können, wenn die Originaldatei verschoben wird, was zu unvollständigen Dokumenten führen könnte.
Um die Erkennung der Datei auch nach Jahren zu ermöglichen, sollten Sie die umfangreiche Metadatenunterstützung nutzen und das Erstellungsdatum, den Autor, den Betreff und alle anderen Kontextinformationen hinzufügen, die zum Verständnis des Zwecks und der Herkunft des Dokuments beitragen können. In jedem Fall ist es ratsam, auch bei Verwendung eines offenen Standardformats wie ODF für die Langzeitarchivierung eine regelmäßige Migration der Archive auf die neueste Version des Formats zu planen und die Zugänglichkeit der Dateien alle paar Jahre zu überprüfen.
ODF kann jedoch nicht zum Archivieren von Dokumenten verwendet werden, deren ursprüngliches Format beibehalten werden muss, ohne dass die Gefahr einer versehentlichen Bearbeitung besteht. Für diese Dokumente sollte ein anderer Ansatz auf Basis von PDF/A in Betracht gezogen werden. PDF/A wurde speziell für die Archivierung entwickelt und ergänzt ODF perfekt in einer umfassenden Archivierungsstrategie. Daher eignet es sich ideal für endgültige Dokumente, bei denen im Laufe der Zeit keine Änderungen zu erwarten sind.
Da kein Format vor Medienausfällen schützen kann, ist es am besten, mehrere Kopien jeder Datei auf verschiedenen Speichermedien und an verschiedenen Orten aufzubewahren, wobei die 3-2-1-Backup-Regel zu befolgen ist: drei Kopien auf zwei Arten von Medien, wobei eine Kopie außerhalb des Standorts aufbewahrt wird. Darüber hinaus sollten die Archivierungsprozesse dokumentiert und die Dokumentation leicht zugänglich sein, damit Personen, die unterschiedliche Rollen innerhalb eines Unternehmens übernehmen, den Prozess in Übereinstimmung mit den verwendeten Softwaretools sowie mit Entscheidungen zu Strategie und Formaten reproduzieren und aktualisieren können.
Blick in die Zukunft
Die Landschaft der digitalen Archivierung entwickelt sich ständig weiter, aber dank seines Engagements für offene Standards, Transparenz und Herstellerunabhängigkeit ist ODF die beste langfristige Wahl, da es sich dafür einsetzt, dass Informationen über die Lebensdauer einer einzelnen Organisation hinaus zugänglich bleiben.
In einer Welt, in der geplante Obsoleszenz eine immer häufiger anzutreffende Strategie ist und manchmal sogar erzwungen wird, wie beispielsweise durch das Ende des Supports für Windows 10, das die Aufgabe von perfekt funktionierender Hardware erzwingt, trotz aller Diskussionen über Nachhaltigkeit und die Reduzierung von digitalem Abfall, ist dieses Engagement selten und wertvoll.