Gemeinsames Archiv der Onlinepublikationen Statistisches Bundesamt veröffentlicht im PDF/A-Format
Die elektronische Datenverarbeitung macht die Arbeit der Verwaltungen in vielen Fällen effizienter und schneller. Allerdings schafft sie auch manches neue Problem, mit dem vorher niemand gerechnet hat. Zum Beispiel, wenn es darum geht, alte Dokumente sicher und dauerhaft zu archivieren. Das Statistische Bundesamt hat eine Lösung gefunden.
Anbieter zum Thema

Die Statistischen Ämter des Bundes und der Länder haben ihre Veröffentlichungen zur rascheren Verbreitung der Ergebnisse und Reduzierung der Druckkosten inzwischen überwiegend von Druckwerken auf Onlineversionen umgestellt. Diese Publikationen werden als gemeinsames Informationsangebot in der Statistischen Bibliothek als Excel-Tabelle und im PDF/A-Format bereitgestellt. Bei der Konvertierung in das ISO-Format für die Langzeitarchivierung von PDF-Dokumenten setzt das Statistische Bundesamt auf den pdfaPilot von callas software. Darüber hinaus haben auch eine Reihe von Landesämtern nachgezogen und den pdfaPilot eingeführt.
Der pdfaPilot
Das Statistische Bundesamt ist der führende Anbieter amtlicher statistischer Informationen in Deutschland und hat die Aufgabe, objektive, unabhängige und qualitativ hochwertige statistische Informationen bereitzustellen und zu veröffentlichen. Rund 2.600 Beschäftigte erheben, sammeln, analysieren und bereiten in Wiesbaden, Bonn und Berlin die Daten auf.
Um die Zugänglichkeit der früher gedruckten, jetzt meist nur noch online verfügbaren statistischen Berichte und Fachserien zu verbessern und gleichzeitig dafür zu sorgen, dass diese dauerhaft archiviert sind, hat das Statistische Bundesamt zusammen mit den Statistischen Landesämtern einen gemeinsamen Publikationenserver entwickelt.
Hier werden alle elektronischen Veröffentlichungen der Statistischen Ämter der Länder und des Statistischen Bundesamtes sowohl für die Nutzung zentral gespeichert als auch im Format PDF/A-1b archiviert. Neben den themenorientierten monografischen Publikationen sind dies vor allem die statistischen Berichte und Fachserien.
Langfristig gesichert
Nicolas Bülow, Systemadministrator beim Statistischen Bundesamt, sagt: „Zuvor hatten wir unsere Publikationen als PDF-Datei gespeichert. Damit war nicht sichergestellt, dass die Dokumente langfristig lesbar bleiben. Deshalb haben wir uns gemeinsam mit den Landesämtern entschieden, die Dokumente in das PDF/A-Format zu konvertieren.“
Das erforderliche Fachkonzept wurde in enger Zusammenarbeit mit den Statistischen Landesämtern erstellt und in einem Lastenheft dokumentiert. Schwerpunkte waren:
- die Festlegung von verbindlichen und optionalen Kategorien für die Titeldaten,
- die Erstellung von Metadatenformularen für die verschiedenen Publikationstypen: Periodika und zeitschriftenartige Reihen, Hefte von Fachserien, Monografien,
- die Option, die Recherche nur in den Titeldaten oder im Volltext der Dokumente durchführen zu können,
- die Recherche nach Regionen, Herausgebern und statistischen Themenbereichen,
- die Zugriffsrechte bei der dezentralen Speicherung der Dateien durch die Statistischen Landesämter und das Bundesamt,
- die Sicherstellung des Zugriffs für externe Nutzer.
Für die Dokumentenverwaltung wurde die Open-Source-Software MyCoRe entsprechend angepasst. Wesentliche Punkte dabei waren die Gestaltung der Metadatenformulare, die Konfiguration von spezifischen Recherchemöglichkeiten sowie die Gestaltung der Web-Oberfläche.
Was muss die Lösung können?
Zu den Anforderungen des Statistischen Bundesamtes an das Tool zur Konvertierung nach PDF/A gehörte eine große Zuverlässigkeit auch bei großen Datenmengen. Darüber hinaus sollten auch umfangreiche PDF-und Office-Dokumente sorgfältig validiert werden können.
Weitere Funktionen, wie das nachträgliche Einbetten von Schriften und eine Stapelverarbeitung sollten ebenfalls vorhanden sein. Bei der Produktevaluierung wurden Normen und Literatur zur Archivierung, aber auch Angebote auf Fachmessen zu Rate gezogen.
Auf der DMS EXPO 2011 in Stuttgart stießen die Projektverantwortlichen auf die Actino Software GmbH. Das Unternehmen ist unter anderem Anbieter des pdfaPilots von callas software. Diese Software basiert auf derselben PDF/A-Technologie, die Adobe in Acrobat integriert hat und ist eines der etablierten Softwareprodukte zur Konvertierung und Validierung von PDF/A-Dokumenten. Ende 2011 hat man sich im Rahmen von mehreren Testläufen von der Leistungsfähigkeit und Stabilität überzeugt. Dazu hat sich das Statistische Bundesamt eine kostenlose Testversion von der Website des Anbieters heruntergeladen. Besonders die schnelle Stapelkonvertierung der Software überzeugte, da das Statistische Bundesamt diese vor allem bei der Konvertierung der in den letzten zehn Jahren publizierten Online-Dokumente einsetzt.
Fazit
„Besonders wenn es darum geht, ein großes Volumen an Office, TIFF- oder PDF Dokumenten nach PDF/A zu konvertieren, ist der pdfaPilot das Maß aller Dinge“, sagt Michael Karbe, Geschäftsführer von Actino Software. „Darüber hinaus ist für uns die Option der Einzelkonvertierung, bei der auch unbeabsichtigte Inkompatibilitäten und fehlende Schriften protokolliert werden, extrem hilfreich. Hier können Fehler, die eine Konvertierung nach PDF/A verhindern, direkt bereinigt werden“, so Jürgen Forstmann, Bibliothekar beim Statistischen Bundesamt. 2012 war die Umsetzung abgeschlossen. Heute stehen bereits rund 23.000 Publikationen im PDF/A-Format zur Verfügung, weitere werden folgen.
(ID:42257701)