Datenkonvertierung für eGovernment Brücken statt babylonischer Verwaltungstürme

Autor / Redakteur: Edmund Hilt / Gerald Viola

Datensicherheit und Datenmanagement sind zentrale Anforderungen für eine Verwaltung. Administratoren in Behörden und Archiven stehen vor immer neuen Herausforderungen. Zum einen wächst der Datenberg: IDC prognostiziert ein Ansteigen des weltweiten Informationsvolumens von unter 200 Exabyte (entspricht 200 Millionen Terabyte) im Jahr 2006 auf rund 1.700 Exabyte im Jahr 2011.

Anbieter zum Thema

Speicherlandschaften machen eine bewegte Geschichte mit: Irgendwann wird es schwierig werden, die Siemens-Großrechner zu warten, die das Ministerium für Staatssicherheit Anfang der 70er Jahre anschaffte. Anbieter von Speichersystemen verschwinden vom Markt. Speicherlösungen werden ausgewechselt. Je häufiger so eine Umstrukturierung stattfindet, umso schneller kann es zu bösen Überraschungen kommen.

Datenkonvertierung spielt daher eine immer entscheidendere Rolle in der Datensicherheit. In der Verwaltung ist der zu bewahrende Datenberg besonders hoch und vielschichtig. Gerade hier tummeln sich die verschiedensten Formate im Vergleich zum relativ homogenen und Microsoft-dominierten Geschäftsfeld. Man denke nur an heterogene Datenansammlungen in der Flächenplanung mit einer Fülle verschiedener Anwendungen.

Dazu kommt der viel größere Zeithorizont der Datenarchivierung. Problematisch wird dies, weil gerade im Kontakt mit dem Bürger Daten mittel- und langfristig verfügbar sein müssen. Daten zum Personenstandswesen begleiten den Bürger schließlich sein ganzes Leben lang – und die Erben darüber hinaus. Für verschiedene Daten gelten aber auch unterschiedliche Aufbewahrungsfristen bei Behörden.

Wenn die Behörden die Daten nicht mehr selber vorhalten müssen, ist die Übergabe an die Archive zu regeln. Da wird aus Informationen Kulturgut, das für die Nachwelt aufzubewahren ist. Eine zusätzliche Herausforderung schaffen hier die im Sinne der Rechtssicherheit zwischen Staat und Bürger enormen Anforderungen an die Authentizität und Integrität der Daten.

Verschiedene gesetzliche Bestimmungen legen die Kriterien für die Datenvorhaltung fest. Das Rechtsstaatsprinzip aus Artikel 20 des Grundgesetzes ist die „prima causa movens“ der Compliance im eGovernment. Ergänzend treten zahlreiche weitere Gesetze wie § 29 des Verwaltungsverfahrensgesetzes mit der Verpflichtung zur Aktenmäßigkeit der Verwaltung. Schwerpunkte sind hier Transparenz und Nachprüfbarkeit.

Dazu kommen noch ein Fülle von Archivgesetzen oder auch das Signaturgesetz zur Regelung der Integrität der Daten. Das Justizkommunikationsgesetz regelt die technischen Standards zur Übermittlung von Informationen im Rechtsverkehr. Die Verpflichtung zur Datenvorhaltung ergibt sich auch aus dem Informationsfreiheitsgesetz, das prinzipiell den berechtigten Personen Akteneinsicht gewährt.

So mancher Hersteller von eMail-Sicherheitslösungen winkt auch gerne mit § 133 des Strafgesetzbuches, wonach derjenige, der „Schriftstücke oder andere bewegliche Sachen, die sich in dienstlicher Verwahrung befinden oder ihm oder einem anderen dienstlich in Verwahrung gegeben worden sind, zerstört, beschädigt, unbrauchbar macht oder der dienstlichen Verfügung entzieht“ mit Freiheitsstrafe bis zu zwei Jahren oder mit Geldstrafe bestraft wird. Was je nach Auffassung auch auf das Löschen von eMails angewendet werden kann. Im Zweifelsfall sollten auch Behörden bei ihrer Rechtsabteilung solche Fragen klären.

In die gegensätzliche Richtung wirken die Bestimmungen des Datenschutzes, wonach bestimmte Daten gelöscht werden müssen, wenn der Grund ihrer Erhebung nicht mehr besteht. Daneben gibt es noch eine Fülle von immer wichtigeren internationalen Dokumentenstandards. Wie zum Beispiel DIN ISO 15 489 zur Schriftgutverwaltung oder auch de facto-Standards wie das IT-Grundschutzhandbuch des Bundesamtes für Sicherheit in der Informationstechnik oder die Bundesinitiative SAGA (Standards und Architekturen für eGovernment-Anwendungen).

Nächste Seite;: Kovertierung ist eine Frage der Technik

Eine Frage der Technik

Fernab von Formaten und Gesetzen ist das Ganze auch eine Frage der Technik. Die elektronische Verfügbarkeit von Daten bedeutet technisch neben Fragen der Lagerung immer die Überspielung oder Konvertierung von Daten aus Datenträgern. Konvertierung ist dabei nicht nur eine lästige oder auch durchaus gewaltige Aufgabe, sondern bietet auch Folgenutzen: In einem Zug kann gleichzeitig eine Deduplizierung und Komprimierung durchgeführt werden. Hierzu wird die Speicherlandschaft untersucht, die notwendige Konvertierungsstrategie entwickelt und gleichzeitig umgesetzt. Das baut das Datenvolumen ab, ohne Informationen zu verlieren und verringert die Kosten für die Speicherinfrastruktur. So kann mittel- und langfristig auf die Verwaltungsvorgänge zugegriffen und der digitale Aktendatenberg wenigstens etwas kleiner gehalten werden.

Konvertierungsschauplätze

Datenkonvertierung hat drei Hauptaufgaben: Zum Ersten geht es bei der Medienkonvertierung darum, die verschiedensten Datenträger bearbeiten zu können. Eine wichtige Rolle spielen dabei die Tapes, die allen Unkenrufen zum Trotz auch heute noch das Hauptmedium für die mittelfristige Datensicherung sind. Deswegen werden zum Zweiten auch die unterschiedlichsten Backup-Formate unterstützt. Zum Dritten geht es auch darum, Daten von verschiedensten Anwendungen in andere zu übertragen. Wichtig ist dabei auch die Herkunft der Daten: Mainframe-Daten müssen eventuell für die Midrange- oder PC-Ebene zugängig gemacht werden. Auch die Konvertierung zwischen Betriebssystemen spielt eine wichtige Rolle.

Medienkonvertierung

Wer Daten von den verschiedenen Medien überspielen möchte, sieht sich dem ständigen Wechsel der Formfaktoren unterschiedlicher Bänder und Laufwerke gegenüber. Selbst wer nur die letzten 20 Jahre abdecken wollte, braucht schnell eine Sammlung, die einem Technikmuseum zur Ehre gereichen würde. Technologien haben sich verändert, Hersteller sind vom Markt verschwunden. Bei den Tapes gibt es eine Fülle von Aufzeichnungssystemen, die sich allein schon von den Bauformen unterscheiden. So ist DLT – um nur ein Beispiel zu nennen – nicht gleich DLT.

Wikipedia verzeichnet für DLT zurzeit 20 Varianten mit verschiedenen Bauformen für Laufwerke und Einzelmedien. Uneinheitlich ist aber auch die Aufzeichnung der Daten in den Spuren und die Datendichte. Zudem werden je nach Variante Daten komprimiert, dekomprimiert, verschlüsselt oder offen aufgezeichnet. Auch die Schnittstellen variieren: Von proprietären Lösungen über SCSI bis hin zu Varianten für Fiberchannel oder auch Ethernet reicht die Palette der Anschlüsse. Alles in allem sind daher die verschiedenen DLT-Varianten nur zum Teil abwärtskompatibel.

Datenkonvertierung

Der für eine Konvertierung nötige Werkzeugkasten wird noch weiter ausgebaut, wenn man sich mit der logischen Organisation der Daten auf den Medien auseinandersetzt. Die Zahl der Programme, die für den logischen Aufbau der Datenaufzeichnung alleine bei Tapes zuständig sind, geht in die Hunderte. Standardisierung ist und bleibt hier eine Utopie. Im Mainframe-Bereich gibt es allein schon von IBM verschiedene Formate.

Dabei können Daten in Blöcken fixer oder variabler Länge aufgezeichnet werden. Doch das ist nur der Ausschnitt der Großrechner-Welt. Die generell offene UNIX-Welt bringt weitere Variablen ins Spiel. Unix kennt mit TAR, cpio und Dump allein schon drei Grundformate. Auf Desktop-Ebene gibt es in den einzelnen Betriebssystem-Umgebungen unterschiedliche Backup-Formate durch die zahllosen unterschiedlichen Softwarelösungen.

Häufiger müssen aber auch Großrechner-Dateien nun auf Server oder PC verfügbar sein. Ein zusätzliches Problem ist hier die unterschiedliche Codierung der digitalen Inhalte, die sich bei Mainframe-, Midrange- und Desktop-Systemen unterscheiden. So wird auch hier für den Inhalt der Anwendungen wieder Übersetzungsarbeit nötig.

Ebenso wichtig ist auch der Aspekt der Berechtigungsstrukturen. Bei einer Migration auf eine neue Backup-Software muss man sich zum Beispiel im Klaren darüber sein, ob die Zugriffsrechte erhalten bleiben sollen. Denn gerade Behörden wollen ihre Daten nicht nur auf längere Zeit sichern, sondern auch sicher gehen, dass nicht im Nachhinein noch Daten von Unberechtigten ausgelesen werden können. Hier können bei den Migrationsschritten schwere Fehler gemacht und die Metadaten mit den Zugriffsrechten verloren gehen.

Nächste Seite: Datenkonvertierung im Outsourcing

Datenübersetzungsdienst

Angesichts dieser Gemengelage wird Datenkonvertierung zu einer komplexen Aufgabe, die über das einfache Überspielen und Migrieren von Daten hinausgeht. Konvertierungsprojekte sind umfangreiche Projekte und je nach vorliegender IT-Landschaft immer wieder unterschiedlich. Sie bestehen in einem ersten Schritt aus einer umfassenden Bestandsaufnahme, welche Systeme überhaupt vorhanden sind und in Einklang gebracht werden müssen.

Das bedeutet letztlich die gesamte Nachzeichnung der Backup-Geschichte eines Unternehmens oder eine Öffentlichen Verwaltung. Das Problem steckt dabei oft im Detail. Oft sind zum Beispiel ganz wichtige Entwicklungsdaten oder auch selbst entwickelte Anwendungen auf einem Datenträger gesichert, der nicht in die zentrale Datensicherung eingebunden war.

Nach der Bestandsaufnahme, welche Backup-Systeme vorliegen, müssen alle Dateien identifiziert und katalogisiert werden, um zusammenhängende Daten zu organisieren. Da es sich bei den zu konvertierenden Beständen oft auch um alte Informationen handelt, wird häufig eine Datenrettung fällig. Logische und physikalische Beschädigungen, schon das einfache Fehlen eines Ersatzteils bei einem Laufwerk, können dazu führen, dass Daten zuerst nicht mehr lesbar sind. Doch selbst von gerissenen Bändern oder auch von Datenträgern, in denen Log-Dateien und Steuerungsdaten verloren gegangen sind, kann Vieles wieder hergestellt werden.

Erst im nächsten Schritt erfolgt die eigentliche Konvertierung der Daten. Hier kommen meistens eigens entwickelte Tools zum Einsatz, die die Umwandlung vornehmen. Die Experten von Kroll Ontrack können zum Beispiel VMS-Backups automatisch verarbeiten und in eine PC/Windows-Plattform übertragen und wieder zurück. Die Migrierung von IBM-Mainframedaten in eine UNIX-Umgebung erfolgt ebenso durch eigene Programme zur Übersetzung in den ASCII-Code. Für jedes Problem lassen sich so Lösungen entwickeln, die oft innerhalb weniger Stunden mehrere Gigabyte an Daten überspielen können.

Ist erst mal für Klarschiff in der Datenlandschaft gesorgt, bieten anschließende Dienstleistungen über die Migration hinaus Mehrwert. Deduplizierung, Duplizierung, Extrahierung oder aber auch Löschungen sind oft überhaupt erst jetzt möglich oder lassen sich einfacher, schneller und zuverlässiger durchführen.

Babylonische Ausmaße nimmt das Problem dann an, wenn man an die generelle Umwandlung von Anwendungsdaten denkt. Schon alte Textdokumente aus der DOS-Ebene sind eventuell nicht mehr einlesbar. Allein Machbarkeitsstudien zur Datenkonvertierung von Flächenwidmungsplänen wurden schon zum Thema für eine Diplomarbeit. Solche Tools müssen eigens entwickelt werden. Die Bundesinitiative SAGA proklamiert und empfiehlt daher eine Fülle von Schnittstellen und Dokumentenformaten wie pdf und gif. Aber das ist eher eine Regel für aktuell entstehende Daten.

Fazit

Datenkonvertierung wird immer wichtiger werden. Die Halbwertszeit digitaler Daten durch neue Speicherlösungen wird immer geringer. Schon jetzt raten Experten angesichts des technologischen Fortschritts dazu, alle fünf Jahre Unternehmensdaten zu konvertieren.

Die Überspielung von Informationen wird daher ein integraler Bestandteil von Datensicherheit. Behörden sehen sich noch stärker mit diesem Problem konfrontiert. Auch kleine Behörden können sich nicht wegducken. Die niedersächsischen Behörden sind angehalten, ihre Daten bei Übergabe an das Hauptstaatsarchiv Hannover in ASCII-Code oder als Bitmap zu übergeben. Da muss man unter Umständen nach preiswerten Lösungen Ausschau halten. Eine Lösung gibt es mit den richtigen Experten in den meisten Fällen. Für jeden Projektfall lässt sich ein Konvertierungsfahrplan erstellen.

(ID:2021554)