Für fundierte Entscheidungen und Vorhersagen braucht es die entsprechende Datenbasis – die aber längst nicht immer verfügbar ist. Franz Böhmann erklärt, wie synthetische Daten genutzt werden können, um Szenarien zu simulieren und KI-Modelle schneller zu trainieren.
Die Qualität synthetischer Daten ist durch klare Standards und ein systematisches Qualitätsmanagement sicherzustellen.
Wo sehen Sie die größten Potenziale für den Einsatz synthetischer Daten in der öffentlichen Verwaltung ?
Böhmann: Die größten Potenziale für den Einsatz synthetischer Daten sehe ich in der Überwindung bestehender Hindernisse, die durch fragmentierte Dateninfrastrukturen, mangelnde Interoperabilität und strenge Datenschutzvorgaben entstehen. Diese Herausforderungen erschweren derzeit eine datengetriebene Politikgestaltung, effiziente Verwaltungsarbeit und den flächendeckenden Einsatz von KI in Digitalisierungsprojekten.
Ein zentraler Punkt ist die Stabilisierung der „Datenfundamente“, die für komplexe, querschnittsübergreifende Analysen notwendig sind. Synthetische Daten können hier eine Schlüsselrolle spielen, indem sie Lücken in der Datenverfügbarkeit schließen und eine verlässliche Grundlage für innovative Lösungen schaffen. Sie ermöglichen es, Szenarien zu simulieren und Modelle zu trainieren, ohne dabei auf sensible oder unvollständige Echtweltdaten angewiesen zu sein.
Ein Beispiel aus der Steuerpolitik verdeutlicht dies: Die Auswirkungen neuer Steuergesetze auf Gesellschaft, Markt und Individuen sind äußerst komplex. Um fundierte Prognosen zu erstellen, müssten Daten aus verschiedenen Domänen – etwa Wirtschaft, Sozialpolitik und Demografie – integriert und analysiert werden. Doch oft sind solche Daten nur lückenhaft oder aufgrund rechtlicher Einschränkungen nicht verfügbar. Synthetische Daten können in solchen Fällen nicht nur als Platzhalter dienen, sondern auch als Grundlage für belastbare Vorhersagen und Entscheidungen.
Welche Möglichkeiten gibt es, die Qualität synthetischer Daten sicherzustellen und zu überprüfen?
Böhmann: Die Qualität synthetischer Daten lässt sich durch klare Standards und ein systematisches Qualitätsmanagement sicherstellen. Ein zentraler Ansatzpunkt ist die Definition von Qualitätskriterien wie Genauigkeit, Konsistenz und Repräsentativität sowie deren Dokumentation in umfassenden Metadaten. Validierungsverfahren, beispielsweise der Abgleich mit realen Daten oder statistische Analysen, ermöglichen die Überprüfung, ob synthetische Daten die gewünschten Eigenschaften aufweisen.
Synthetische Daten sollten im Datenmanagement gesondert behandelt und durch eindeutige Kennzeichnungen sowie Hinweise auf ihre Limitierungen sichtbar gemacht werden. Ein kontinuierliches Monitoring innerhalb eines reaktiven Datenmanagementsystems ist essenziell, um die Qualität langfristig zu gewährleisten und auf Veränderungen flexibel reagieren zu können.
Darüber hinaus können Verlässlichkeitsbewertungen für synthetische Datenprodukte Transparenz schaffen und Vertrauen bei den Nutzern fördern. So werden synthetische Daten zu einem kontrollierbaren und nachhaltigen Element in der datengetriebenen Verwaltung.
Wie werden synthetische Daten zum Training von KI-Modellen erzeugt und eingesetzt?
Böhmann: Für das Training von KI-Modellen werden Datensets benötigt, die sowohl eine ausreichende Menge an Informationen als auch qualitativ hochwertige Inhalte enthalten, um die relevanten Lernattribute abzubilden. KI-Modelle stellen spezifische Anforderungen an ihre Trainings- und Testdaten, wodurch umfangreiche Prozesse zur Datenbereinigung und -aufbereitung erforderlich werden.
Bei der Erstellung synthetischer Datensets werden diese Anforderungen zunächst analysiert und in einen Datenerstellungsprozess übersetzt, um die benötigten Eigenschaften der Daten sicherzustellen. Dies kann von einfachen Datenmodellen bis hin zu komplexen Pipelines mit generativer KI und Machine Learning reichen. Ein einmal entwickelter Datenprozess bietet ausreichend Stellschrauben, um Qualität und Inhalt der synthetischen Datensätze präzise zu steuern und flexibel anzupassen.
In der öffentlichen Verwaltung ist es häufig sehr aufwendig, historische Daten aufzubereiten, um sie für das KI-Training nutzbar zu machen. In solchen Fällen kann der Aufbau einer schnellen Pipeline zur Erzeugung synthetischer Daten deutliche Vorteile bringen.
Beispielsweise wäre es effizienter, zukünftige Dokumente künstlich zu erstellen, statt Monate für die Aufbereitung von tausenden Alt-Dokumenten aufzuwenden, wenn das Ziel bereits klar definiert ist.
Franz Böhmann ist Senior Business Consultant bei msg und unterstützt den öffentlichen Sektor in der KI-Managementberatung.
Welche Entwicklungen erwarten Sie für die Zukunft?
Böhmann: Generative KI ist aktuell ein großes Thema in der öffentlichen Verwaltung, insbesondere im Kontext digitaler Assistenzsysteme mit Agentic AI. Technologisch basiert dies auf der Kombination von generalisierten und spezialisierten KI-Modellen, die in maßgeschneiderten Expertensystemen agieren, jedoch bleibt die Datenfrage zentral. Daten müssen nicht nur verfügbar sein, sondern auch kontextbezogen und logisch miteinander verknüpft werden können, weshalb die Diskussion zunehmend von Datenmodellen hin zu Informationsmodellen verschoben wird. Gleichzeitig erzeugt generative KI große Mengen an Daten, die häufig auf historischen Datengrundlagen basieren, wodurch ein Sättigungseffekt entsteht, da neue Realitätsabbildungen fehlen. Besonders auf Plattformen wie Social Media, in Film und Musik wird es immer schwieriger, zwischen realen und künstlich generierten Daten zu unterscheiden. Dies erhöht den Bedarf an individuell erstellten und nachvollziehbaren Daten, die eine höhere Trennschärfe gewährleisten. Ein qualitativ strukturierter Umgang mit synthetischen Daten kann dabei helfen, diese Herausforderungen zu bewältigen und gleichzeitig einen bedeutenden Mehrwert für „KI made in Germany“ schaffen.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.