Barrierefreier Zugang durch Voice-Government in Würzburg Automatisches Sprachportal bietet neue Service-Möglichkeiten
Öffentliche Dienste einfach, schnell und sicher anzubieten, das ist für Verwaltungen ein wichtiges Ziel. „Voice-Government“ ist ein weiterer Baustein, dieses Ziel zu erreichen. Würzburg integrierte erfolgreich ein modernes Sprachdialogsystem der Erlanger Firma Sympalog. Neben der angestrebten Serviceverbesserung wurde eine Entlastung der Mitarbeiter erreicht und bestehende Zugangsbarrieren gesenkt.
Anbieter zum Thema
Unter „Voice-Government“ versteht man einen automatischen Service über den Kommunikationskanal, der am weitesten verbreitet ist: das Telefon. Wie sich diese Zielsetzung mit einem modernen Dialogsystem erreichen lässt, zeigt das Beispiel der Stadt Würzburg.
„Ich brauche einen neuen Personalausweis.“ Dass diese Aussage gleichzeitig eine Frage beinhaltet, ist einem Menschen sofort klar. Aber auch Maschinen sind in der Lage, diese und ähnliche Äußerungen zu erkennen und zu interpretieren: „Für Personalausweise steht Ihnen die Abteilung Ordnungsaufgaben zur Verfügung, diese hat die Telefonnummer ...“
Die Antwort stammt vom Bürgerinformationsportal der Stadt Würzburg, einem softwarebasierenden, vollautomatischen System, entwickelt von der Erlanger Firma Sympalog. Unter (0931) 372020 können sich Anrufer beispielsweise über Telefon- und Faxnummern, Öffnungszeiten und Adressen von über 120 Dienststellen, Fachabteilungen und anderen Institutionen informieren.
Das Bürgerinformationsportal ist für Bevölkerungsgruppen gedacht, für die eine Nutzung des Internets problematisch oder sogar unmöglich ist. Abgesehen von älteren Menschen sind dies auch Sehbehinderte. Für beide Gruppen ist derzeit das zentrale Kommunikationsmedium das Telefon. Sprachportale können daher ein weiterer Schritt hin zur mehr Barrierefreiheit sein. Grundlage für die Definition von Barrierefreiheit im Zusammenhang mit modernen Kommunikationsmitteln sind unter anderem das Behindertengleichstellungsgesetz und darauf aufbauend die „Barrierefreie Informationstechnik-Verordnung“ (BITV) aus dem Jahr 2002. Bei der BITV handelt es sich aber hauptsächlich um Bestimmungen im Zusammenhang mit der Darstellung von Internetseiten. Der rein sprachliche Zugang, wie ihn das Sprachdialogsystem von Sympalog bereitstellt, kann allerdings viel mehr für einen barrierefreien Zugang zu Informationen leisten als etwa die im BITV geforderte Ergänzung textlicher Informationen „mit grafischen oder Audio-Präsentationen“.
Erfolgsrezept Sprachdialog
Verglichen mit dem öffentlichen Sektor ist der Einsatz von Sprachdialogsystemen in Unternehmen bereits etabliert. Wirtschaftliche Aspekte, Aspekte der Erreichbarkeit und des Kundenservices spielen hier eine große Rolle. Insbesondere Unternehmen mit einem hohen Anteil an telefonischen Kundenkontakten, wie Banken, Telekommunikationsanbieter oder Energieversorger, wickeln einen Großteil ihrer eingehenden Anfragen über intelligente Sprachdialogsysteme ab. Möglich wurde dies, da die komplexe Technologie, die in den „Sprachcomputern“ zum Einsatz kommt, in den letzten Jahren große Fortschritte gemacht hat. Eine telefonisch gesteuerte Auskunft wird vom Anrufer aber nur dann als angenehm empfunden, wenn die technische Komplexität, die dahinter steckt, dem Kunden verborgen bleibt. Je weniger ein Anrufer sich dem System anpassen muss und je mehr die Vorteile eines natürlich-sprachlichen Zugangs zum Tragen kommen, desto höher ist die Benutzerakzeptanz.
Um hohen Komfort zu bieten, müssen bei der Spracherkennung auch spontan-sprachliche Benutzeräußerungen zuverlässig erkannt werden (Unterbrechungen, Füllwörter wie „tja“, „also“, Häsitationen wie „äh“, „hm“, dialektgefärbte Aussprachen). Die Verwendung von starren Grammatiken für Spracheingaben sollte deshalb möglichst vermieden werden. Ziel ist es, dem Anrufer eine höchstmögliche Freiheit der Formulierungen zu erlauben. Die von Sympalog entwickelten Sprachdialogsysteme haben gerade darin ihre Stärke. Darüber hinaus ist eine Anpassung des Wortschatzes des Spracherkenners selbstverständlich: Nicht jedem Anrufer beim Würzburger Telefonportal wird geläufig sein, dass er bei der „Abteilung Ordnungsaufgaben“ den Personalausweis beantragen muss. Gemeinsam mit der Stadt Würzburg war hier eine ausführliche Analyse von möglichen Anfragen notwendig, die modelliert und in das System eingebunden wurden.
Technisch ausgereift
Schnittstelle der Mensch-Maschine-Interaktion ist die Sprachausgabe. Sie schafft den direkten Bezug zu einem Sprachdialogsystem. Neben der Wortwahl für die Systemansagen, die auch als Prompts bezeichnet werden, ist vor allem die Stimme von entscheidender Bedeutung. Um eine hohe Qualität und Akzeptanz zu erreichen, ist der Einsatz von vorab aufgenommenen Sprachschnipseln mit professionellen Sprechern unabdingbar. In Würzburg kommt die Stimme einer Mitarbeiterin der Stadtverwaltung zum Einsatz. Einerseits wird durch die „Würzburger Stimme“ die Identifikation der Bürger mit dem System gefördert. Andererseits können so leichter Veränderungen (neue Sprachaufnahmen) durchgeführt werden. Mit gut durchdachten Prompts ist es möglich, das Verhalten und die Befindlichkeit des Benutzers positiv zu beeinflussen. Systemansagen wie „Bitte sprechen Sie laut und deutlich!“ sind kontraproduktiv und führen dazu, dass der Benutzer verärgert wird („Ich spreche laut und deutlich, Du verstehst mich nur nicht!“).
Hohe Benutzerfreundlichkeit
Die Anwendungsgebiete für automatische Dialogsysteme sind in den meisten Fällen eingeschränkt; dem Benutzer werden nur Informationen oder Transaktionen für definierte Bereiche angeboten. Dennoch stoßen klassische, in Menüs strukturierte IVR-Anwendungen (Interactive Voice Response), die im einfachsten Falle auf Touchtone- oder Einzelworterkennung aufbauen, schnell an ihre Grenzen: Oft kann nur eine Eingabe zugelassen werden, der Dialog ähnelt eher einer Navigation als einem Gespräch. Dies ist weder für die Akzeptanz noch für die Benutzerführung förderlich und steht im Widerspruch zur gewünschten Barriere-freiheit. Damit Anrufer nicht nur eine Reihe von Fragen des Systems nacheinander abarbeiten müssen, ist eine geschickte Planung des Gesprächsablaufs notwendig. In der Fachsprache als Dialogmanagement bekannt, ermöglicht diese Planung eine natürlichere Interaktion wie in der oberen Abbildung dargestellt. Der Anrufer muss sich zwar an das vorgegebene Thema halten („Kinoinformation“), seine Sprache aber kann spontan sein.
Das Dialogmanagement muss – wie man ebenfalls am Beispiel des Kinoinformationssystems erkennen kann – auch mit weiteren natürlich-sprachlichen Phänomenen umgehen können: Unterbrechen der Systemansage oder Referenzen über mehrere Äußerungen hinweg („läuft der auch in Erlangen“ wird intern umgesetzt in „läuft der Film Borat auch in Erlangen“). Wesentlich ist auch der Inhalt der Datenbank, auf die zugegriffen wird. Beispielsweise würde es eine große Zahl von Vorstellungen eines Filmes in einer Stadt mit vielen Kinos erforderlich machen, dass die „Ergebnismenge“ durch weitere Fragen nach Uhrzeit oder Kinonamen reduziert wird. Nur wenn all diese Punkte berücksichtigt werden, kann ein Sprachdialogsystem dazu beitragen, die Barrieren für ältere oder sehbehinderte Menschen abzubauen.
Technische Umsetzung
Die Herangehensweise bei der Realisierung des Auskunftssystems für die Würzburger Stadtverwaltung orientierte sich nicht nur am Inhalt der zugrunde liegenden Datenbank. Wesentlich für die Umsetzung waren Formulierungen, die von den Bürgern tatsächlich verwendet werden, wenn sie ein konkretes Problem haben. Das System ermöglicht die Zuordnung einer bestimmten Anfrage zu einem Amt, bevor die dazugehörige Information ausgegeben wird. So wird die Frage nach „Informationen über Kinderspielplätze“ mit dem Hinweis beantwortet, dass dieses Thema dem Gartenamt unterstellt ist. Ähnliche Beispiele sind „ich möchte heiraten“ (Standesamt) oder „wir sind gerade umgezogen“ (Einwohnermeldeamt). Der Anrufer erfährt aufgrund dieses Ansatzes das zuständige Amt, ein langwieriges Telefonat bleibt ihm erspart.
Bei der technischen Umsetzung entschied man sich für SymBase, die Kommunikationsplattform der Sympalog Voice Solutions GmbH. Das Produkt umfasst alle wesentlichen Bestandteile eines Sprachdialogsystems (Telefonieanbindung, Erkennung, Dialogmanager, Datenbankanbindung, Sprachausgabe) und wurde in die Würzburger IT-Infrastruktur integriert: Die Anrufer werden über eine Siemens Telefonanlage (HiPath) per VoIP-Protokoll (Bandbreite an Anfragen zu ermöglichen, besteht das Lexikon des Spracherkenners aus rund 5 000 Wörtern. Das Erkennungsergebnis wird zum Dialogmanager weitergeleitet, der eine System-Antwort auf Grundlage des Gesprächsinhalts und der Backend-Datenbank erstellt. Diese MS-SQL-Datenbank ist Teil der Intranetsoftware komXpress, einer Lösung für Behördennetze der Firma Living Data, und wird auch für den Webauftritt der Stadt genutzt. Hier sind die Öffnungszeiten und andere Informationen zu Ämtern und Einrichtungen gespeichert. Die Sprachausgabe erfolgt durch das Abspielen der vorab aufgenommenen Sounddateien.
Ein Update des Systems kann erforderlich werden, wenn größere Veränderungen in der Datenbank notwendig sind – etwa wenn die Namen neuer Ämter, Zuständigkeiten oder sonstige Informationen geändert werden müssen. Zu diesem Zweck nutzen die Mitarbeiter der Stadt Würzburg eine grafische Benutzeroberfläche (graphical user interface, GUI), mit deren Hilfe auch die Namen neuer Ämter eingepflegt werden. Nach dem Einspielen einer neuen Version der Datenbank wird auf Knopfdruck eine Liste der neuen Einrichtungen angezeigt. Nach der Anpassung weniger Einträge werden dann automatisch neue Parameter für die Sprachverarbeitung erzeugt.
Ausbaumöglichkeiten
Für die Stadt Würzburg ist der innovative Sprachdienst die konsequente Erweiterung ihres Angebots für die Bürger im Rahmen des Voice- und eGovernments. Dass es noch eine ganze Reihe von Dienstleistungen gibt, die die Öffentliche Verwaltung per Telefon zugänglich machen könnte, zeigt ein Prototyp der Firma Sympalog für ein System zur Kfz-Zulassung. Der Funktionsumfang der Applikation umfasst das Abfragen von allgemeinen Informationen, die Reservierung eines Wunschkennzeichens und die Vereinbarung von Terminen. Auch diese Anwendung ist in der Lage, sehr komplexe Äußerungen zu verarbeiten (Beispiel: „Ich möchte das Kennzeichen ‚München Strich Berta Anton 2002‘ reservieren.“). Diese Eigenschaft des Systems überzeugte auch die Juroren beim Voice Contest, für den das Telefonportal entwickelt wurde. Sprachexperten versuchen dabei, in nur fünf Tagen voll funktionsfähige Prototypen für reale Anwendungen zu entwickeln. In den letzten drei Jahren konnte Sympalog zweimal den ersten Platz erreichen.
Für Dr. Bernd Schmitt, Projektleiter bei der Stadtverwaltung, ist dies auch ein Beweis für die hohe Qualität des Würzburger Sprachdialogsystems. „Mit dem Ansatz, natürlich-sprachliche Anfragen zuzulassen und zu beantworten sind wir bei unseren Bürgern auf große Akzeptanz gestoßen.“ Doch bei aller Hochtechnologie – das Automatisieren von Amtshandlungen hat seine Grenzen: So werden die Würzburger auch zukünftig den Personalausweis in persona abholen müssen.
Artikelfiles und Artikellinks
(ID:2001975)