Informationen für Freunde und Förderer des DFKI      

Der Forschungsbereich Sprachtechnologie

 
NEWSLETTER 3
Dezember 1999
 

Sprachtechnologie für die Dokumentenproduktion

Aus dem wachsenden Bedarf an der strukturierten und kontrollierten Erzeugung von Information ergeben sich hohe Ansprüche an intelligente Softwaresysteme für die Dokumentenproduktion. Dies betrifft in allererster Linie die Kontrolle der verwendeten Terminologie, aber auch in zunehmendem Maße die Überprüfung von Grammatik oder Stil.

Die Basis für das Terminologie-Management ist zunächst einmal die Erstellung und Strukturierung einer kontrollierten Terminologie. Eine Hilfe dafür ist die automatische Terminologieextraktion aus bestehenden Texten. So muß der Anwender seine domänen-spezifische Terminologie nicht selbst erstellen. Bei der Überprüfung werden dann die verwendeten Begriffe mit der vorgegebenen Terminologie abgeglichen, um die Konsistenz zu gewährleisten. Um auch vernünftige und adäquate Varianten von bekannten Termini identifizieren zu können, ist der Einsatz von Sprachtechnologie erforderlich. Dabei kommen auch domänen-spezifische Ontologien zum Einsatz, die Terme zu Konzepten in Beziehung setzen. Die genannten Technologien setzen eine spezialisierte Datenbank-Software für die Terminologieverwaltung voraus. In diesem Bereich bieten wir selbst ein ausgereiftes Produkt an. Ein weiterführendes Ziel ist eine umfassende Lösung, in der auch die Terminologieextraktion und -überprüfung integriert sind.

Der zweite wichtige Aspekt bei der Dokumentenproduktion ist die Kontrolle von Stil und Grammatik. Unter dem Begriff "Kontrollierte Sprachen" hat sich ein Ansatz etabliert, der die Eindeutigkeit, Klarheit und leichte Verständlichkeit von Texten gewährleisten soll. Dabei wird nicht nur auf die Einhaltung einer vorgeschriebenen Terminologie geachtet, sondern es werden auch gezielt problematische Satzkonstruktionen ausgeschlossen und durch geeignetere ersetzt. Richtlinien dieser Art existieren seit geraumer Zeit in den Dokumentationsabteilungen der Industrie, die automatische Überprüfung wird jedoch erst durch die Werkzeuge möglich, die wir gegenwärtig entwickeln. Ein technologisches Ziel ist die Entwicklung einer integrierten Plattform mit XML als Schnittstellen- und Austauschsprache, in der Texte gleichzeitig einer lexikalischen und terminologischen Überprüfung unterzogen und auf der Basis von konfigurierbaren Stilregeln auf ihre Lesbarkeit und Verständlichkeit überprüft werden können.

H. Uszkoreit, A. Bredenkamp, M. Carnell, G. Neumann

 
zurück zur Startseite
Der Forschungsbereich Sprachtechnologie

Sprachtechnologie für:
Informations und Wissensmanagement
Dokumentenproduktion
natürliche Interaktivität
Die Verkehrsministerkonferenz am DFKI
Die Seite der Geschäftsleitung
Die Grundsteinlegung für den DFKI-Erweiterungsbau
Systems 99
Vorträge zur Ernennung zum Research-Fellow
Veröffentlichungen
Faircar auf Erfolgskurs
Die wissenschaftliche Spezialbibliothek des DFKI (Teil 2)
News & Events
Der Stellenmarkt
Impressum