|
Sprachtechnologie für die Dokumentenproduktion
Aus dem wachsenden Bedarf an der strukturierten und kontrollierten Erzeugung von Information ergeben sich hohe Ansprüche an intelligente Softwaresysteme für die Dokumentenproduktion. Dies betrifft in allererster Linie die Kontrolle der verwendeten Terminologie, aber auch in zunehmendem Maße die Überprüfung von Grammatik oder Stil.
Die Basis für das Terminologie-Management ist zunächst einmal die Erstellung und Strukturierung einer kontrollierten Terminologie. Eine Hilfe dafür ist die automatische Terminologieextraktion aus bestehenden Texten. So muß der Anwender seine domänen-spezifische Terminologie nicht selbst erstellen. Bei der Überprüfung werden dann die verwendeten Begriffe mit der vorgegebenen Terminologie abgeglichen, um die Konsistenz zu gewährleisten. Um auch vernünftige und adäquate Varianten von bekannten Termini identifizieren zu können, ist der Einsatz von Sprachtechnologie erforderlich. Dabei kommen auch domänen-spezifische Ontologien zum Einsatz, die Terme zu Konzepten in Beziehung setzen. Die genannten Technologien setzen eine spezialisierte Datenbank-Software für die Terminologieverwaltung voraus. In diesem Bereich bieten wir selbst ein ausgereiftes Produkt an. Ein weiterführendes Ziel ist eine umfassende Lösung, in der auch die Terminologieextraktion und -überprüfung integriert sind.
Der zweite wichtige Aspekt bei der Dokumentenproduktion ist die Kontrolle von Stil und Grammatik. Unter dem Begriff "Kontrollierte Sprachen" hat sich ein Ansatz etabliert, der die Eindeutigkeit, Klarheit und leichte Verständlichkeit von Texten gewährleisten soll. Dabei wird nicht nur auf die Einhaltung einer vorgeschriebenen Terminologie geachtet, sondern es werden auch gezielt problematische Satzkonstruktionen ausgeschlossen und durch geeignetere ersetzt. Richtlinien dieser Art existieren seit geraumer Zeit in den Dokumentationsabteilungen der Industrie, die automatische Überprüfung wird jedoch erst durch die Werkzeuge möglich, die wir gegenwärtig entwickeln. Ein technologisches Ziel ist die Entwicklung einer integrierten Plattform mit XML als Schnittstellen- und Austauschsprache, in der Texte gleichzeitig einer lexikalischen und terminologischen Überprüfung unterzogen und auf der Basis von konfigurierbaren Stilregeln auf ihre Lesbarkeit und Verständlichkeit überprüft werden können.
H. Uszkoreit, A. Bredenkamp, M. Carnell, G. Neumann
|
|
|
zurück
zur Startseite |
|
Der Forschungsbereich Sprachtechnologie
Sprachtechnologie für:
|
|
Die
Verkehrsministerkonferenz am DFKI |
|
Die Seite der Geschäftsleitung |
|
Die
Grundsteinlegung für den DFKI-Erweiterungsbau |
|
Systems 99 |
|
Vorträge zur Ernennung
zum Research-Fellow |
|
Veröffentlichungen |
|
Faircar
auf Erfolgskurs
|
|
Die wissenschaftliche
Spezialbibliothek des DFKI (Teil 2) |
|
News
&
Events
|
|
Der Stellenmarkt |
|
Impressum |
|