DFKI-LT - Dissertation Series

Vol. XXXI

Stephan Walter: Definitionsextraktion aus Urteilstexten

ISBN: 978-3-933218-30-8
297 pages
price: € 17

order form

Diese Arbeit befasst sich mit der automatischen Extraktion und Analyse von Definitionen in deutschsprachigen Gerichtsurteilen. Rechtlich relevante Terminologie ist nur zum Teil durch Definitionen in Gesetzestexten festgelegt. Zusätzlich findet im Rahmen der Rechtsprechung eine permanente lokale, fallbezogene Präzisierung und Konkretisierung der verwendeten Begriffe statt. Gerichtsentscheidungen stellen deshalb neben Gesetzestexten eine zweite wichtige Quelle konzeptuellen Wissens für die Rechtsprechungspraxis dar. Um dieses Wissen automatisch erschließen zu können, müssen Definitionen in Entscheidungstexten mit hoher Präzision und Abdeckung aufgefunden werden.

Aufgrund der Besonderheiten der juristischen Domäne unterscheidet sich diese Zielsetzung in wichtigen Punkten von typischen Fragestellungen im Bereich des Text Mining. Zunächst einmal können bei der Definitionssuche in Entscheidungstexten nicht in gleichem Maße Redundanzen genutzt werden wie beispielsweise bei der Suche nach Konzepten oder Relationen im WWW.

So ist im juristischen Kontext für einen konkreten Rechtsfall unter Umständen eine Definition relevant, die nur in einem einzigen Urteilstext enthalten ist. Gleichzeitig enthalten Definitionen desselben Begriffs in verschieden Urteilen oft einander ergänzende und aufeinander bezogene Informationen (z.B. Präzisierungen eines übergreifenden Konzepts für unterschiedliche Fallklassen, etwa des Werkbegriffs im Urheberrecht für den Bereich der Literatur, der Architektur und der Gebrauchskunst). Neben Zielgenauigkeit ist deshalb bei der Definitionsextraktion auch eine hohe Abdeckung wichtig, um die konzeptuelle Gesamtstruktur von Rechtsbegriffen möglichst detailliert erschließen zu können.

Unter solchen Rahmenbedingungen stoßen statistische Verfahren an die Grenzen ihrer Leistungsfähigkeit. Sie können jedoch zum einen durch Expertenwissen ergänzt werden. Zum anderen ist es in dieser Situation sinnvoll, verhältnismäßig tiefe linguistische Information in den Suchprozess einzubeziehen, selbst wenn diese nur mit recht hohem Verarbeitungsaufwand ermittelt werden kann.

Hauptbeitrag der Arbeit ist ein linguistisch informiertes Definitionsextraktionsverfahren, das Expertenwissen in Form von Suchmustern nutzt, die auf der Grundlage einer systematischen Analyse eines Rechtsprechungskorpus spezifiziert wurden. Es stützt sich auf die Analysen einer spezialisierten sprachtechnologischen Verarbeitungskette für Rechtstexte, die sich um den in Fliedner 2007 (Saarbrücken Dissertation Series Vol. XXIII) genutzten PreDS-Parsers gruppiert. Durch Hinzunahme datengetrieben arbeitender Optimierungsschritte wird die Definitionssuche bis zur praktischen Anwendungsreife erweitert und verbessert.