Projekt

ConQA

Kontrollierte semantisch-basierte Fragebeantwortung

Kontrollierte semantisch-basierte Fragebeantwortung

  • Laufzeit:

ConQA ist eine Erweiterung des internationalen Projekts QALL-ME, das im Bereich IST des Sechsten Rahmenprogramms der Europäischen Union angesiedelt ist. Während das EU-Projekt QALL-ME zu einem großen Teil aus anwendungsorientierter Grundlagenforschung im Bereich der domänenoffenen Systeme besteht, wird das Saarland-Projekt mehr auf die Umsetzbarkeit der gewonnenen Erkenntnisse in wirtschaftlich relevante Anwendungen zielen. ConQA wird sich daher auf die Entwicklung eines domänenspezifischen QA-Portals konzentrieren, das sich auf ein begrenztes, aber nicht kleines Wissensgebiet spezialisiert: die Beantwortung von Fragen zu kulturellen Veranstaltungen im Saarland und angrenzenden Regionen, wie etwa Luxemburg oder der Region Nancy. Dabei sollen nicht nur faktenbasierte Fragen zu konkreten Veranstaltungen beantwortet werden ("Wo finden im nächsten Monat Jazz-Konzerte statt?"), sondern Fragen zu Hintergrundinformationen ("Wer ist der Leadsänger der Jazzband?") und meinungsbezogene Fragen ("Welche negativen Kritiken erhielt die Jazzband für ihren letzten Auftritt?").

Besonderes Augenmerk wird dabei auf folgende Aspekte gelegt. Zum einen wird der Schwerpunkt auf eine einfach zu bedienende robuste Formulierung der Anfragen gerichtet, die keinerlei Hintergrundwissen über die tatsächlichen Daten oder die Funktionsweise der Antwort-Maschine voraussetzt. Hierbei werden die Vorteile einer einfachen Bedienung, wie sie durch gängige Suchmaschinen bereitgestellt wird mit den Vorteilen einer semantischen Analyse von natürlichsprachlichen Fragen kombiniert. Zum anderen wird durch die automatische semantische Analyse und Klassifikation von relevanten Web-Seiten, eine gezielte Beantwortung der Fragen unterstützt. Wir gehen davon aus, dass diese semantische Analyse auf Basis einer ontologie-basierten Informationsextraktion dynamisch durchgeführt wird und zu einer automatischen Konstruktion einer entsprechenden Datenbank führt. Zur Realisierung des oben angesprochenen einfachen und robusten Zugangs soll in ConQA die Datenbank dadurch angesprochen werden, dass gleichzeitig mit der Erstellung der automatischen Datenbank ebenfalls eine Menge von eindeutigen sprachlichen Mustern erstellt wird, die als Schnittstelle zwischen Fragen und Datenbank-Einträgen fungieren. Mit dieser innovativen Methode der kontrollierten sprachlichen Schnittstelle können erstmals neuartige Verfahren der textuellen Inferenz für die Beantwortung von Fragen in strukturierten Datenquellen herangezogen werden.

Deutsches Forschungszentrum für Künstliche Intelligenz
German Research Center for Artificial Intelligence