Projekt

OLIVE

Spiel's noch einmal, Sam! - Erschließung von Videomaterial mithilfe von Spracherkennung

Spiel's noch einmal, Sam! - Erschließung von Videomaterial mithilfe von Spracherkennung

  • Laufzeit:

Olive steht in einem engen Zusammenhang mit dem Pop-Eye Projekt, bei dem Videomaterial auf der Basis von Untertiteln zugänglich gemacht wurde. Olive bezieht auch das gesprochene Wort mit ein und ermöglicht den Zugriff über automatische Transkriptionen und über Hintergrundmaterial. Auch hier ist der Ansatz, einen gezielte Zugriff auf die Filminhalte mithilfe einer Indexierung von Texten und assoziierten Zeitmarken zu schaffen, die im wesentlichen über Spracherkennung erzeugt wurden. Der Benutzer gelangt über seine Anfrage zunächst zu einem Indexterm oder videographischen Daten. Von dort aus kann er das Bildmaterial punktgenau in Form von automatisch extrahierten Standbildern oder als digitalisierte Videosequenz abrufen.

Eines der Hauptprobleme bei der Erschließung, die unrestringierte Erkennung gesprochener Sprache, kann dabei teilweise dadurch gemindert werden, daß Hintergrundinformationen und anderen assoziierten Texte mit einbezogen werden. Durch die Verwendung des domänenspezifischen Vokabulars kann die Zuverlässigkeit der Hypothesen bei der Spracherkennung weit erhöht werden. Daneben kann durch Alinierung und Synchronisation die Zeitmarkierung in einer automatischen Transkription auf qualitativ bessere manueller Transkriptionen übertraqen werde, wie sie z.B. bei der Untertitelung anfallen.

Auch bei der Multilingulalität bietet Olive einen weiteren Fortschritt, indem es Dokumentenübersetzung, bei der offline ein Index von einer automatischen Übersetzung erstellt wird, kombiniert mit einer Anfrage-Übersetzung, bei der der Suchbegriff online übersetzt wird und mit einem Index in der Originalsprache abgeglichen wird.

  • Video-Retrieval mithilfe von Indizierung automatischer Sprachtranskriptionen
  • Mehrstufiger Retrievalprozeß über mehrsprachige Anfrage, textuelle Indexterme zu Standbildern und Videosequenz
  • Sprachübergreifendes Retrieval mithilfe von offline Dokumentenübersetzung und online Anfrageübersetzung
  • Zusätzliches Hintergrundmaterial zur Verbesserung der Spracherkennung und für weitere Erschließung der Videoinhalte

Partner

ARTE (DE/FR), INA (FR), LIMSI/CNRS (FR), NOB ( NL), TNO-TPD (NL, Coordinator), TROS (NL), Twente University (NL), VDA (NL), Vecsys (FR)

Deutsches Forschungszentrum für Künstliche Intelligenz
German Research Center for Artificial Intelligence