Projekt

MOONVID

Statistische Modellierung des Inhaltes von Online Videos zur automatisierten Detektion semantischer Konzepte in Videos

  • Laufzeit:

Die automatische Detektion visueller Konzepte wie Objekte, Orte und Tätigkeiten in Video gewinnt angesichts rasant wachsender digitaler Videobestände zunehmend an Bedeutung. Solche Tagging-Systeme werden üblicher Weise auf einem Bestand manuell annotierter Videos trainert. Die Akquise solcher Trainingsdaten ist ein zeitraubender Vorgang, und momentane Standarddatensätze sind hochqualitativ, aber zu klein.

Im Gegensatz dazu lernt der Mensch aus einer Fülle visueller Information, und Teile davon sind in großen Video-Archiven (wie z.B. youtube) digitalisiert und frei erhältlich. Die Zielsetzung des MOONVID-Projektes ist das visuelle Lernen von solchen Web-Videoportalen. Hierbei werden speziell drei entscheidende wissenschaftliche Fragestellungen behandelt:

  1. Wie wählt und kombiniert man Merkmale für die semantische Beschreibung von Videoinhalten?
  2. Wie kann man visuelle Lernverfahren robust machen gegen irrelevante Inhalte und schwache Annotationen?
  3. Kann eine Bewegungssegmentierung, die Objekte von ihrem Hintergrund trennt, zu einer verbesserten Erkennung von Objekten beitragen?

Projekt teilen auf:

Publikationen zum Projekt

In: Proceedings of the International Conference on Multimedia. ACM International Conference on Multimedia (ACM MM-2011) November 28-December 1 Scottsdale Arizona United States ACM 11/2011.

Zur Publikation

In: Proceedings of the International Conference on Multimedia and Expo. IEEE International Conference on Multimedia and Expo (ICME-2011) July 11-15 Barcelona Spain IEEE 7/2011.

Zur Publikation
Marcel Worring,

In: Sheila S. Hemami (Hrsg.). IEEE Transactions on Multimedia (TransMM) 13 3 Seiten 1-12 IEEE Computer Society 4/2011.

Zur Publikation

Deutsches Forschungszentrum für Künstliche Intelligenz
German Research Center for Artificial Intelligence