Maschinelle Lernverfahren für Informationsextraktion und Text Mining

Hauptseminar im Sommersemester 2001

Leitung: Dr. Günter Neumann , Dipl.-Ling. Feiyu Xu, Dipl.-Inform. Jakub Piskorski
Ort: Geb. 17.2, Konferenzraum 2.11
Zeit: Mittwoch 14-16 Uhr
Beginn: 18.04.2001





Inhalt

German:
Bei der Informationsextraktion und dem Text Mining geht es um das Aufspüren und Strukturieren relevanter Informationseinheiten aus einer Menge von unstrukturierten oder semi-strukturierten Texten. Wichtige Teilbereiche hierbei sind z.B. Extraktion von Termen und Ontologien, Topic Detection, Named Entity Erkennung, Extraktion von Templates und Klassifikation von Dokumenten. In den letzten Jahren werden in diesen verschiedenen Teilbereichen verstärkt, maschinelle Lernverfahren entwickelt, um eine möglichst automatische Anpassung der Basistechnologien an neue Anwendungen und Wissensbereiche zu erreichen.
Das Seminar fängt mit einer kurzen Einfürung in die Gebiete Informationsextraktion und Text Mining an, die auch eine Abgrenzung zu verwandten Themen wie z.B. Information Retrieval and Question Answering Systems umfasst. Das Ziel dieses Seminars ist es dann, verschiedene aktuelle maschinelle Lernverfahren für Informationsextraktion und Text Mining zu diskutieren und zu vergleichen.
 

English:
Information extraction and text mining is concerned with the detection and normalization of relevant information from a set of unstructured
or semi-structured NL texts. Important subtasks are here, e.g., the extraction of terms and ontologies, topic detection, named entity recognition,
extraction of templates and text categorization. In recent years more and more approaches based on Machine Learning are used in order to
achieve a high degree of automatic adaptation towards new application and knowledge areas.
This seminar starts with a short introduction into the fields of information extraction and text mining, and a brief comparision with other
research areas like information retrieval and question answering systems. The main objective is then, to discuss and compare the different
learning approaches currently developed in information extraction and text mining.

Literatur
 

Einige kompakte Einführungen zum Thema Informationsextraktion und Text Mining finden sich in:


Einführungsvorträge


Vorläufige Themenliste und Zeitplan

Voraussetzungen/Bemerkungen
Einführung Informatik und Computerlinguistik, Grundkenntnisse in formalen Sprachen (insbesondere Automatentheorie) und Logik,
Programmiererfahrung.

Scheine
Vortrag und Hausarbeit
________________________________________________________________________________________

E-mail: neumann@dfki.de

Last modified: 19.04.2001