Maschinelle Lernverfahren für Informationsextraktion und Text Mining
(Machine Learning Methods for Information Extraction and Text Mining)

Hauptseminar im Sommersemester 2001

Leitung: Dr. Günter Neumann , Dipl.-Ling. Feiyu Xu, Dipl.-Inform. Jakub Piskorski
Ort: Geb. 17.2, Konferenzraum 2.11
Zeit: Mittwoch 14-16 Uhr
Beginn: 18.04.2001

Inhalt

Bei der Informationsextraktion und dem Text Mining geht es um das Aufspüren und Strukturieren relevanter Informationseinheiten aus einer Menge von unstrukturierten oder semi-strukturierten Texten. Wichtige Teilbereiche hierbei sind z.B. Extraktion von Termen und Ontologien, Topic Detection, Named Entity Erkennung, Extraktion von Templates und Klassifikation von Dokumenten. In den letzten Jahren werden in diesen verschiedenen Teilbereichen verstärkt, maschinelle Lernverfahren entwickelt, um eine möglichst automatische Anpassung der Basistechnologien an neue Anwendungen und Wissensbereiche zu erreichen.
Das Seminar fängt mit einer kurzen Einfürung in die Gebiete Informationsextraktion und Text Mining an, die auch eine Abgrenzung zu verwandten Themen wie z.B. Information Retrieval and Question Answering Systems umfasst. Das Ziel dieses Seminars ist es dann, verschiedene aktuelle maschinelle Lernverfahren für Informationsextraktion und Text Mining zu diskutieren und zu vergleichen.
(Information extraction and text mining is concerned with the detection and normalization of relevant information from a set of unstructured or semi-structured NL texts. Important subtasks are here, e.g., the extraction of terms and ontologies, topic detection, named entity recognition, extraction of templates and text categorization. In recent years more and more approaches based on Machine Learning are used in order to achieve a high degree of automatic adaptation towards new application and knowledge areas.
This seminar starts with a short introduction into the fields of information extraction and text mining, and a brief comparision with other research areas like information retrieval and question answering systems. The main objective is then, to discuss and compare the different learning approaches currently developed in information extraction and text mining.)
 

Literatur
 

Einige kompakte Einführungen zum Thema Informationsextraktion und Text Mining finden sich in:
(Compact introductions to the themes can be find here:)

Einführungsvorträge
(Introductions) Themenliste und Zeitplan
(List of theme and time schedule) Voraussetzungen/Bemerkungen
Einführung Informatik und Computerlinguistik, Grundkenntnisse in formalen Sprachen (insbesondere Automatentheorie) und Logik,
Programmiererfahrung.

Scheine
Vortrag und Hausarbeit
________________________________________________________________________________________

E-mail: neumann@dfki.de

Last modified: 5. July. 2001