COOC -- Thesaurus-Basierte Desambiguierung von W"ortern

Beschreibung

F\"ur die Verarbeitung von Sprache ist es ein immer noch schwieriges Problem, die korrekten Lesarten von Lexeme zu bestimmen. In seligman et.al. 99 ist ein Ansatz beschrieben, der mit Hilfe eines Thesaurus Zusammenh\"ange unterschiedlicher Stufen berechnen kann. Dabei wird davon ausgegangen, da"s die Eingabenmit POS Tags annotiert sind.

Um diese Arbeiten f\"ur die am DFKI laufenden Projekten nutzen zu k\"onnen, wird im Praktikum folgende Aufgaben gel"ost:

Damit m"ussen zwei Aufgaben gel"ost werden:

Es steht den Bearbeitern frei, das COOC-programm, das in CommonLisp geschrieben ist, z.B. in JAVA zu reimplementieren, falls dies die Anpassung erleichtert.

Literatur/Links

More links...

Teilnehmer:

Associates:

Jan Alexandersson