Adaptive READ-Projekt sichert Deutschland Wettbewerbsvorteile Hohe Erwartungen an Transfer in wirtschaftliche Anwendungen

Am 18. März 2003 findet im Maritim Hotel in Magdeburg die Abschlusspräsentation des Forschungsprojektes „Adaptive READ“ statt. Unter dem Motto „Lesen und Lernen – vom Dokument zum Wissen“ bündelte Adaptive READ die nationalen Kräfte aus Forschung und Industrie, mit dem Ziel, die Erfassung, Erkennung und Weiterverarbeitung von gedruckten, handgeschriebenen und elektronischen Dokumenten voranzutreiben. In Adaptive READ arbeiteten 11 Partner – davon 4 Forschungseinrichtungen – über 7 Jahre an dieser Herausforderung. Das Gesamtvolumen des Projektes inklusive seines Vorgängerprojektes READ beläuft sich auf 32 Millionen Euro – wovon knapp 16 Millionen Euro vom Bundesministerium für Bildung und Forschung (BMBF) als Fördermittel bereitgestellt wurden.

Eines der zukunftsträchtigen Anwendungsfelder von Adaptive READ ist die Postautomatisierung. Zielstellung bei der Postautomatisierung ist die automatische Sortierung und Verteilung von Briefen und Paketen in großen Poststellen. Die Genauigkeit derartiger Systeme hängt wesentlich davon ab, wie anpassungsfähig sie bezüglich der Vielfalt von Adress-Gestaltung und -Schriftarten sind, sowie in welchem Maße sie über aktuelle Adressdaten und vorkommende Schreibvarianten einer Adresse verfügen. Die Erhebung und Anpassung solcher Daten war bisher eine kostenintensive Aufgabe. Die in Adaptive READ entwickelten Technologien sind in der Lage, selbständig neue Adressen und Schreibvarianten im Poststrom zu erkennen und sich daran anzupassen. Ein System zum maschinellen Lesen von Briefmarken und anderen Merkmalen, die zur Bestimmung der Versendungsart nötig sind, kann automatisch feststellen, ob Briefe und Pakete ausreichend frankiert sind und ggf. Maßnahmen zur Entgeldsicherung einleiten. Die mit den neuen Verfahren einhergehende Kostenreduktion, sowie die neuen Funktionen, bauen die Weltmarktführerschaft deutscher Postautomatisierungssysteme im Kerngeschäft aus: Lösungen vom Projektpartner Siemens Dematic AG werden bereits heute in Poststellen in über 30 Ländern eingesetzt. Darüber hinaus werden neue Märkte im Bereich der internationalen Post-Dienste sowie bei Kommerziellen Inhaus-Post Anwendern eröffnet.

Ein weiterer Forschungsschwerpunkt in Adaptive READ war die maschinelle Erfassung von Geschäftskorrespondenz, wie beispielsweise Rechnungen und Lieferscheine. Informationen wie das Datum, die Kundennummer, Rechnungsbeträge sowie Bankverbindungen sind die Grundlage zur weiteren Bearbeitung der Dokumente. Bei bisherigen Lösungen zur Extraktion solcher Informationen aus Dokumenten handelt es sich um schwerfällige, monolithische Systeme, die nur unter erheblichen Entwicklungsaufwand angepasst werden können. Der Einsatz solcher Systeme ist wegen der enormen Kosten nur dann interessant, wenn hunderte oder tausende Dokumente des gleichen Typs täglich zu bearbeiten sind. Die in Adaptive READ entwickelten modularen und adaptiven Systeme sind wesentlich kostengünstiger. Lösungen für spezielle Extraktionsaufgaben können nun einfach nach dem Baukastenprinzip zusammengesetzt und vom Endanwender für die jeweilige Aufgabe trainiert werden. Ein weiterer Vorteil der neuen Systeme ist, dass sie mehr Informationen aus den Dokumenten extrahieren können. Dies gilt beispielsweise für Informationen in Tabellen, deren Inhalte bisher kaum zu erkennen waren, die aber zur Erfassung von Positionen einer Rechnung oder eines Lieferscheins wesentlich sind. Die neuen Verfahren zur maschinellen Erfassung von Geschäftskorrespondenz werden unter anderem in Produkte der Partnerfirmen OCÉ Document Technologies und insiders technologies einfließen, die sich damit an die Weltspitze dieser Technologien setzen.

Die Erschließung von Wissen aus elektronischen Dokumenten war ein weiterer Schwerpunkt in Adaptive READ. Im Vordergrund stand die Entwicklung neuer Konzepte für Suchmaschinen. Diese Suchmaschinen assistieren dem Benutzer bei der Navigation durch den Informationsdschungel, indem sie seine Suchgewohnheiten studieren und ihm beispielsweise Vorschläge zur Verfeinerung seiner Suche machen. Erkennt das System, dass der Benutzer zwar den Begriff Auto eingibt, eigentlich aber Fahrzeuge meint, kann es ihm auch Suchergebnisse für verwandte Begriffe wie Kfz oder Verkehr anbieten. Die Software simuliert einen erfahreneren Suchspezialisten, der den Nutzer – vergleichbar einem Bibliothekar in Archiven – zu den gesuchten Informationen führt. Setzt man derartige Technologien – wie bereits angedacht – im Umfeld der Arbeitsvermittlung ein, so können wesentlich mehr Stellen als bisher erfolgreich vermittelt werden. Auch in diesem Bereich sind die Adaptive READ Entwicklungen konkurrenzlos.

Die Ergebnisse von Adaptive READ sind bereits in über 15 Spin-Off Produkte eingeflossen. Bisher liegen 20 Patente und Erfindungsmeldungen vor. Auf der Abschlussveranstaltung werden neben den wissenschaftlichen Ergebnissen auch erstmals leistungsfähige Prototypen präsentiert.

Kontakt:

Prof. Dr. Prof. h.c. Andreas Dengel

Andreas.Dengel@dfki.de