Interview mit Prof. Wahlster
Preis des Bundespräsidenten für Technik und Innovation
Hintergrundinformationen
Fragen an Prof. Dr. rer. nat. Dr. h.c. Wolfgang Wahlster
Projekt: Sprachverstehende Computer als Dialog- und Übersetzungsassistenten
Frage:
Erklären Sie uns bitte die Entwicklung des Projektes in einzelnen
Schritten und stellen Sie den Bereich daraus dar, der jetzt mit der
Nominierung zum Deutschen Zukunftspreis als Innovation gewürdigt worden
ist.
Prof. Wolfgang Wahlster:
Wir haben das Projekt Verbmobil 1993 nach einer intensiven
Planungsphase und Genehmigung der Fördermittel durch das
Bundesministerium für Bildung und Forschung offiziell gestartet. Ich
hatte mich vorher schon 15 Jahre lang in der Grundlagenforschung mit der
Frage beschäftigt, wie man Computern beibringen kann, die deutsche
Sprache zu beherrschen.
Es ist für unsere Kultur sehr wichtig, dass die Sprachtechnologie
nicht nur für das Englische zur Verfügung steht, sondern dass auch
unsere eigene Muttersprache in der Welt der IT-Technik weiterhin
verwendet werden kann. Wenn man bedenkt, dass Deutsch in der EU zurzeit
die am meisten gesprochene Sprache ist, so wird sofort das große
wirtschaftliche Potenzial der maschinellen Sprachverarbeitung des
Deutschen klar.
Das grundlegende Ziel meiner Forschung ist, den Computer näher an
den Menschen heranzubringen. Das bedeutet, dass sich der Mensch nicht
länger auf künstliche Computersprachen einstellen muss, sondern die
Vision ist, den Menschen in die Lage zu versetzen, sich in deutscher
Alltagssprache Information aus dem Computer zu besorgen und Aufgaben an
ihn zu delegieren.
Wir sind 1993 mit dem ehrgeizigen Verbmobil-Projekt ein sehr großes
Forschungs- und Entwicklungsrisiko eingegangen. Die Entwicklung eines
funktionsfähigen Prototyps zur Übersetzung von Telefondialogen mit über
35 Arbeitsgruppen aus der Wissenschaft und Wirtschaft hielten viele
Kollegen wegen der extrem hohen Komplexität der Aufgabe für unmöglich.
Wir haben sogar Unteraufträge nach Japan und den USA geben müssen, um
dort Sprachdaten sammeln zu lassen. Erstmals wurde in Verbmobil in
großem Maßstab versucht, Spracherkennung, Sprachverstehen und Künstliche
Intelligenz in insgesamt 135 Arbeitspaketen zusammenzubringen.
Heute sind in Deutschland Sprachdialogsysteme im Einsatz, die in
sehr eingeschränkten Themengebieten wie der Fahrplanauskunft oder der
Steuerung von nicht sicherheitskritischen Fahrzeugfunktionen nahezu
perfekt arbeiten. Je mehr der Computer über das Sachgebiet und über die
Themenstellung weiß, über die der Benutzer spricht, desto besser
funktioniert das automatische Sprachverstehen. Wenn dagegen ein
Stammtischgespräch oder das Liebesgeflüster zwischen einer Japanerin und
einem Deutschen automatisch analysiert und übersetzt werden soll, so
kann das bei unserem heutigen Stand der Technik keinesfalls
funktionieren, weil die Thematik viel zu weit gefasst ist.
Wir betrachten Sprache als kommunikatives Instrument, wobei wir
dessen Verwendungszweck klar abgrenzen können: wir wollen etwa über das
Verbmobil-System einen Termin ausmachen oder ein Hotel im Ausland
reservieren.
Unser Projekt entwickelte sich in Phasen: Die erste von 1993 bis
1996 bestand in der Aufgabe, die verschiedenen existierenden
wissenschaftlichen Ansätze zur automatischen Sprachverarbeitung zu
integrieren und die verschiedenen beteiligten Wissenschaftsdiziplinen
zusammenzubringen. Das Faszinierende am Thema Sprachtechnologie ist
nämlich, dass es einen Brückenschlag zwischen Geistes- und
Sozialwissenschaften auf der einen Seite und der Natur- und
Ingenieurswissenschaften auf der anderen Seite voraussetzt. Ich habe
Linguistik und Informatik studiert und mich seitdem immer in diesen
beiden doch sehr unterschiedlichen wissenschaftlichen Welten bewegt.
Zunächst muss man dem Computer - vereinfacht gesagt - die Grammatik
des Deutschen beibringen. Wir konnten natürlich nicht einfach den Duden
digital abspeichern, sondern wir mussten das grammatische Wissen
zunächst formalisieren, es auf eine mathematisch-logische Basis stellen,
die ein Computerprogramm für seine Analysen nutzen kann. Ingenieure,
Nachrichtentechniker und Informatiker verstehen natürlich von den
komplexen Zusammenhängen und Subtilitäten der Sprache zu wenig, so dass
sie unbedingt mit Sprachwissenschaftlern und Sprachpsychologen
zusammenarbeiten müssen. Wir mussten gleichzeitig viele Sprachproben von
vielen Sprechern in mehr als 3.000 Dialogen sammeln und für den
Computer aufbereiten. Dann konnten wir die automatischen
Spracherkennungsprogramme für Spontansprache maschinell trainieren.
Völlig neu war dabei, dass wir uns von Beginn an mit spontan
gesprochener Sprache beschäftigt haben. Der Computer sollte auch Sätze
mit "Ähs" sowie Satzabbrüchen und Versprechern bearbeiten können.
Eine grundlegende Idee in unserem Projekt war, statistisch-basierte
Verfahren mit regelbasierten Verfahren zur Sprachanalyse in einem
System zu vereinen. Bisher waren dies zwei Schulen der Wissenschaft, die
meinten, jeweils alleine das Problem der automatischen Sprachanalyse
bewältigen zu können. Beide Verfahrensparadigmen haben aber spezifische
Vor- und Nachteile. Wir haben eine neuartige Systemarchitektur für die
Sprachverarbeitung erfunden, die mehrere Nachrichtentafeln zwischen
einzelnen Prozessen verwendet und parallel mit mehreren alternativen
Analysemethoden die gleiche Spracheingabe bearbeitet. Nachdem in den
90er Jahren ein Paradigmenstreit zwischen Vertretern regelbasierter und
statistischer Verarbeitungsverfahren die sprachtechnologische Forschung
beherrschte, wurde ein entscheidender technischer Durchbruch durch das
von uns entwickelte innovative Prinzip der wechselseitigen,
synergistischen Ergänzung flacher, statistisch-basierter Algorithmen und
tiefer, wissensbasierter Analyseverfahren für spontane Umgangssprache
in einer hybriden Multi-Blackboard-Architektur erreicht – wie das in der
Fachsprache heißt. Der Kern der Innovation besteht in der semantischen
Fusion über eine logische Zwischensprache und der konfidenzbasierten
Selektion multipler und konkurrierender Analyse- und Übersetzungspfade,
die erstmals hohe Robustheits- und Realzeitanforderungen mit variabler
Verstehenstiefe und Analysekorrektheit verbindet.
Nach der erfolgreichen Abnahme des Verbmobil-Forschungsprototyps im
Oktober 1996 bewilligte das Forschungsministerium die zweite
Projektphase (1997 - 2000). In dieser wurde Verbmobil auf einem
zentralen Sprachserver implementiert, der über ISDN-Telefone,
ATM-basierte Telekooperationsdienste oder GSM-Mobilfunk in Anspruch
genommen werden kann. Dieser Sprachserver identifiziert die
Eingabesprache und übernimmt die Spracherkennungs-, Übersetzungs- und
Sprachgenerierungsleistung. Da mehrere Nutzer die
Übersetzungsdienstleistung gleichzeitig in Anspruch nehmen können,
werden bei dem Sprachserverkonzept parallele Kanäle vorgesehen.
Verbmobil wird dadurch auch in mehrsprachigen Telekonferenzen mit mehr
als zwei Partnern eingesetzt werden können.
Praktisch bedeutet die Realisierung von Verbmobil und seiner
Derivate, dass wir die ersten Systeme geschaffen haben, die von dem
sprachlichen Eingabesignal bis hin zur akustischen Sprachausgabe ein
Sprachverständnis zeigen. Wir sind jetzt auch in der Lage, solche
Gespräche automatisch zusammenzufassen. Wenn man sich vorstellt, man
führt ein Gespräch – fremdsprachlich – und kann nachher dem Computer
sagen, man möchte ein Gesprächsprotokoll: das eröffnet ganz neue
Anwendungsperspektiven. Aber ich muss immer dazu sagen, all das
funktioniert bisher nur bei vorher abgegrenzten Gesprächsthemen.
Verbmobil bietet eine Assistenzfunktion in Standardsituationen an; es
ist kein Ersatz für hochspezialisierte Simultandolmetscher.
Frage:
Das Ganze ist ein Computerprogramm?
Prof. Wolfgang Wahlster:
Ja, alle Sprachtechnologien basieren auf sehr umfangreichen
Softwaresystemen. Das ist auch gut so, denn damit ist die Technik
universell einsetzbar. Einige der Systeme laufen auch bereits auf
kleinen Computern, z.B. Notebooks. Ein Telefonübersetzungssystem wie
Verbmobil braucht in der vollen Ausbaustufe heute aber noch sehr viel
Computerressourcen.
Frage:
Nochmals zu diesem Prozess der Innovation. Gab es einen Punkt, an dem
Sie sagten, so kann es funktionieren oder war es eine Kausalkette?
Prof. Wolfgang Wahlster:
Ich meine, das war bei dem Übergang von der ersten Phase, der
grundlegenden Vorlaufphase von vier Jahren, zur zweiten Projektphase. Da
mussten wir uns entscheiden, welche Forschungsstränge wir weiterführen,
um das Projekt erfolgreich beenden zu können. Wir erzielten Ergebnisse
von ganz unterschiedlicher Qualität: Manche Verfahren analysierten
genau, aber schlugen oft fehl, andere analysierten recht oberflächlich,
aber funktionierten immer. Und da hatte ich die Idee, nicht so
vorzugehen, dass wir eine Analysemethode ganz herausschmeißen, sondern
nach Wegen der Kombination zu suchen. Ich hatte immer schon die
Vorstellung, dass in der Kombination der Pfiff liegen muss. Die
Mehrdeutigkeit ist ja eines der großen Probleme, die wir in der
Verarbeitung natürlicher Sprache haben und um so mehr verschiedene
Evidenzen ich für eine Hypothese habe, um so besser ist es, weil sie
sich wechselseitig verstärken. Und dann kam mir der Gedanke, morgens
unter der Dusche: Das ist die Lösung! Wir müssen die unterschiedlichen
Ergebnisse mit Kon-fidenzen versehen und sie zu einem gemeinsamen
Ergebnis über eine logische Zwischensprache in einem Hypothesengitter
integrieren können. Diese Idee haben wir dann in Phase 2 des Projektes
konsequent verfolgt und dabei stets darauf geachtet, gleich auch immer
Spin-Off-Produkte zu erzeugen. Wir haben gesagt: Der Weg ist das Ziel
und wir wollen auch zwischendurch schon eine Umsetzung in Produkte. Als
das Projekt im Jahr 2000 sehr erfolgreich abgeschlossen war, konnten wir
20 kommerzielle Spin-Off-Produkte aufweisen und es sind schon acht neue
Firmen aus dem Projekt entstanden.
Frage:
In den Unterlagen steht nun, es war ein "geplantes Projekt": Start
1993, Zielsetzung 2000. Das widerspricht doch der Definition der
Innovation. Ihre Entwicklungen waren exakt geplant, weil Sie dafür
Gelder generieren mussten?
Prof. Wolfgang Wahlster:
Es war ein ganz großes Forschungsrisiko in diesem Projekt. Obwohl wir
einen Netzplan für alle Forschungsfragen hatten, standen wir vor einem
riesigem Berg ungelöster Probleme mit extremer Komplexität. Ich gestehe,
ich hatte auch einige schlaflose Nächte; es war ein Riesenunterfangen
und man steht bei einem solchen Projekt auch unter einem erheblichen
Erfolgsdruck; insbesondere weil eine ganze Menge Geld – über 100
Millionen Mark – in unsere Arbeiten investiert wurden.
Selbst Kollegen im Ausland haben gebangt, ob das gut geht. Wir
hatten aber zündende Ideen zur richtigen Zeit und immer ein tolles Team,
das sich auch nach kleineren Rückschlägen schnell wieder auf die
ambitionierten Projektziele konzentrierte und neue Lösungen fand.
Mein erster Chef scherzte häufig: Vormittags sollte man sich die
Durchbrüche überlegen und nachmittags dann Epoche machen. So ist es
leider in der Praxis der Forschung überhaupt nicht. Es ist extrem viel
Detailarbeit, viel Fleiß und Hartnäckigkeit erforderlich. Gerade in der
Sprachtechnologie gibt es nicht einige wenige einfache Grundprinzipien,
sondern es müssen viele sprachliche Wissensquellen im Detail
berücksichtigt werden. Ich habe in der Forschung so manche Nacht und
viele Wochenenden durchgearbeitet und trotzdem machte es immer viel
Spaß. Ich beklage das große Arbeitspensum nicht, weil ich glaube, dass
die wissenschaftliche Arbeit ausüben zu dürfen, ein Privileg ist. Man
hat das Hobby zum Beruf gemacht und wird dafür auch noch bezahlt.
Frage:
Ihr Projekt wird als "interdisziplinäre Großleistung" bezeichnet. Wir
zählen 23 Forschungsgruppen mit 100 Wissenschaftlern, vier Unternehmen,
15 Hochschulen, eine Forschungseinrichtung usw. Das ist ungewöhnlich.
Können Sie noch einmal erläutern, wie das zustande kam und was der
direkte Effekt daraus war?
Prof. Wolfgang Wahlster:
Es ist aus zweierlei Hinsicht wichtig, mit den Industrielabors
zusammenzuarbeiten: Einerseits kommen von dort immer wieder exzellente
praktische Anregungen. Die sagen allerdings auch einmal: Das könnt ihr
gleich vergessen, das kann nie ein Produkt werden. Diese Rückkopplung
ist ganz wichtig. Ich habe es zum Prinzip gemacht, dass die meisten
unserer Mitarbeiter nach einer gewissen Zeit an unserem Zentrum in die
Industrie gehen bzw. lade ich auch immer wieder Leute aus der Industrie
ein, um bei uns am DFKI mitzuarbeiten. Die werden dann von ihren
Stammunternehmen zum DFKI abgestellt, sind ein paar Jahre hier, und
empfinden das auch als besonderen Anreiz, weil sie wieder an die
vorderste Front der aktuellen Forschung herangeführt werden. Dann gehen
sie zurück und verbreiten ihr Wissen in der Firma. Ohne den Menschen
läuft der Technologietransfer halt nicht.
Andererseits ist die Sprachtechnologie ein enorm
personalaufwendiges Unterfangen. Wir müssen uns ja nicht nur ständig
neue Algorithmen ausdenken und die Programmierarbeit leisten, sondern
wir brauchen ungeheuer viel Datenmaterial und das muss von
Sprachwissenschaftlern aufbereitet werden. Wir mussten von Flensburg bis
Oberbayern Sprachmaterial sammeln, auch solches, das Dialektbehaftet
ist, von alten Leuten, von jungen Leuten. Die TU München hat als
Verbmobil-Partner über 50 CDs produziert nur mit annotierten
Sprachdaten. Ohne Unterstützung aus der Industrie wäre ein solche
umfangreiche Sprachdatensammlung einfach nicht realisierbar.
Wir wollen die Benutzerschnittstelle vereinfachen, denn wir wollen –
als gemeinsames Ziel mit der IT-Industrie – noch mehr Menschen an den
Computer heranführen. Im Moment verzeichnet man eine Stagnation des
Verkaufs im PC-Bereich. Wenn man über 40% der Bevölkerung erreichen
will, muss man radikal die Benutzerschnittstelle vereinfachen. Wir
wollen die Computernutzung so populär machen wie den Fernseher und das
kann man nur, indem man andere Lösungen als die umständliche Bedienung
per Tastatur oder Maus findet. Außerdem ist es ein Menschheitstraum, mit
den Dingen zu sprechen.
Wir arbeiten interdisziplinär und ich bin ein bisschen stolz
darauf, dass ich auch zum Professor unserer philosophischen Fakultät
ernannt wurde. Ich bin derzeit der einzige Naturwissenschaftler, der
auch in der philosophischen Fakultät kooptiert wurde. Technik braucht
auch ganz stark die Kognitionswissenschaften.
Und wenn Sie nach dem Effekt fragen, hat die gezielte Ausbildung
vieler Sprachtechnologie-Spezialisten in unserem Projekt auch zu neuen
Industrie-Ansiedlungen ausländischer Unternehmen in Deutschland geführt.
Beispielsweise hat sich die Firma Sony aus Japan entschieden, in ihrem
europäischen Zentrum in Stuttgart eine Abteilung für Sprachtechnologie
zu eröffnen. Die führenden Wissenschaftler dort haben vorher in unserem
Verbmobil-Projekt gearbeitet. Auch die Firma Ericsson aus Schweden hat
sich für Erlangen entschieden als Standort für ihre gesamten weltweiten
Forschungs- und Entwicklungsaktivitäten in der Sprachtechnologie. Damit
wird letztlich die Wissenschaft auch zu einem wichtigen Teil der
Standortpolitik. Wenn man die Wissenschaftler und Ingenieure hier hat,
die international gesucht werden, siedeln sich auch neue Firmen aus dem
Ausland hier an.
Ich habe mir auch einmal die Frage gestellt, wie kam ich persönlich
eigentlich zu diesem Forschungsschwerpunkt? Ich war zunächst auf einem
humanistischen Gymnasium, war immer recht gut in Latein und insbesondere
die Grammatik hat mich sehr fasziniert. Ich habe mein erstes Geld mit
Nachhilfe in Mathematik und Latein als Gymnasiast verdient. Ich hatte
immer ein Faible für Mathematik, Latein und Grammatiken. Für mich war in
der Schule schon klar, dass ich mathematische Linguistik studieren
will. Dann war ich der erste Student in Hamburg, der die Kombination
Informatik und Linguistik studierte. Ich konnte meinen eigenen
Studienplan entwerfen, weil es eine neue Kombination war. Das machte
sehr viel Spaß. Heute ist dies zwar auch kein Massenstudiengang, aber er
ist etabliert. Wir bieten etwa hier in Saarbrücken, in Stuttgart, in
Tübingen und in Hamburg gute Möglichkeiten Computerlinguistik und
Informatik zu kombinieren.
Woher kam das erste Interesse? Mein Vater hat sich sehr für Sprache
interessiert, war Schriftsteller und hat Lyrik veröffentlicht, er war
aber auch Bankdirektor und später Wirtschaftsprüfer. Ein zweiter
Auslöser war vielleicht der Dialektschock. Ich bin nämlich im Saarland
aufgewachsen, wo man einen markanten Dialekt spricht, besonders in der
Familie. Dann sind wir nach Norddeutschland gezogen, gerade dorthin, wo
man zum Teil sogar Plattdeutsch spricht. Und das war für mich, obwohl
ich einigermaßen Hochdeutsch sprechen konnte, ein Anlass, mich als
Jugendlicher intensiv mit Sprachstrukturen zu beschäftigen, denn mein
Saarländisch verstand niemand und ich hatte zunächst große Probleme mit
vielen norddeutschen Formulierungen.
Ich hatte in meinem Beruf später das Glück, dass ich nie das
Forschungsgebiet wechseln musste. Manche Kollegen fragen mich schon mal,
ob mir das nicht langsam langweilig wird. Aber ich glaube nicht, dass
man in der Wissenschaft viel bewirken kann, wenn man nicht seinem
Spezialgebiet treu bleibt. Es gibt ja auch noch jede Menge spannende
Themen und offene Probleme in meinem Forschungsgebiet.
Frage:
In welchem Stadium der Entwicklung sind Sie jetzt, wie geht es weiter? Was ist für Sie der nächste Entwicklungsschritt?
Prof. Wolfgang Wahlster:
Der nächste Schritt ist das SmartKom-Projekt, an dem wir derzeit schon
arbeiten. Hier geht es um multimodale Kommunikation, also die
gleichzeitige Verwendung von Sprache, Gestik und sogar Mimik zur
Kommunikation zwischen Mensch und Computer. Das ist das Nachfolgeprojekt
zu Verbmobil, an dem sich wieder zahlreiche Industrieunternehmen
finanziell beteiligen.
Wenn man die nächste Generation von Mobilfunkgeräten auf UMTS-Basis
mit ihren großen Übertragungsbandbreiten als Mehrwert verkaufen will,
muss man ganz neue Anwendungen und Bedienkonzepte erfinden. Die
multimodale Kommunikation ist dabei eine Schlüsseltechnologie.
Ich habe schon vor 15 Jahren angefangen, Sprache und Gestik
zusammenzuschalten. Das Projekt XTRA war damals noch reine
Grundlagenforschung und die lief sehr holprig. Wir wollen heute
multimodale Systeme entwickeln, in denen der menschliche Benutzer neben
der Sprache durch Gestik und Mimik weitere Information übermittelt.
Viele meinen, dass das noch schwieriger wird. Das stimmt nicht. Es kann
sogar einfacher werden. Man kann leicht zeigen, dass wenn man Sprache
und Gestik zusammenschaltet, sich viele Mehrdeutigkeiten auflösen. Wir
wollen dahin kommen, dass wir ein tragbares Gerät haben, mit einer
kleinen Digitalkamera, einem Computer, mobiler Internetanbindung und
einem grafischen Bildschirm. Sie können darauf zeigen und ihre
Information sprechen. Das System zeigt mir beispielsweise den Stadtplan
und wo ich gerade bin. Ich sage dann „Ich möchte jetzt dort hin“, weil
ich dort das Heidelberger Schloss sehe. Dann zeige ich auf die digitale
Karte und brauche es nicht lange zu beschreiben. Das heißt: Sprache und
Gestik beschleunigen die Kommunikation. Wenn man Spracheingabe und
Gestik verbindet, kann man bis zu fünfmal schneller mit dem Computer
interagieren als mit der Tastatur und Menüs am PC. Multimodal arbeitet
man also schneller, aber auch intuitiver. Wir wollen auch nicht länger
nur mit der Maus oder mit einem Stift zeigen, sondern wirklich natürlich
nur mit Hand- und Fingerbewegungen. Die an das System angeschlossene
digitale Kamera beobachtet dann die Bewegungen der Finger und unsere
Gestikanalysesoftware stellt fest, was damit gemeint war.
Frage:
Ihr Projekt ist ja ein Verbundprojekt zwischen Wissenschaft und
Wirtschaft, um es vereinfacht zu skizzieren. Können Sie uns erklären,
wie das im DFKI funktioniert? Sie haben ja hier besondere Bedingungen.
Prof. Wolfgang Wahlster:
Das ist auch forschungspolitisch sehr interessant. Das DFKI ist eine
gemeinnützige GmbH und funktioniert nach dem Prinzip der Public Private
Partnership. Unsere Gesellschafter kommen aus dem Bereich der Wirtschaft
und der Universitäten. Da durch zunehmend kürzere Innovationszyklen in
der Informationstechnik Vorlaufforschung, anwendungsnahe Entwicklung und
die Umsetzung in Produkte immer enger zusammenwachsen, wird in
DFKI-Projekten das gesamte Spektrum von der anwendungsorientierten
Grundlagenforschung bis zur markt- und kundenorientierten Entwicklung
von Produktfunktionen abgedeckt. Zurzeit beschäftigt die DFKI GmbH etwa
170 Angestellte, davon 145 wissenschaftliche Mitarbeiter. Hinzukommen
noch rund 140 studentische Hilfskräfte als Teilzeitkräfte. Im Jahr 2000
wurde ein Volumen von rund 30 Mio. DM im Rahmen praxisorientierter
Auftragsforschung erzielt. Wir haben keine Grundfinanzierung durch den
Staat, sondern basieren alleine auf Projektfinanzierung. Alle Projekte
werden international begutachtet, so dass wir uns stets der Qualitäts-
und Erfolgskontrolle unterziehen müssen. Das führt meiner Ansicht nach
zu höherer Produktivität als ständig am Tropf der staatlichen Förderung
zu hängen. Wir arbeiten auch nach dem Prinzip des Lean Management und
haben viele Standardaufgaben wie die Lohn- und Gehaltsabrechnung unserer
Mitarbeiter an andere Unternehmen vergeben.
Alle Arbeiten sind in der Form zeitlich befristeter und klar fokussierter Projekte organisiert, die u.a. zu lizenzierten Lösungen, Prototypen oder Produktfunktionen führen. Es war für mich ein tolles Erlebnis, als der Staatssekretär im BMBF, Dr. Uwe Thomas, mir sagte, dass er das DFKI-Modell für zukunftsweisend halte, und dass es mehr solcher Forschungszentren geben sollte. Wir haben inzwischen 14 Fimengründungen aus dem von mir geleiteten Forschungszentrum mit mehr als 530 neuen Hightech-Arbeitsplätzen geschaffen – und dies in der strukturschwachen Region des Saarlandes und der West-Pfalz.
Frage:
Das Verbmobil wird jetzt vermarktet, über ein Spin-Off und/oder mit Kooperationspartnern?
Prof. Wolfgang Wahlster:
Aus dem Verbmobil-Projekt sind insgesamt acht Spin-Off-Firmen
entstanden, und die vermarkten wichtige Komponenten des Systems.
Außerdem basieren 20 kommerzielle Produkte auf den in Verbmobil
entwickelten Technologien. Dazu gehören vier Sprachdialogsysteme, drei
Übersetzungssysteme und drei Textklassifikationssysteme. Die beteiligten
Firmen an Verbmobil sind sehr zufrieden, weil sie die entwickelten
Verfahren in ihre Produkte einbauen konnten.
Frage:
Sie haben ja nun einen sehr starken wirtschaftlichen Aspekt in ihrer
Arbeit, haben Sie trotzdem die Möglichkeit der wissenschaftlichen
Weiterentwicklung? Es gibt bei Ihnen nicht den Ausschlag in die eine
oder andere Richtung?
Prof. Wolfgang Wahlster:
Das ist an der Sprachverarbeitung das Faszinierende, dass man sowohl
eine kognitionswissenschaftliche als auch eine
ingenieurswissenschaftliche Zielsetzung hat. Man betreibt also
erkenntnisorientierte Grundlagenforschung und wirtschaftsnahe
Anwendungsforschung parallel. Wir möchten verstehen, wie der Mensch die
Sprache lernt, versteht und erzeugt. Computermodelle bieten die
präziseste Möglichkeit, das menschliche Sprachverstehen wissenschaftlich
zu beschreiben.
Die ingenieurswissenschaftliche Zielsetzung, sprachtechnologische
Anwendungen zu entwickeln, bringt einerseits die notwendige
Finanzierung, andererseits gibt es auch vielen Mitarbeitern den
motivierenden Kick. Mir macht es ja auch viel mehr Spaß, wenn ich nicht
nur sagen kann, ich habe wieder fünf Papiere veröffentlicht und zehn
Vorträge gehalten, sondern die Ergebnisse werden auch praktisch
angewandt und die Wirtschaft kann damit auch Geld verdienen.
Frage:
Kommen wir nochmals zu dem Begriff der Innovation, der viel und
abgenutzt ist. Wie definieren Sie Innovation, allgemein und in
Zusammenhang mit Ihrem Projekt?
Prof. Wolfgang Wahlster:
Innovation bedeutet für mich ein Übergang von einer Technikgeneration
zu einer anderen: also wirklich ein Bruch, eine Idee, die auch praktisch
umgesetzt werden kann und zu einer ganz neuen Qualität führt. Das ist
in unserem Projekt gelungen, insofern als wir vorher Systeme hatten, mit
denen man nur Monologe in den Computer einsprechen konnte. Jetzt haben
wir den Computer als einfachen Dialogassistenten. Die Innovation besteht
in dem Übergang von der reinen Spracherkennung als Umsetzung von
Schallwellen in Schriftsprache – ohne Sinn und Verstand hätte ich
beinahe gesagt – zu einer wirklichen inhaltlichen Kommunikation im
Dialog. Das ist die entscheidende Innovation.
Frage:
Eine Zielsetzung des Preises des Bundespräsidenten ist auch, der
Öffentlichkeit die Leistung der Wissenschaft zu vermitteln und den
Dialog herzustellen. Was tun Sie denn für diesen Dialog mit der
Öffentlichkeit?
Prof. Wolfgang Wahlster:
Wir haben sehr früh angefangen, Pressekonferenzen zu unseren Projekten
zu organisieren und haben dazu nicht nur die Fachpresse eingeladen.
Zusammen mit den Presseabteilungen unserer Industriepartner haben wir
später eine jährliche Pressekonferenz veranstaltet, die sehr gut
aufgenommen wurde.
Ich meine, dass der Wissenschaftler eine Bringschuld gegenüber der
Öffentlichkeit hat, und in möglichst allgemeinverständlicher Weise über
seine Vorhaben und Ergebnisse unterrichten sollte. Ein Großteil unserer
Forschungsgelder sind ja Steuergelder, so dass jeder Bürger einen
Anspruch auf Information über die Projekte hat.
Außerdem sollte man früh mit der Aufklärung über neue Technologien beginnen, um kritisches Feedback von den späteren Nutzern zu bekommen. Dann entsteht mehr Vertrauen in die neuen Technologien und das ist ganz essenziell für die spätere Akzeptanz und damit letztlich auch für den wirtschaftlichen Erfolg einer Technologie. Ich halte Öffentlichkeitsarbeit in der Wissenschaft für sehr wichtig. Ich nehme daher auch gelegentlich Vortragseinladungen von politischen Verbänden, Wirtschaftsverbänden, Firmen oder Vereinen an, um allgemeinverständlich über Künstliche Intelligenz und Sprachtechnologien sowie ihre Chancen und Risiken zu sprechen.
Frage:
Sie haben schon viele Preise und Ehrungen bekommen. Wie wirken sich
solche Ehrungen auf Ihre Arbeit aus? Ist das nur was Nettes, was man als
"Streicheleinheit" empfindet oder hat das einen konkreten Nutzen?
Prof. Wolfgang Wahlster:
Doch, es hat sicherlich einen konkreten Nutzen. Hier ist auch wieder
die Öffentlichkeitsarbeit wichtig: Gerade in einem
Auftragsforschungsinstitut ohne staatliche Grundfinanzierung wie dem
DFKI gehört ein Marketing der Kompetenzen zum Alltag. Wir haben schon
viele Kontakte und Aufträge letztlich dadurch bekommen, dass wir mit
einem Preis für eine wissenschaftliche Leistung ausgezeichnet worden
waren. Dann gibt es Zeitungsartikel über den Preis, und daraufhin ruft
ein Unternehmer an und fragt: Kann das DFKI mit dieser neuen Methode bei
einem konkreten Problem in meiner Firma helfen? So kommen neue Kontakte
und neue Aufträge häufig zustande. Eine gute Pressearbeit nach einem
Preis ist oft viel mehr Wert für die Projektakquisition als ein
Riesenstand auf der CeBIT oder Hannover Messe.
Durch das Renommee eines Preisträgers hat man auch die Möglichkeit,
als Berater eingeladen zu werden, um besonders in internationalen
forschungspolitischen Gremien die Forschungstrends und Fördermaßnahmen
mit zu prägen. Ich bin heute nicht nur Berater für deutsche Ministerien,
sondern auch für internationale Forschungsprogramme und -institute in
Japan, USA, Frankreich, Niederlande und Italien. Das hätte ich ohne die
Anerkennung durch die verschiedenen Preise und Auszeichnungen sicherlich
nicht erreichen können.
Frage:
Gibt es ein Motto, eine formulierbare Motivation für das, was Sie tun?
Prof. Wolfgang Wahlster:
Ja, einfach gesagt ist mein Motto: Den Computer näher an den Menschen
heran zu bringen und nicht umgekehrt den Menschen an den Computer
anzupassen. Man sollte den Computer so intuitiv bedienen können, dass
man keine Zeit damit verschwenden muss, spezielle Bedientechniken zu
erlernen und umfangreiche Benutzerhandbücher zu studieren.
Frage:
Zum Klima von Forschung und Innovation – wie schätzen Sie das in
Deutschland ein und wie stehen wir momentan, auch bezogen auf Ihr
Sachgebiet, im internationalen Vergleich da?
Prof. Wolfgang Wahlster:
In Deutschland funktioniert das eigentlich recht gut. Es wird von
einigen Kollegen oft zu viel gejammert und auf angeblich bessere
Bedingungen in Japan und den USA verwiesen. Da ich oft in Japan und den
USA bin – und dort sitzen die Hauptkonkurrenten auf meinem Gebiet – weiß
ich, dass dort auch nur mit Wasser gekocht wird und viele Defizite zu
verzeichnen sind.
Die Amerikaner verstehen es zwar oft besser, ihre Forschung zu
vermarkten und auch oft schneller umzusetzen. Aber was wir hier in
Deutschland auf meinem Gebiet zustande bringen, diese enge Kooperation
zwischen Industrie und Hochschulen in konkreten Projekten, klappt in den
USA kaum. Die Amerikaner wundern sich immer, wie das bei uns
funktioniert. So etwas wie unser Verbmobil-Projekt wäre derzeit in den
USA nicht möglich.
In Japan gibt es sehr starre Denk- und Ausbildungsstrukturen, die
ein wirklich interdisziplinäres Arbeiten oft vermeidet. Das ist hier in
Deutschland erheblich einfacher. Wir haben es in der Sprachtechnologie
im internationalen Vergleich geschafft, dass wir nicht nur mithalten
können, sondern auf diesem Gebiet spielen wir inzwischen in der ersten
Liga. Noch vor zehn Jahren fuhren wir mehrfach im Jahr in die USA oder
in Japan, um neueste Entwicklungen kennen zu lernen. Heute ist es
oftmals umgekehrt: Japanische und amerikanische Wissenschaftler reisen
auf eigene Kosten nach Saarbrücken, um sich über neueste
Forschungsresultate intensiv zu informieren.
Man muss aber sagen, dass wir eine Spitzenstellung in Deutschland
nur auf ganz spezifischen Gebieten erreichen können. Deshalb finde ich
es in der forschungspolitischen Diskussion gut, dass wir uns profilieren
wollen und nur spezielle Gebiete abdecken und nicht die ganze Breite.
Es gibt einfach Gebiete, da können wir mit den Japanern und Amerikanern
nicht mithalten und sollten es dann auch lassen, aber andere Dinge, da
halten wir nicht nur mit, sondern spielen die erste Geige.
In der Sprachtechnologie kommt noch das nationale Interesse hinzu,
dass es fatal wäre, wenn man sich für die deutsche Sprache die
Softwareprodukte aus Japan oder USA anliefern lassen muss. Wir Deutschen
wurden ja immer belächelt mit unseren vielen langen Wörtern: der
bekannten "Donaudampfschiffahrtsversicherungsgesellschaft". Aber lange
Wörter sind durch heutige Spracherkenner leichter eindeutig zu
analysieren. Wir haben einen Vorteil in der Sprachtechnologie durch die
Struktur unserer Sprache. Die Amerikaner müssen sich ärgern, denn sie
haben in diesem Punkt durch ihre Sprache einen Nachteil. Englisch macht
unserer heutigen Sprachtechnologie bei der Spracherkennung mehr Probleme
als das Deutsche.
Frage:
Haben Sie Wünsche und Forderungen an die Öffentlichkeit, an die Politik
und die Gesellschaft, um Projekte wie Ihres durchzusetzen?
Prof. Wolfgang Wahlster:
Mein größter Wunsch wäre, dass man innovative Strukturen wie unsere
Public Private Partnership im DFKI in das normale
Forschungsförderungskonzept und das sogenannte Förderhandbuch des BMBF
aufnimmt. Viele Politiker begrüßen zwar sehr die Organisation der
Forschung in gemeinnützigen GmbHs mit einer Beteiligung der Wirtschaft
und des Staates. Im verwaltungstechnischen Detail, bei Abrechnungs- und
Prüfungsfragen gibt es aber leider immer noch zahlreiche Probleme mit
Behörden, weil ein solches Institut nicht in die Schubladen der
Großforschungseinrichtungen, der Universitäten oder der Industrielabors
eingeordnet werden kann. Insbesondere die Behörden in Brüssel zur
europäischen Forschungsförderung haben uns in den letzten Jahren massiv
behindert, weil sie unser Modell bis heute nicht verstehen und unsere
Abrechnungsmodalitäten nicht anerkennen wollen. Hier wünsche ich mir ein
klares Wort der deutschen Politik an die Adresse in Brüssel, denn
schließlich stammt ja ein großer Teil des Brüsseler Etats aus deutschen
Steuerquellen. Eine Aufnahme des DFKI-Modells in das Förderhandbuch des
BMBF ist auch einer meiner großen Wünsche.
Public Private Partnership in der Forschung ist das Gebot der
Stunde. Ich würde mir wünschen, dass man in Deutschland mehr solche
Spezial-Institute einrichtet nach dem Motto: klein aber fein. Wir
stellen uns auch in regelmäßigen Abständen einer Evaluation. Wenn unser
Fachgebiet einmal nicht mehr relevant ist, kann man das DFKI rasch
einstellen, da 70% der Stellen befristet sind. Ich halte auch nichts von
gigantischen Forschungsinstituten mit Tausenden von Forschern, die
meist schnell ineffizient werden. Es ist nach meiner Erfahrung besser,
man hat eine kleine fokussierte Mannschaft: Klasse statt Masse. Wichtig
ist auch, dass man durch eine gewisse Fluktuation im Mitarbeiterbereich
stets eine junge Mannschaft von Forschern hat. Der Altersdurchschnitt am
DFKI liegt seit mehreren Jahren bei 34 Jahren. Das DFKI gilt als eine
Art Durchlauferhitzer in einer akademischen oder industriellen Karriere.
Frage:
Sie waren ja mit 29 Jahren Professor, sind mehrfacher Ehrendoktor. Sie
darf man also so etwas schon fragen. Wenn Sie die Wahl hätten, würden
Sie Ihren Berufsweg wieder so gehen wollen?
Prof. Wolfgang Wahlster:
Auf jeden Fall. Ich glaube allerdings nicht, dass sich das heute auf
dem gleichen Gebiet reproduzieren lässt. Ich hatte das Glück, zur
richtigen Zeit in dieses neue Wissenschaftsgebiet eingestiegen zu sein.
Wenn ich in Physik oder Mathematik promoviert hätte, dann hätte ich im
Alter von 29 Jahren sicher nicht schon einen Ruf auf eine Professur
erhalten. In der Informatik als junger Disziplin konnte man schneller
Erfolge erzielen. Wenn ich in Physik heute etwas Neues machen will, muss
ich erst einmal Hunderte von klassischen Veröffentlichungen
durcharbeiten.
Frage:
Ihr berufliches Leben hat eine Bandbreite. Gab es etwas, das Ihnen gefehlt hat?
Prof. Wolfgang Wahlster:
Ich plädiere sehr dafür, dass wir uns in der Forschung, an den
Universitäten und Instituten fokussieren – Profil bilden – um im
internationalen Wettbewerb bestehen zu können. Diese notwendige
Spezialisierung kann ich aber nicht für das Studium empfehlen. Ein
vernünftiges Studium sollte immer noch sehr breit angelegt sein.
Ich habe im Studium neben Informatik und Linguistik auch Vorlesungen im Bereich Psychologie, Philosophie, Altamerikanistik, Physik und Mathematik gehört. Wenn die Studenten nur noch hinter Scheinen und Punkten in ihrem Studiengang her rennen und im Turbostudium nur noch die einfachsten Kurse belegen, dann ist das eine Fehlentwicklung. Man sollte seine Zeit an der Universität auch nutzen, um über den engeren Fachkontext hinauszublicken und einmal in benachbarte Fachgebiete zumindest hineinzuhören. Ich hatte durch die Förderung der Studienstiftung des deutschen Volkes die tolle Gelegenheit, während des Studiums auf Sommerakademien andere Denkweisen und Wissenschaftsgebiete kennenzulernen und habe dort den enormen Mehrwert interdisziplinären Arbeitens früh kennengelernt.
Frage:
Womit entspannen Sie sich oder was gibt es außerhalb Ihres Projektes und Ihrer Tätigkeit?
Prof. Wolfgang Wahlster:
Ich habe lange Hockey als Leistungssport betrieben. Jetzt spiele ich
mit meiner Frau Tennis sowie Golf und fahre mit Begeisterung Ski. Bei
oftmals 100 Arbeitsstunden pro Woche komme ich aber leider oft viel zu
wenig zum Sport. Ich tanze gerne und interessiere mich für moderne
Kunst. Aber ein Hobby im traditionellen Sinne verfolge ich nicht, da ich
ja mein "Hobby" zum Beruf gemacht habe.
Frage:
Letzte Frage, was wünschen Sie sich für die Zukunft?
Prof. Wolfgang Wahlster:
Die Energie und notwendige Gesundheit, noch lange Jahre das weiter
zu machen, was ich bis jetzt gemacht habe – Forschung in der Künstlichen
Intelligenz, noch viele erfolgreiche Projekte durchzuführen und ein
paar wichtige Forschritte in meinem Forschungsgebiet zu erzielen. Wenn
man in unserer Fakultät 60 wird, werten die Kollegen aus, wie viele
Schüler man produziert hat, die selbst Professoren der Informatik
geworden sind. Am DFKI haben wir neben etlichen Jungunternehmern und
Führungskräften für die Industrie in den letzten zehn Jahren 34 neue
ProfessorInnen "gezeugt" und ich wünsche mir, dass sich diese sehr
erfreuliche Entwicklung so fortsetzen lässt. Schließlich hoffe ich sehr,
dass wir unsere Forschungsergebnisse auch weiterhin rasch zusammen mit
der Wirtschaft umsetzen können und dass sich damit auch in der
Wirtschaft gut Geld verdienen lässt.
