Seminar SS 2006
Intelligent Virtual Characters

> Inhalte       > Organisatorisches       > Themen       > Termine/Vorträge       > Anmeldung       > Kontakt


 

Seminar im Bereich Künstliche Intelligenz am Fachbereich "Intelligente Benutzerschnittstellen" des Deutschen Forschungszentrums für Künstliche Intelligenz (DFKI).




Inhalte

Intelligente, körperhafte (embodied) Agenten als Schnittstelle zum Benutzer sind bereits ein etabliertes Forschungsthema. Im Mainstream finden solche Agenten immer häufiger Verwendung, ob als non-player character im Computerspiel, als digitaler Spielkamerad Tamagochi, als sprechende Büroklammer in Word, als Chatterbot à la ELIZA oder als virtueller Nachrichtensprecher. Solchen künstlichen Wesen Leben einzuhauchen, insbesondere Körper und Sprache zu "animieren", erfordert eine Vielzahl von Methoden aus Künstlicher Intelligenz, Computerlinguistik und Computergrafik - und einige Erkenntnisse aus der Psychologie.

In dem Seminar werden wir uns zunächst einen Überblick über existierende Systeme verschaffen und dann auf die einzelnen Spezialbereiche fokussieren. Schwerpunkt wird die Steuerung, also die "Intelligenz" der Charaktere, sein. Wir werden visionäre Themen wie künstliche Emotionen genauso behandeln wie etabliertere Forschungsfelder wie Sprachverstehen und -generierung.

Bei erfolgreicher Teilnahme am Seminar besteht Aussicht auf eine studientechnische Vertiefung des Themas in Form von FoPras und Diplomarbeiten, unter Umständen auch in Verbindung mit einem HiWi-Job.

 
 

Organisatorisches

Vortragssprache ist deutsch (Englisch nach Absprache möglich).

Die Folien, die im beim Kick-Off-Meeting gezeigt habe, sind hier: Seminar-Infos.pdf

Zeit und Ort

Zeit: Mittwochs 16 Uhr c.t.

Ort: Seminarraum 016 (Informatikgebäude, E 1 3, gegenüber Hörsaal 001)

Erstes Treffen: MI, 26. April 2006, Raum 016, 16 Uhr

Voraussetzungen

  • Vordiplom oder Bachelor in Informatik oder Computerlinguistik
  • ausreichend Englischkenntnisse, um wissenschaftliche Publikationen zu lesen
  • Vorwissen (Vorlesung/Seminar) in mindestens einem der folgenden Bereiche:
    • Künstliche Intelligenz
    • Character Animation
    • Computerlinguistik

Anforderungen für die Scheinvergabe

  • Regelmäßige Teilnahme
  • 1 mündlicher Vortrag (45 Min.)
  • Jeder Teilnehmer ist auch "Responder" für zwei weitere Themen. Als Responder liest der Teilnehmer die Papers des Vortragenden und stellt dazu Fragen.
  • schriftliche Ausarbeitung (deutsch oder englisch)

 
 

Termine / Vorträge

Die folgenden Themen sind bereits vergeben und werden in der unten stehenden Reihenfolge vorgetragen (die Reihenfolge folgt ungefähr der Verarbeitungsreihenfolge: Input - Verarbeitung - Output). Die genauen Termine werden beim ersten Treffen festgelegt.


DatumVortragende/r Responder Thema/Literatur
26.4.2006 Kick-Off Meeting   Themen:
  • Seminarablauf
  • Voraussetzungen zum Scheinerwerb
  • Tipps und Tricks zum mündlichen Vortragen und zur schriftlichen Ausarbeitung
3. Mai Mehdi Moniri

Vortragsfolien
Report (English)
Nima
Ehsan
Thema: Steve - ein planbasierter pädagogischer virtueller Character (auch: REA und WIP)

Literatur:
W. Lewis Johnson and Jeff W. Rickel (2000) "Animated Pedagogical Agents: Face-to-Face Interaction in Interactive Learning Environments". In: International Journal of Artificial Intelligence in Education 11, pp. 47-78,
http://aied.inf.ed.ac.uk/members00/archive/vol_11/johnson/paper.pdf

Jeff W. Rickel and W. Lewis Johnson and (1999) "Animated Agents for Procedural Training in Virtual Reality: Perception, Cognition, and Motor Control". In: Applied Artificial Intelligence 13, pp. 343-382,
http://www.isi.edu/isd/VET/aaij98.pdf
10. Mai Sebastian Germesin

Vortragsfolien
Report (Deutsch)
Johannes
Nima
Thema: Spracherkennung

Literatur:
Sebastian Germesin (2006) "Spracherkennung mit dynamisch geladenen, spezifischen Akustikmodellen"
SEMINAR: S.1-14
germesin-bachelor.pdf

L. R. Rabiner (1989) "A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition," Proceedings of the IEEE, vol 77, no 2, 257-287.
SEMINAR: S. 257-267
http://www-stat.wharton.upenn.edu/~steele/Courses/956/ResourceDetails/HiddenMarkovModels/HMMTutorial/rabiner89.pdf

Jurafsky, Daniel und James H. Martin (2000) "Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition", Prentice Hall, New Jersey.
SEMINAR: Kapitel 4 "N-Grams" (Kopien)

17. Mai Sandro Castronovo

Vortragsfolien
Report (Deutsch)
Oliver
Johannes
Thema: Computer Vision

Literatur:
Darrell, T., Basu, S., Wren, C., and Pentland, A. (1997) Perceptually-driven Avatars and Interfaces: active methods for direct control. Technical report, MIT Media Lab Perceptual Computation Section. TR 416.
http://alumni.media.mit.edu/~sbasu/papers/TR-416.pdf

R. Tan and J. Davis (2004) "Differential Video Coding of Face and Gesture Events in Presentation Videos" Computer Vision and Image Understanding, Vol. 96, No. 2 pp. 200-215.
http://www.cse.ohio-state.edu/~jwdavis/Publications/cviu04.pdf

Zusatzinfos:
22. Mai
MONTAG!!!
16 Uhr c.t.
Raum LEIBNIZ (DFKI)
Haichao Guan

Vortragsfolien
Report (Deutsch)
Christine
Sinan
Thema: Multimodale Fusion

Literatur:
Bolt, R.A. (1980) "put-that-there": Voice and gesture at the graphics interface. In: SIGGRAPH '80: Proceedings of the 7th annual conference on Computer graphics and interactive techniques, ACM Press, pp.262-270
http://www.media.mit.edu/speech/papers/1980/bolt_SIGGRAPH80_put-that-there.pdf

Johnston, M. and S. Bangalore. (2000) Finite-state Multimodal Parsing and Understanding. In Proceedings of COLING-2000.
http://www.me.cmu.edu/faculty1/stahovich/sketchsymposium2002/colingmmfst.pdf

J. Chai, S. Pan, and M. Zhou, MIND: A Context-based Multimodal Interpretation Framework in Conversational Systems, Natural, Intelligent and Effective Interaction in Multimodal Dialogue Systems, Eds. O. Bernsen , L. Dybkjaer and J. van Kuppevelt, Kluwer Academic Publishers, 2005.
http://www.cse.msu.edu/~jchai/Papers/MIND.pdf

Zusatzmaterial:

Johnston, M. and S. Bangalore. 2005. "Finite-state Multimodal Integration and Understanding". Journal of Natural Language Engineering 11.2, pp. 159-187, Cambridge University Press.
http://public.research.att.com/~johnston/papers/johnstonbangalore2005jnle.pdf

Homepage Michael Johnston

Homepage Joyce Y. Chai
Termin verschoben wg. Krankheit auf 6. Juni Ehsan Gholamsaghaee

Vortragsfolien
Report (Deutsch)
Sinan
Haichao
Thema: SOAR - eine kognitive Architektur zur planbasierten Character-Steuerung

Software:
SOAR 8.6.1 kann man hier runterladen:
http://sitemaker.umich.edu/soar/soar_software_downloads
(enthalten sind das SOAR Manual und das komplette Tutorial)

Literatur:
John Rieman (1995) "An Introduction to SOAR Programming"
http://csis.pace.edu/robotlab/software/intro-soar.pdf

John E. Laird (2005) "The Soar 8 Tutorial", Part 1 (die aktuellste Version ist im Softwarepaket enthalten, s.o.)

John E. Laird (2000) "It Knows What You're Going to Do: Adding Anticipation to a Quakebot" In: AAAI 2000 Spring Symposium Series: Artificial Intelligence and Interactive Entertainment, AAAI Technical Report SS-00-02.
http://ai.eecs.umich.edu/people/laird/papers/Agents01.pdf
7. Juni Nima Zeini

Vortragsfolien
Report (Deutsch)
Martin
Mehdi
Thema: Sprachverarbeitung und Verhaltenssteuerung im Facade-System

Das Facade-Spiel kann man hier kostenlos runterladen:
http://www.interactivestory.net/

Literatur:
Mateas, M. and Stern, A. (2003) Facade: An Experiment in Building a Fully-Realized Interactive Drama 2003. In: Game Developer's Conference: Game Design Track, San Jose, California.
http://www.lcc.gatech.edu/~mateas/publications/MateasSternGDC03.pdf

Mateas, M. and Stern, A. (2004) Natural Language Processing In Facade: Surface-text Processing 2004. In: Technologies for Interactive Digital Storytelling and Entertainment (TIDSE), Darmstadt, Germany.
http://www.lcc.gatech.edu/~mateas/publications/MateasSternTIDSE04.pdf

Michael Mateas and Andrew Stern (2002) Architecture, Authorial Idioms and Early Observations of the Interactive Drama Façade. Carnegie Mellon University Computer Science Technical Report.
http://reports-archive.adm.cs.cmu.edu/anon/2002/CMU-CS-02-198.pdf

Zusatzmaterial:
Michael Mateas and Andrew Stern (2004) A Behavior Language: Joint Action and Behavioral Idioms. In: Life-like Characters. Tools, Affective Functions and Applications, eds. H. Prendinger and M. Ishizuka, Springer, 2004.
Download: [pdf]
14. Juni Quan Nguyen

Vortragsfolien
Report (Deutsch)
Ehsan
Haichao
Thema: KI und Games

Literatur:
Alexander Nareyek (2004) Artificial Intelligence in Computer Games - State of the Art and Future Directions. ACM Queue 1(10), 58-65.
http://www.ai-center.com/publications/nareyek-acmqueue04.pdf

Aus dem Buch
S. Rabin (ed.) (2002) AI Game Programming Wisdom, Charles River Media.
Die folgenden Abschnitte (alles Kopien):
  • Section 2.5: Designing a GUI Tool to Aid in the Development of Finite-State Machines
  • Section 11.2: Varieties of Learning
  • Section 11.5: Using N-Gram Statistical Models to Predict Player Behavior
21. Juni Christine Walter

Vortragsfolien
Report (English)
Sebastian
Quan
Thema: Künstliche Emotionen

Literatur:
Guerrero, L., Andersen, P.A., and Trost, M.R. (1998) Communication and Emotion: Basic Concepts and Approches. In: P. Andersen and L. Guerrero (eds.) "Handbook of Communication and Emotion: Research, Theory, Application, and Contexts", San Diego, London: Adademic Press, pp. 49-96.
(Kopien)

Picard, R.W. (1997) "Affective Computing", Chapter 3: Applications of Affective Computing, London: MIT Press, pp. 85-111.
(Kopien)

Ortony, A., Clore, G.L., Collins, A. (1988) "The Cognitive Structure of Emotions", Chapter 2: The Structure of the Theory, Cambridge: Cambridge University Press, pp. 15-33.
(Kopien)
28. Juni Martin Kaiser

Vortragsfolien (HTML)

Vortragsfolien (ZIP)

Report (Deutsch)
Sebastian
Mehdi
Thema: Tangible Interfaces und virtuelle Charaktere

Literatur:
Ishii, Ullmer (1997) "Tangible Bits: Towards Seamless Interfaces between People, Bits and Atoms"
http://tangible.media.mit.edu/content/papers/pdf/Tangible_Bits_CHI97.pdf

Ullmer, Ishii, Jacob (2005) "Token+Constraint Systems for Tangible Interaction with Digital Information"
http://tangible.media.mit.edu/content/papers/pdf/TokenConstraint_TOCHI05.pdf

Ndiaye et al. (2005) "Ambient Intelligence in Edutainment: Tangible Interaction with Life-Like Exhibit Guides"
http://www.dfki.de/~wahlster/Publications/INTETAIN_05.pdf

RFID-Tags (eigene Recherche)
5. Juli Oliver Gärtner

Vortragsfolien
Report (Deutsch)
Quan
Sandro
Thema: Gestengenerierung (BEAT System, regelbasiert, empirisch)

Literatur:
Cassell, J., Vilhjálmsson, H., Bickmore, T.(2001) "BEAT: the Behavior Expression Animation Toolkit." Proceedings of SIGGRAPH '01, pp. 477-486. August 12-17, Los Angeles, CA.
http://www.media.mit.edu/gnl/pubs//siggraph2001.final.PDF

M. Neff, M. Kipp, I. Abrecht (2006), "Gesture Modeling and Animation by Imitation", Technical Report, MPI Informatik, Saarbrücken. (Kopien)

M. Kipp, M. Neff and I. Albrecht (2006) "An Annotation Scheme for Conversational Gestures : How to economically capture timing and form" In: Proceedings of the Workshop on "Multimodal Corpora" at LREC 2006, to appear.
http://www.dfki.de/~kipp/public_archive/kipp-neff-albrecht-LREC2006WS.doc

Zusatzmaterial:

M. Kipp (2001) "Anvil - A Generic Annotation Tool for Multimodal Dialogue" In: Proceedings of the 7th European Conference on Speech Communication and Technology (Eurospeech), pp. 1367-1370, Aalborg, September 2001.
Download: pdf
12. Juli Johannes Tran

Vortragsfolien
Report (Deutsch)
Oliver
Sandro
Thema: Character Animation

Literatur:
Parent, Rick (2002) Computer Animation - Algorithms and Techniques. Morgan Kaufmann. Section 4.2 "Hierarchical Kinematic Modeling", pp. 175-185.
(Kopien)

Lander, Jeff (1998) Oh My God, I Inverted Kine! (Inverse Kinematics) In: Game Developer, Sep 1998.
http://www.darwin3d.com/gamedev/articles/col0998.pdf

Lander, Jeff (1998) Better 3D (Quaternions). In: Game Developer, March 1998.
http://www.darwin3d.com/gamedev/articles/col0398.pdf

Lander, Jeff (1998) Slashing Through Real-Time Character Animation (Quaternion Interpolation). In: Game Developer, April 1998.
http://www.darwin3d.com/gamedev/articles/col0498.pdf

Lasseter, John (1987) "Principles of Traditional Animation Applied to 3D Computer Animation". In: Proc. of SIGGRAPH 87.
http://portal.acm.org/citation.cfm?id=37401.37407

Weitere Artikel von Jeff Lander:
http://www.darwin3d.com/gamedev.htm
19. Juli Abschlusstreffen  
  • Zusammenfassender Überblick
  • Ergebnisse der Evaluation EVA
  • Feedback der Student/innen
ENTFÄLLT     Thema: Multimodale Generierung / Fission

Literatur:
Elisabeth André (2000) "The Generation of Multimedia Presentations", A Handbook of Natural Language Processing: techniques and applications for the processing of language as text , R. Dale, H. Moisl, and H. Somers, 305-327, Marcel Dekker Inc.
Download: [pdf]

Elisabeth André, Thomas Rist (1995) Generating Coherent Presentations Employing Textual and Visual Material. In: Artificial Intelligence Review 9: 147-165.
Download: [pdf]

Elisabeth André, Thomas Rist (1996) Coping with Temporal Constraints in Multimedia Presentation Planning. In: Proceedings of the Thirteenth National Conference on Artificial Intelligence, pages 142-147.
Download: [pdf]

David Reitter (2004) Hybrid Planning and Realization of Coherent Utterances for Multimodal Natural Language Dialogue Systems. Master's Thesis, University College Dublin.
Für das Seminar: Kapitel 3-5
Download: [pdf]

ENTFÄLLT     Thema: Sprachverstehen (SPIN)

Literatur:
Ralf Engel (2005) "Robust and Efficient Semantic Parsing of Free Word Order Languages in Spoken Dialogue Systems" In: Proceedings of Interspeech 2005, Lisbon, Portugal.
http://www.dfki.de/~rengel/papers/interspeech2005.pdf

Scott Miller, Robert Bobrow, Robert Ingria, and Richard Schwartz (1996) "A Fully Statistical Approach to Natural Language Interfaces" In: Proceedings of the 34th Annual Meeting of the Association for Computational Linguistics, pages 55-61.
http://acl.ldc.upenn.edu/P/P96/P96-1008.pdf

Zusatzmaterial:
Ralf Engel (2006) "SPIN - Speech Interpretation", Report für T-Systems, S. 54-88. (Kopien)

S. Miller, R. Bobrow, R. Ingria, and R. Schwartz, (1994) "Hidden Understanding Models of Natural Language," in Proceedings of the Association of Computational Linguistics, pp. 25-32.
http://acl.ldc.upenn.edu/P/P94/P94-1004.pdf

 
 

Anmeldung

Anmeldung bitte per Mail an: kipp(at)dfki.de

Bitte schickt folgende Informationen mit:

  • Name
  • Matrikelnummer
  • Anzahl der Semester (vom jetzigen Semester aus gesehen)
  • Hauptstudienfach (Informatik, Mathematik, Computerlinguistik)

Ihr könnt auch gern einfach bei mir im Büro vorbeischauen:
Michael Kipp
Zimmer +2.08
DFKI (Neubau, Eingang zur Mensa-Seite benutzen und dann ins oberste Stockwerk).

 
 

Kontakt

Dr. Michael Kipp
DFKI (Gebäude D3.2), Raum +2.08
Tel: (0681) 302-5387
E-Mail: kipp(at)dfki.de
Homepage