| |
Seminar im Bereich Künstliche Intelligenz am Fachbereich
"Intelligente Benutzerschnittstellen" des Deutschen Forschungszentrums für
Künstliche Intelligenz (DFKI).
Inhalte
Intelligente, körperhafte (embodied) Agenten als Schnittstelle zum
Benutzer sind bereits ein etabliertes Forschungsthema. Im
Mainstream finden solche Agenten immer häufiger Verwendung, ob als
non-player character im Computerspiel, als digitaler Spielkamerad
Tamagochi, als sprechende Büroklammer in Word, als Chatterbot à la
ELIZA oder als virtueller Nachrichtensprecher. Solchen künstlichen
Wesen Leben einzuhauchen, insbesondere Körper und Sprache zu
"animieren", erfordert eine Vielzahl von Methoden aus Künstlicher
Intelligenz, Computerlinguistik und Computergrafik - und einige
Erkenntnisse aus der Psychologie.
In dem Seminar werden wir uns zunächst einen Überblick über
existierende Systeme verschaffen und dann auf die einzelnen
Spezialbereiche fokussieren. Schwerpunkt wird die Steuerung, also
die "Intelligenz" der Charaktere, sein. Wir werden visionäre Themen
wie künstliche Emotionen genauso behandeln wie etabliertere
Forschungsfelder wie Sprachverstehen und -generierung.
Bei erfolgreicher Teilnahme am Seminar besteht Aussicht auf eine
studientechnische Vertiefung des Themas in Form von FoPras und
Diplomarbeiten, unter Umständen auch in Verbindung mit einem
HiWi-Job.
|
|
| |
Termine / Vorträge
Die folgenden Themen sind bereits vergeben und werden in der
unten stehenden Reihenfolge vorgetragen (die Reihenfolge folgt
ungefähr der Verarbeitungsreihenfolge: Input - Verarbeitung -
Output). Die genauen Termine werden beim ersten Treffen festgelegt.
| Datum | Vortragende/r |
Responder |
Thema/Literatur |
| 26.4.2006 |
Kick-Off Meeting |
|
Themen:
- Seminarablauf
- Voraussetzungen zum Scheinerwerb
- Tipps und Tricks zum
mündlichen Vortragen und zur schriftlichen Ausarbeitung
|
| 3. Mai |
Mehdi Moniri
Vortragsfolien
Report (English)
|
Nima Ehsan |
Thema: Steve - ein planbasierter pädagogischer virtueller Character (auch: REA und WIP)
Literatur:
W. Lewis Johnson and Jeff W. Rickel (2000) "Animated Pedagogical
Agents: Face-to-Face Interaction in Interactive Learning
Environments". In: International Journal of Artificial
Intelligence in Education 11, pp. 47-78,
http://aied.inf.ed.ac.uk/members00/archive/vol_11/johnson/paper.pdf
Jeff W. Rickel and W. Lewis Johnson and (1999) "Animated Agents
for Procedural Training in Virtual Reality: Perception, Cognition,
and Motor Control". In: Applied Artificial Intelligence 13,
pp. 343-382,
http://www.isi.edu/isd/VET/aaij98.pdf
|
| 10. Mai |
Sebastian Germesin
Vortragsfolien
Report (Deutsch)
|
Johannes Nima |
Thema: Spracherkennung
Literatur:
Sebastian Germesin (2006) "Spracherkennung mit dynamisch
geladenen, spezifischen Akustikmodellen" SEMINAR: S.1-14
germesin-bachelor.pdf
L. R. Rabiner (1989) "A Tutorial on Hidden Markov Models and
Selected Applications in Speech Recognition," Proceedings of the
IEEE, vol 77, no 2, 257-287. SEMINAR: S. 257-267
http://www-stat.wharton.upenn.edu/~steele/Courses/956/ResourceDetails/HiddenMarkovModels/HMMTutorial/rabiner89.pdf
Jurafsky, Daniel und James H. Martin (2000) "Speech and Language
Processing: An Introduction to Natural Language Processing,
Computational Linguistics, and Speech Recognition", Prentice Hall,
New Jersey.
SEMINAR: Kapitel 4 "N-Grams" (Kopien)
|
| 17. Mai |
Sandro Castronovo
Vortragsfolien
Report (Deutsch)
|
Oliver Johannes |
Thema: Computer Vision
Literatur:
Darrell, T., Basu, S., Wren, C., and Pentland, A. (1997) Perceptually-driven Avatars and Interfaces: active methods for direct control. Technical report, MIT Media Lab Perceptual Computation Section. TR 416.
http://alumni.media.mit.edu/~sbasu/papers/TR-416.pdf
R. Tan and J. Davis (2004) "Differential Video Coding of Face and
Gesture Events in Presentation Videos" Computer Vision and Image
Understanding, Vol. 96, No. 2 pp. 200-215. http://www.cse.ohio-state.edu/~jwdavis/Publications/cviu04.pdf
Zusatzinfos:
|
22. Mai MONTAG!!! 16 Uhr c.t. Raum LEIBNIZ (DFKI) |
Haichao Guan
Vortragsfolien
Report (Deutsch)
|
Christine Sinan |
Thema: Multimodale Fusion
Literatur:
Bolt, R.A. (1980) "put-that-there": Voice and gesture at the graphics
interface. In: SIGGRAPH '80: Proceedings of the 7th annual
conference on Computer graphics and interactive techniques, ACM
Press, pp.262-270
http://www.media.mit.edu/speech/papers/1980/bolt_SIGGRAPH80_put-that-there.pdf
Johnston, M. and S. Bangalore. (2000) Finite-state Multimodal
Parsing and Understanding. In Proceedings of COLING-2000.
http://www.me.cmu.edu/faculty1/stahovich/sketchsymposium2002/colingmmfst.pdf
J. Chai, S. Pan, and M. Zhou, MIND: A Context-based Multimodal
Interpretation Framework in Conversational Systems, Natural,
Intelligent and Effective Interaction in Multimodal Dialogue
Systems, Eds. O. Bernsen , L. Dybkjaer and J. van Kuppevelt,
Kluwer Academic Publishers, 2005.
http://www.cse.msu.edu/~jchai/Papers/MIND.pdf
Zusatzmaterial:
Johnston, M. and
S. Bangalore. 2005. "Finite-state Multimodal Integration and
Understanding". Journal of Natural Language Engineering 11.2,
pp. 159-187, Cambridge University Press.
http://public.research.att.com/~johnston/papers/johnstonbangalore2005jnle.pdf
Homepage Michael Johnston
Homepage Joyce Y. Chai
|
| Termin verschoben wg. Krankheit auf 6. Juni |
Ehsan Gholamsaghaee
Vortragsfolien
Report (Deutsch)
|
Sinan Haichao |
Thema: SOAR - eine kognitive Architektur zur planbasierten
Character-Steuerung
Software:
SOAR 8.6.1 kann man hier runterladen: http://sitemaker.umich.edu/soar/soar_software_downloads
(enthalten sind das SOAR Manual und das komplette Tutorial)
Literatur:
John Rieman (1995) "An Introduction to SOAR Programming"
http://csis.pace.edu/robotlab/software/intro-soar.pdf
John E. Laird (2005) "The Soar 8 Tutorial", Part 1 (die aktuellste Version ist im Softwarepaket enthalten, s.o.)
John E. Laird (2000) "It Knows What You're Going to Do: Adding
Anticipation to a Quakebot" In: AAAI 2000 Spring Symposium Series:
Artificial Intelligence and Interactive Entertainment, AAAI
Technical Report SS-00-02.
http://ai.eecs.umich.edu/people/laird/papers/Agents01.pdf
|
| 7. Juni |
Nima Zeini
Vortragsfolien
Report (Deutsch)
|
Martin Mehdi |
Thema: Sprachverarbeitung und Verhaltenssteuerung im
Facade-System
Das Facade-Spiel kann man hier kostenlos runterladen:
http://www.interactivestory.net/
Literatur:
Mateas, M. and Stern, A. (2003) Facade: An Experiment in Building
a Fully-Realized Interactive Drama 2003. In: Game Developer's
Conference: Game Design Track, San Jose, California. http://www.lcc.gatech.edu/~mateas/publications/MateasSternGDC03.pdf
Mateas, M. and Stern, A. (2004) Natural Language Processing In
Facade: Surface-text Processing 2004. In: Technologies for
Interactive Digital Storytelling and Entertainment (TIDSE),
Darmstadt, Germany.
http://www.lcc.gatech.edu/~mateas/publications/MateasSternTIDSE04.pdf
Michael Mateas and Andrew Stern (2002) Architecture, Authorial
Idioms and Early Observations of the Interactive Drama Façade.
Carnegie Mellon University Computer Science Technical Report.
http://reports-archive.adm.cs.cmu.edu/anon/2002/CMU-CS-02-198.pdf
Zusatzmaterial: Michael Mateas and Andrew Stern (2004)
A Behavior Language: Joint Action and Behavioral Idioms. In:
Life-like Characters. Tools, Affective Functions and Applications,
eds. H. Prendinger and M. Ishizuka, Springer, 2004. Download:
[pdf]
|
| 14. Juni |
Quan Nguyen
Vortragsfolien
Report (Deutsch)
|
Ehsan Haichao |
Thema: KI und Games
Literatur:
Alexander Nareyek (2004) Artificial Intelligence in Computer
Games - State of the Art and Future Directions. ACM Queue 1(10),
58-65. http://www.ai-center.com/publications/nareyek-acmqueue04.pdf
Aus dem Buch
S. Rabin (ed.) (2002) AI Game Programming Wisdom, Charles River Media.
Die folgenden Abschnitte (alles Kopien):
- Section 2.5: Designing a GUI Tool to Aid in the Development of Finite-State Machines
- Section 11.2: Varieties of Learning
- Section 11.5: Using N-Gram Statistical Models to Predict Player Behavior
|
| 21. Juni |
Christine Walter
Vortragsfolien
Report (English)
|
Sebastian Quan |
Thema: Künstliche Emotionen
Literatur:
Guerrero, L., Andersen, P.A., and Trost, M.R. (1998) Communication
and Emotion: Basic Concepts and Approches. In: P. Andersen and
L. Guerrero (eds.) "Handbook of Communication and Emotion:
Research, Theory, Application, and Contexts", San Diego, London:
Adademic Press, pp. 49-96. (Kopien)
Picard, R.W. (1997) "Affective Computing", Chapter 3: Applications
of Affective Computing, London: MIT Press, pp. 85-111. (Kopien)
Ortony, A., Clore, G.L., Collins, A. (1988) "The Cognitive
Structure of Emotions", Chapter 2: The Structure of the Theory,
Cambridge: Cambridge University Press, pp. 15-33. (Kopien)
|
| 28. Juni |
Martin Kaiser
Vortragsfolien (HTML)
Vortragsfolien (ZIP)
Report (Deutsch)
|
Sebastian Mehdi |
Thema: Tangible Interfaces und virtuelle Charaktere
Literatur:
Ishii, Ullmer (1997) "Tangible Bits: Towards Seamless Interfaces
between People, Bits and Atoms"
http://tangible.media.mit.edu/content/papers/pdf/Tangible_Bits_CHI97.pdf
Ullmer, Ishii, Jacob (2005) "Token+Constraint Systems for Tangible
Interaction with Digital Information"
http://tangible.media.mit.edu/content/papers/pdf/TokenConstraint_TOCHI05.pdf
Ndiaye et al. (2005) "Ambient Intelligence in Edutainment:
Tangible Interaction with Life-Like Exhibit Guides"
http://www.dfki.de/~wahlster/Publications/INTETAIN_05.pdf
RFID-Tags (eigene Recherche)
|
| 5. Juli |
Oliver Gärtner
Vortragsfolien
Report (Deutsch)
|
Quan Sandro |
Thema: Gestengenerierung (BEAT System, regelbasiert,
empirisch)
Literatur:
Cassell, J., Vilhjálmsson, H., Bickmore, T.(2001) "BEAT: the
Behavior Expression Animation Toolkit." Proceedings of SIGGRAPH
'01, pp. 477-486. August 12-17, Los Angeles, CA. http://www.media.mit.edu/gnl/pubs//siggraph2001.final.PDF
M. Neff, M. Kipp, I. Abrecht (2006), "Gesture Modeling and
Animation by Imitation", Technical Report, MPI Informatik,
Saarbrücken.
(Kopien)
M. Kipp, M. Neff and I. Albrecht (2006) "An Annotation Scheme for
Conversational Gestures : How to economically capture timing and
form" In: Proceedings of the Workshop on "Multimodal Corpora" at
LREC 2006, to appear.
http://www.dfki.de/~kipp/public_archive/kipp-neff-albrecht-LREC2006WS.doc
Zusatzmaterial:
M. Kipp (2001) "Anvil - A Generic Annotation Tool for Multimodal
Dialogue" In: Proceedings of the 7th European Conference on Speech Communication and Technology (Eurospeech),
pp. 1367-1370, Aalborg, September 2001. Download: pdf
|
| 12. Juli |
Johannes Tran
Vortragsfolien
Report (Deutsch)
|
Oliver Sandro |
Thema: Character Animation
Literatur:
Parent, Rick (2002) Computer Animation - Algorithms and
Techniques. Morgan Kaufmann. Section 4.2 "Hierarchical Kinematic
Modeling", pp. 175-185.
(Kopien)
Lander, Jeff (1998) Oh My God, I Inverted Kine! (Inverse
Kinematics) In: Game Developer, Sep 1998. http://www.darwin3d.com/gamedev/articles/col0998.pdf
Lander, Jeff (1998) Better 3D (Quaternions). In: Game Developer,
March 1998.
http://www.darwin3d.com/gamedev/articles/col0398.pdf
Lander, Jeff (1998) Slashing Through Real-Time Character Animation
(Quaternion Interpolation). In: Game Developer, April 1998. http://www.darwin3d.com/gamedev/articles/col0498.pdf
Lasseter, John (1987) "Principles of Traditional Animation Applied
to 3D Computer Animation". In: Proc. of SIGGRAPH 87. http://portal.acm.org/citation.cfm?id=37401.37407
Weitere Artikel von Jeff Lander:
http://www.darwin3d.com/gamedev.htm
|
| 19. Juli |
Abschlusstreffen |
|
- Zusammenfassender Überblick
- Ergebnisse der Evaluation EVA
- Feedback der Student/innen
|
| ENTFÄLLT |
|
|
Thema: Multimodale Generierung / Fission
Literatur:
Elisabeth André (2000) "The Generation of Multimedia Presentations", A
Handbook of Natural Language Processing: techniques and
applications for the processing of language as text , R. Dale,
H. Moisl, and H. Somers, 305-327, Marcel Dekker Inc.
Download:
[pdf]
Elisabeth André, Thomas Rist (1995) Generating Coherent Presentations Employing Textual and Visual Material. In: Artificial Intelligence Review 9: 147-165.
Download: [pdf]
Elisabeth André, Thomas Rist (1996) Coping with Temporal
Constraints in Multimedia Presentation Planning. In: Proceedings
of the Thirteenth National Conference on Artificial Intelligence,
pages 142-147.
Download: [pdf]
David Reitter (2004) Hybrid Planning and Realization of Coherent
Utterances for Multimodal Natural Language Dialogue Systems. Master's Thesis,
University College Dublin.
Für das Seminar: Kapitel 3-5
Download: [pdf]
|
| ENTFÄLLT |
|
|
Thema: Sprachverstehen (SPIN)
Literatur:
Ralf Engel (2005) "Robust and Efficient Semantic Parsing of Free
Word Order Languages in Spoken Dialogue Systems" In: Proceedings of
Interspeech 2005, Lisbon, Portugal.
http://www.dfki.de/~rengel/papers/interspeech2005.pdf
Scott Miller, Robert Bobrow, Robert Ingria, and Richard Schwartz (1996)
"A Fully Statistical Approach to Natural Language Interfaces" In:
Proceedings of the 34th Annual Meeting of the Association for
Computational Linguistics, pages 55-61.
http://acl.ldc.upenn.edu/P/P96/P96-1008.pdf
Zusatzmaterial:
Ralf Engel (2006) "SPIN - Speech Interpretation", Report für
T-Systems, S. 54-88. (Kopien)
S. Miller, R. Bobrow, R. Ingria, and R. Schwartz, (1994) "Hidden
Understanding Models of Natural Language," in Proceedings of the
Association of Computational Linguistics, pp. 25-32.
http://acl.ldc.upenn.edu/P/P94/P94-1004.pdf
|
|
|